類似チェックについて
業績の類似チェックとは・・・
 
researchmapでは業績の重複登録を避けるため、新しく業績を登録または追加する際にその業績が既にresearchmapに登録されていないかチェックを行っています。
類似チェックはすべての業績で行います。
画面からの入力、外部システムからのフィードに加え、インポートやAPIによる入力時にも類似チェックを行います。また、類似チェックは業績の画面表示言語(日、英)にかかわらず行います。
 
1.類似データがあった場合の動作

画面からの入力時、外部システムからのフィード時、インポート・APIによる入力時それぞれで、類似データが見つかった際の動作が異なります。

◆画面からの入力時
 業績入力後に類似チェックが行われます。類似データが見つかった場合には、以下のいずれかの方法を選択して登録します。
  • 入力データを主にマージ:入力データを優先して既登録データを更新
  • 類似データを主にマージ:類似データを優先して既登録データを更新
  • 入力データを強制追加:類似データを無視して強制的に別業績として登録
◆外部システムからのフィード時
 業績取り込み時に類似チェックが行われます。類似データが見つかった場合には、1件ずつ以下のいずれかの方法を選択して取り込みます。
  • 登録しない
  • 取り込みデータを主にマージ:入力データを優先して既登録データを更新
  • 類似データを主にマージ:類似データを優先して既登録データを更新
  • 取り込みデータを強制追加:類似データを無視して強制的に別業績として登録
◆インポート・APIによる入力時
 業績入力時に以下のいずれかの方法を指定して登録します。
 ※指定方法、より詳細な動作についてはAPI設計書を参照してください。
  • 登録(追加・更新):類似データがあった場合にはエラーとし、なければ新規登録。業績IDを指定した場合、入力データを優先して更新
  • 登録(入力データ優先):類似データがあった場合、入力データを優先して既登録データを更新。なければ新規登録
  • 登録(類似データ優先):類似データがあった場合、類似データを優先して既登録データを更新。なければ新規登録
  • 強制追加:類似データを無視して強制的に別業績として登録。ただし、類似データが本人相当によって更新されている場合は追加することはできない。
  • 更新:業績IDが一致するデータがあれば入力データを優先して更新、なければエラー。

 

2.類似チェック内容
 
 入力データと既登録データとを比較して、下表の条件に沿って類似かどうかを判定します。
 特に指定がない限り、「類似条件」に記載の項目が全て一致する場合に類似と判定されます。入力データと既登録データのいずれか一方または両方が空の項目はチェック対象としません。
 業績種別に★のある業績は、個別に記載の通りに判定されます。
 文字列の項目は、類似チェックの判定前に共通変換処理が行われます。
 類似チェックの結果、類似データがなければそのまま登録されますが、類似データがある場合は 1.類似データがあった場合の動作 の通りの動作になります。

 

業績種別 類似条件
研究キーワード 研究キーワード(日本語)(英語)  ※共通変換処理
研究分野 大分類
小分類
キーワード(日本語)(英語)  ※共通変換処理
経歴 年月(From)
所属名(日本語)(英語)  ※共通変換処理   ※機関名の類似チェック
部署名(日本語)(英語)  ※共通変換処理   ※機関名の類似チェック
職名(日本語)(英語)  ※共通変換処理
称号(日本語)(英語)  ※共通変換処理
学歴 年月(From)
学校名(日本語)(英語)  ※共通変換処理   ※機関名の類似チェック
学部・研究科等(日本語)(英語)  ※共通変換処理   ※機関名の類似チェック
学科等(日本語)(英語)  ※共通変換処理   ※機関名の類似チェック
委員歴 年月(From)
団体名(日本語)(英語)  ※共通変換処理
委員名(日本語)(英語)  ※共通変換処理
受賞 賞名(日本語)(英語)  ※共通変換処理
授与機関(日本語)(英語)  ※共通変換処理
受賞年月
受賞者・グループ(日本語)(英語)  ※共通変換処理
論文(★) 論文、MISCのDOI等id関連、タイトル、出版年月、それ以外に研究者の統計情報を利用しAIにより判断する
MISC(★) 論文、MISCのDOI等id関連、タイトル、出版年月、それ以外に研究者の統計情報を利用しAIにより判断する
書籍等出版物(★) 以下のいずれか一致する(ただし、1つでも一致しない場合は類似とみなさない)
  • DOI
  • ISBN
  • ASINコード
  • EANコード
  • Cinii Books ID
もしくは、
書籍等出版物タイトル(日本語)(英語)  ※共通変換処理
講演・口頭発表等 講演・口頭発表等タイトル
発表年月日 ※発表年月日がなければ開催年月日(From)でチェック
担当経験のある科目
(授業)
科目(日本語)(英語)  ※共通変換処理
機関名(日本語)(英語)  ※共通変換処理   ※機関名の類似チェック
年月(From)
所属学協会 所属学協会名(日本語)(英語)  ※共通変換処理
年月(From)
Works(作品等) 作品名(日本語)(英語)  ※共通変換処理
発表年月(From)
共同研究・競争的資金等の研究課題(★) 課題番号等のid関連、タイトル、研究期間(From)、研究期間(To)、それ以外に研究者の統計情報を利用しAIにより判断する
産業財産権(★) 以下のすべてが一致する(入力データと既登録データのいずれか一方が空の場合は類似とみなさない)
  • 出願番号
  • 公開番号
  • 公表番号
  • 特許番号/登録番号
社会貢献活動 社会貢献活動タイトル(日本語)(英語)  ※共通変換処理
イベント・番組・新聞雑誌名(日本語)(英語)  ※共通変換処理
年月日(From)
メディア報道 メディア報道タイトル(日本語)(英語)  ※共通変換処理
番組・新聞雑誌名(日本語)(英語)  ※共通変換処理
報道年月(From)
学術貢献活動 学術貢献活動タイトル(日本語)(英語)  ※共通変換処理
実施年月日(From)
その他 その他タイトル(日本語)(英語)  ※共通変換処理
年月(From)
内容(日本語)(英語)  ※共通変換処理

 

※共通変換処理
入力データと既登録データを共に変換し、類似チェックを行います。
変換処理内容は以下の通りです。
  • 全角ひらがな、半角カナを、全角カナに変換します。
  • 全角英数字記号を半角英数字記号に変換します。
  • 「ⅠⅰⅡⅱⅢⅲⅣⅳⅤⅴⅥⅵⅦⅶⅧⅷⅨⅸⅩⅹⅪⅺⅫⅻ①②③④⑤⑥⑦⑧⑨⑩⑪…㊽㊾㊿」を半角数字に変換します。
  • 全角スペースを半角スペースに変換します。
  • 複数の連続した半角スペースを1つのスペースに変換します。
  • 前後の半角スペースを取り除きます。
  • 「ッ」、「ュ」、「ィ」を除去します。
  • 以下の記号を残して、それ以外の記号を除去します。
    ‰§¨°¶¬±∀∃∂∇∈∋∑√∝∞∠∧∨∩∪∫∴≠≡⊂⊃⊆⊇
    ⊥ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδ
    εζηθικλμνξοπρστυφχψω

 

※機関名の類似チェック
以下の項目は、文字列の比較だけでなく、researchmapが持つ機関の略称や旧名称の情報も利用し、類似チェックを行います。
  • 「経歴」の「所属名」「部署名」
  • 「学歴」「学校名」「学部・研究科等」「学科等」
  • 「担当経験のある科目(授業)」の「機関名」