MISC

2004年7月14日

検索結果を統合するための関数選択手法

情報処理学会研究報告データベースシステム(DBS)
  • 鈴木 優
  • ,
  • 波多野 賢治
  • ,
  • 吉川 正俊
  • ,
  • 植村 俊亮
  • ,
  • 川越 恭二

2004
72
開始ページ
529
終了ページ
536
記述言語
日本語
掲載種別
出版者・発行元
一般社団法人情報処理学会

現在,多くの検索システムを組み合わせることによって,検索システムの精度を向上させる方法が注目されている.このような検索システムでは,統合関数と呼ばれる,複数のスコアを統合するための関数を変更することによって,精度が向上することが知られている.ところが,最適な統合関数は利用者の問合せによって異なると考えられるため,あらかじめ一意に統合関数を定めることができない.ここで我々は,統合後のスコアの分布から,最適な統合関数を推定することができるのではないかと考えた.そこで本稿では,最適な統合関数を問合せごとに推定する方法として,シャノンの情報量の概念を援用した尺度を用いて,スコアの分布から統合関数の適合度を測定する方法の提案を行う.本提案では,利用者にとって必要な検索対象の数が検索対象全体の数と比較してきわめて少なく,検索結果に含まれる高いスコアの数が少ないとき,その検索結果は十分に正解集合を絞り込んでいると考えることができるため,利用者の検索目的に適した統合関数であると仮定した.評価実験を行うことによって,実際に適した統合関数を選択することができることを示した.Currently, many information retrieval systems that combine multiple retrieval results have been proposed to improve the accuracy of these infomration retrieval systems. In these systems, selections of the combi-nation functions, the functions for combining multiple relevance scores, are important to improve the accu-racies. We seem that the most suitable combination function should change by the users' queries. In this paper, we propose an automatic selection method of combination functions. In our method, we automatically select using the distributions of relevance scores. When a retrieval system calculates a small number of high relevance scores, the system can identify relevant retrieval targets. Therefore, we suppose that the sureness of the combination functions should depends on the number of high relevance scores. Then, we propose a calculating method of the sureness of combination function using Shannon's information measure. From our experimental results, we find out that our proposed method can select better combination functions.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110002911370
CiNii Books
http://ci.nii.ac.jp/ncid/AN10112482
URL
http://id.ndl.go.jp/bib/7064745
URL
http://id.nii.ac.jp/1001/00019190/
ID情報
  • ISSN : 0919-6072
  • CiNii Articles ID : 110002911370
  • CiNii Books ID : AN10112482

エクスポート
BibTeX RIS