論文

査読有り
2007年6月15日

関係データベースを用いたXML情報検索システムの開発

情報処理学会論文誌. データベース
  • 清水 敏之
  • ,
  • 寺田 憲正
  • ,
  • 吉川 正俊

48
11
開始ページ
224
終了ページ
234
記述言語
日本語
掲載種別
出版者・発行元
一般社団法人情報処理学会

利用者が文書に対して検索を行う際に,検索要求が検索結果文書中のどの部分と関連しているのかが分かることは有用である.たとえば,大量の学術論文の中から,ある話題に関連する章や節などの部分文書のみを拾い読みしたいという要求は高いと考えられる.近年,様々な文書がXMLで構造化されている.XML文書の構造を利用することで部分文書も対象とする検索が可能となる.そのため,XML文書に対する情報検索に関する研究がさかんになってきた.そこで我々はXML文書に対してキーワード集合による検索を行うシステムであるKikori-KSを開発した.キーワード検索は,XML文書のスキーマを知っている必要がなく,XML専用の問合せ言語に対する知識も必要ないため,多くの一般的な利用者が利用可能である.検索結果として入れ子するXML部分文書を単位として用いるため,我々は検索結果提示インタフェースが重要であると考え,今回開発したKikori-KSでは,XML文書検索のための検索結果表示インタフェースを用意した.キーワード検索に必要な情報は関係データベースに格納し,利用者が入力したキーワード集合に対して関連するXML部分文書を取得し,インタフェースを通じて利用者に提示する.我々は大量のXML部分文書を効率的に扱うために,実体化結合ビューを生成して検索の高速化を実現した.広く利用されている関係データベースを用いることで汎用性の高いシステムが構築できる.INEXテストコレクションを利用した実験では,Kikori-KSが実用的な検索速度と比較的高い適合性を持つことを確認した.Identifying meaningful document fragments is a major advantage achieved by encoding documents in XML. In scholarly articles, such document fragments include sections, subsections and paragraphs. XML information retrieval systems need to search document fragments relevant to queries from a set of XML documents. We present Kikori-KS, an effective and efficient XML information retrieval system for XML documents. Kikori-KS accepts a set of keywords as a query. This form of query is simple yet useful because users are not required to understand XML query languages or XML schema. To meet practical demands for searching relevant fragments in XML documents, we have developed a user-friendly interface for displaying search results. Kikori-KS was implemented on top of a relational XML database system developed by our group. By carefully designing the database schema, Kikori-KS handles a huge number of document fragments efficiently. Our experiments using INEX test collection show that Kikori-KS achieved an acceptable search time and with relatively high precision.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110006317697
CiNii Books
http://ci.nii.ac.jp/ncid/AA11464847
URL
http://id.ndl.go.jp/bib/8862355
URL
http://id.nii.ac.jp/1001/00017442/
ID情報
  • ISSN : 1882-7799
  • CiNii Articles ID : 110006317697
  • CiNii Books ID : AA11464847

エクスポート
BibTeX RIS