共同研究・競争的資金等の研究課題

1997年 - 1998年

関連する複数のテキストを対象とした要約生成技術に関する研究

文部科学省  科学研究費補助金(基盤研究(B))  

資金種別
競争的資金

従来の情報検索システムでは,検索対象となる文書と検索要求とを重み付きのキ-ワ-ドベクトルで表現し,余弦を求めることで関連性を判定するベクトル空間モデルを用いることが多い.通常,ベクトルの各要素の重みの計算には出現回数を基にした統計量を用いるが,このような表層的な情報のみを利用した手法では,関連性が低い文書も検索してしまうという問題が生ずる.今年度は,従来の手法によって検索された文書集合を対象とし,その中から自然言語処理技術を用いて不適切な文書を排除する手法について研究をおこなった.具体的には,文書中の動詞,格要素(名詞,助詞)からなる格フレ-ムに注目し,格フレ-ムと検索要求との関連性を求めることによって文書と検索要求との関連性を判定する.格フレ-ムを利用することで,文書の構造的な情報を扱うことが可能となり,キ-ワ-ドのみの集合に比べて精密に文書の内容を把握することが可能となる.初期検索によって検索された文書集合から,格フレ-ムと検索要求との関連性の計算する.関連性の判定には,格フレ-ムがどの程度検索要求に対して特徴的であるかを示す重要度という尺度を用いる.格フレ-ムに対して直接重要度をめることは難しいため,動詞,格要素それぞれに重要度を求め,それらを用いて格フレ-ム重要度を求める.また類似,包含関係にある格フレ-ム間では,類似性に応じて相互に重要度を修正することにより,特徴的...

リンク情報
URL
https://kaken.nii.ac.jp/p/09480062