共同研究・競争的資金等の研究課題

2000年 - 2002年

統計情報と言語的制約情報の融合に関する研究

文部科学省  科学研究費補助金(基盤研究(B))  

資金種別
競争的資金

電子化された言語データの増加に伴い、統計的言話処理が盛んに研究されているが、多くは表面的な言語処理が対象であり、詳細な意味解析など深い言語処理を行うには適切でない。一方で、主辞駆動句構造文法に代表される制約に基づく文法では、個々の単語に詳細な言語情報を記述し、単語固有の文法現象を説明することができるが、制約に合致する文の間の解釈の優先度の違いを説明できないこと、制約に少しでも違反する文の解析を行うことができないなどの欠点がある。 本研究では、これら両者の欠点を補うため、高精度の単語係り受け解析を統計情報に基づく頑健な方法で実現し、得られた統語構造を利用して、制約に基づく文法による詳細な解析を行うことを目的とした。その際、制約違反を緩和するために、生成語彙理論で導入されたタイプ強制や共構成という演算を実装するためのソフトウェアシステムとインタフェースを構築した。 係り受け解析については、サポートベクターマシンという機械学習を用い、上昇型に決定的に解析を行うアルゴリズムを提案し、日本語および英語の解析システムを構築した。制約に基づく文法として、主辞駆動句構造文法に基づく日本語文法を引き続き開発するとともに、タイプ強制と共構成という高次の生成演算を行うメカニズムを実装した。また、統計解析および文法情報を受け取って、文解析を行い、その過程を表示するためのユーザインタフェースを構築した。

リンク情報
URL
https://kaken.nii.ac.jp/p/12480089