MISC

2000年11月21日

形態素係り受けモデルによる構文解析

情報処理学会研究報告. 自然言語処理研究会報告
  • 森 信介
  • ,
  • 西村 雅史
  • ,
  • 伊東 伸泰
  • ,
  • 荻野 紫穂
  • ,
  • 渡辺 日出雄

2000
107
開始ページ
143
終了ページ
150
記述言語
日本語
掲載種別
出版者・発行元
一般社団法人情報処理学会

本論文では、形態素単位の係り受けに基づく言語モデルを提案する。このモデルは、文を係り受け関係にある形態素の列とみなし、各形態素を文頭から順に予測する。ある時点での履歴は部分的な構文解析の結果である。これは、形態素をノードとする木の列であり、提案モデルでは、まず、履歴である木の列のうち次の形態素に係る木の数を予測し、続いて係る木の列から次の形態素を予測する。このモデルを用いた構文解析器を作成し、約1 000文の解析済みコーパスがらパラメータを推定し、約100文に対して構文解析実験を行なった結果、係り受け単位で89.9%の解析精度を得た。In this paper, we present a stochastic language model using dependency. This model considers a sentence as a word sequence and predicts each word from left to right. The history at each step of prediction is a sequence of partial parse trees covering the preceding words. First our model predicts the partial parse trees which have a dependency relation with the next word and then predicts the next word from those trees. We prepared about 1,000 syntactically annotated sentences and estimated the parameters of our model. We built a parser based on our model and tested it on about 100 sentences. The accuracy of the dependency relation was 89.9%.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110002935259
CiNii Books
http://ci.nii.ac.jp/ncid/AN10115061
URL
http://id.ndl.go.jp/bib/5742359
URL
http://id.nii.ac.jp/1001/00048602/
ID情報
  • ISSN : 0919-6072
  • CiNii Articles ID : 110002935259
  • CiNii Books ID : AN10115061

エクスポート
BibTeX RIS