講演・口頭発表等

2001年11月20日

PPM法を用いたかな漢字変換の学習モデル

情報処理学会研究報告. 自然言語処理研究会報告
  • 丸山 卓久
  • ,
  • 田中(石井
  • ,
  • 久美子
  • ,
  • 武市 正人

記述言語
日本語
会議種別

かな漢字変換では、ユーザが過去に入力した文章中の情報を学習する。学習手法には、1.前に入力した単語を次回先頭候補にする、2.単語の頻度情報を登録する、3.単語の共起情報を登録する、4.単語のn-gram情報を登録する、のような手法が考えられる。1〜3までの手法を用いた学習モデルは、既に存在するが、4の単語n-gram情報を用いたモデルはあまり例が無いと思われる。そこで、本研究では、単語n-gram情報を用い、圧縮の分野で用いられている学習手法であるPPM(Prediction by Partial Matching)法を用いたかな漢字変換の学習手モデルを提案し、その性能評価を行った。

リンク情報
URL
http://ci.nii.ac.jp/naid/110002935331