論文

2002年1月15日

クラスに基づく可変長記憶マルコフモデル

情報処理学会論文誌
  • 森 信介

43
1
開始ページ
34
終了ページ
43
記述言語
日本語
掲載種別
出版者・発行元
一般社団法人情報処理学会

本論文では,クラスに基づく可変長記憶マルコフモデルとその学習アルゴリズムについて述べる.このモデルは,可変長記憶マルコフモデルの拡張であり,クラスに基づく確率的接尾辞木に基づいている.木の各ノードは,自動クラスタリングによって得られた単語クラスを持っている.実験では,我々が提案するクラスに基づく可変長記憶マルコフモデルと,単語2-gramモデル,クラス2-gramモデル,単語3-gramモデル,可変長記憶マルコフモデルとを比較した.また,これらのモデルに基づく英語の品詞タガーと日本語の形態素解析器の精度を比較した.実験の結果,クラス2-gramモデルとのモデル記述の記憶領域の比較を除いて,クラスに基づく可変長記憶マルコフモデルが,クロスエントロピーとモデル記述の記憶領域と解析精度において,他のモデルよりも優れていた.In this paper,we present a class-based variable memory length Markov model and its learning algorithm.This is an extension of variable memory length Markov model.Our model is based on class-based probabilistic suffix tree,whose nodes have an automatically acquired word-class relation.We experimentally compared our new model with word-based bi-gram model,word-based tri-gram model,class-based bi-gram model and word-based variable memory length Markov model.We also built part-of-speech taggers based on these models and compared their accuracies.The results show that a class-based variable memory length Markov model is better in cross entropy,tagging accuracy and model size than the other models mentioned above except for the comparison with the class-based bi-gram model in size.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110002726220
CiNii Books
http://ci.nii.ac.jp/ncid/AN00116647
URL
http://id.ndl.go.jp/bib/6040943
URL
http://id.nii.ac.jp/1001/00011757/
ID情報
  • ISSN : 1882-7764
  • CiNii Articles ID : 110002726220
  • CiNii Books ID : AN00116647

エクスポート
BibTeX RIS