MISC

2005年7月15日

生成文書モデルを用いた文書読み上げ音声認識(認識, 信頼度)

情報処理学会研究報告. SLP, 音声言語情報処理
  • 中里理恵
  • ,
  • 貞光九月
  • ,
  • 冨山良介
  • ,
  • 山本幹雄
  • ,
  • 板橋秀一

2005
69
開始ページ
19
終了ページ
24
記述言語
日本語
掲載種別
出版者・発行元
社団法人情報処理学会

生成文書モデルは文書全体に対して文書らしさの確率を付与できる。我々は生成文書モデルによる確率を用いて、文書全体を読み上げた音声を全体で最適化し、認識するシステムを検討する。局所的言語モデルとの融合方法としてはunigram rescaling法と文書尤度法の2種類を提案する。生成文書モデルとしてDM(Dirichlet Mixtures)モデルとLDA(Latent Dirichlet Allocation)モデルを用い、文書全体を読み上げた音声データに対する認識実験を行った。実験結果から、生成文書モデルによる精度の改善効果、パープレキシティと精度の関連、キャッシュモデルを加えた場合の効果について検討した。また、具体的な認識結果例文を用いて本手法の特徴を分析した。

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110002952507
CiNii Books
http://ci.nii.ac.jp/ncid/AN10442647
ID情報
  • ISSN : 0919-6072
  • CiNii Articles ID : 110002952507
  • CiNii Books ID : AN10442647

エクスポート
BibTeX RIS