論文

2008年8月15日

音声とテキストを用いた認識単語辞書の自動構築

情報処理学会論文誌ジャーナル(CD-ROM)
  • 倉田岳人
  • ,
  • 森信介
  • ,
  • 伊東伸泰
  • ,
  • 西村雅史

49
8
開始ページ
2900
終了ページ
2909
記述言語
日本語
掲載種別
出版者・発行元
情報処理学会

大語彙連続音声認識(LVCSR)システムを新しい分野に導入する場合,その分野特有の単語を認識単語辞書に追加しなければならないが,計算量や認識単語辞書のメンテナンスを考慮すると,必要な分野特有の単語とその正しい読みのみを選択的に追加することが望ましい.しかし,日本語は,単語間に空白が置かれず,読みにもあいまい性があるため,対象分野のテキストデータのみから分野特有の単語とその読みを正しく自動的に獲得することは困難である.本論文では,対象分野のテキストデータに加えて,音声データも利用することで,対象分野特有の単語とその読みを含む小さいサイズの認識単語辞書を自動構築する方法を提案する.提案手法では,最初にテキストデータから再現率を重視した方法で大きいサイズの認識単語辞書を作成した後,その中から,音声データを利用して必要な単語と読みを選択し,小さいサイズの認識単語辞書を構築する.実験により,音声データを利用することで,最初の認識単語辞書のサイズの10%以下の小さい認識単語辞書の追加で,対象分野のLVCSRシステムを構築することができ,それが従来手法と比較して良い認識精度を示すことを確認した.When introducing a Large Vocabulary Continuous Speech Recognition (LVCSR) system to a specific domain, it is preferable to add the necessary domain-specific words and their correct pronunciations selectively to the lexicon. In this paper, we propose an unsupervised method of building a domainspecific lexicon in the Japanese language, where no spaces exist between words. In our method, by taking advantage of the speech of the target domain, we selected the domain-specific words from among an enormous number of word candidates extracted from the raw corpora. The experiments showed that by exploiting the acquired lexicon, whose size was negligible, an LVCSR system for the target domain was constructed efficiently and its performance was superior to the performance achieved by the conventional method, in which new words were acquired based on the results of automatic word segmentation.

リンク情報
J-GLOBAL
https://jglobal.jst.go.jp/detail?JGLOBAL_ID=200902240629584245
CiNii Articles
http://ci.nii.ac.jp/naid/110007970179
CiNii Books
http://ci.nii.ac.jp/ncid/AN00116647
URL
http://id.ndl.go.jp/bib/024266207
URL
http://id.nii.ac.jp/1001/00009481/
ID情報
  • ISSN : 1882-7764
  • J-Global ID : 200902240629584245
  • CiNii Articles ID : 110007970179
  • CiNii Books ID : AN00116647

エクスポート
BibTeX RIS