講演・口頭発表等

2011年9月14日

孤立単語音声認識を用いた雑音ロバストキーワードスポッティング(知的マルチメディアシステム,一般)

電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム
  • 高橋 亘
  • ,
  • 宮永 喜一

記述言語
日本語
会議種別

本研究では,雑音環境下での連続音声からキーワードスポッティングを行った.提案手法は雑音ロバスト孤立単語音声認識を連続音声に適用することでキーワードを抽出する.この手法ではハードウェアの構成法である超並列処理を用いることで実時間での処理を目指している.本研究ではこの手法を超並列音声認識と呼ぶ.連続音声を複数の区間に分割し,それぞれの区間に単語音声認識を処理することでキーワードの区間を推定することができる.また,キーワードスポッティングを行う際,キーワード以外の音声や非音声を認識結果としては認識精度が下がる.よって,それらの結果を棄却する処理が必要となる.棄却処理には認識処理で得られる尤度を用いて棄却するかを判定する.超並列音声認識を行うことで複数の認識結果が得られるため,これらの情報を総合しすることで棄却処理の信頼性を向上させることができる.超並列音声認識によるキーワードスポッティングを行った結果,雑音環境下でも高い認識率を得ることができた.

リンク情報
URL
http://ci.nii.ac.jp/naid/110008899651