共同研究・競争的資金等の研究課題

2006年 - 2008年

音声知覚特性の解析に対する音声認識技術の適用

日本学術振興会  科学研究費助成事業 萌芽研究  萌芽研究

課題番号
18652040
体系的課題番号
JP18652040
配分額
(総額)
3,300,000円
(直接経費)
3,300,000円

劣化させた音声を聞き取る時の知覚特性と、音声認識器での認識結果を対比させることにより、人間の音声言語知覚の特性を数理的に定量化することを目的としている。
本年度は、H19年度に収集した人間の知覚特性データと対比するために、同一の単語音声データ(FW03)を用いて、音声認識実験をH18年度に行ったものより改善して実施した。まず認識系を最も標準的なHTK(http://htk.eng.cam.ac.uk/)とした。また、人間の知覚実験に用いた1話者分だけでなく、FW03中の他の話者に関しても、音韻ラベルを自動的に付け、学習データを1話者から4話者までとした場合のそれぞれの認識結果も出すことができるようにした。得られた結論として、音声認識器でも、劣化の度合いや単語親密度に関わらず、第1・第3モーラ目の認識率が、第2・第4モーラ目の認識率よりも低いという、人間と同じ傾向のデータが得られた。劣化度合いが大きい場合、人間も認識器と同様に音節遷移情報にかなり依存していた。これに対し、劣化度合が小さい場合には、人間の認識率は認識器の認識率より優れていることがわかった。また、異聴表を対比させて両者を比較した。認識器の場合は、劣化度合の変化に関わらず異聴傾向はそれほど変化せず、人間のばらつきのある結果と対照的であった。今後さらに、認識用の特徴ベクトルの選択や、人間の高次認知的な振舞いに関して検討の余地がある。
従来、音声明瞭度試験は単音節で行われてきたが、日常会話音声の知覚特性は必ずしも明確ではなかった。今回使用した親密度統制単語音声リストFW03(FW07)は、そのために開発され、活用が期待されている。しかし、その単語音声自体が持つ統計的/定量的な特性把握はまだ行われていなかった。本研究はその第一歩で、今後の音声知覚研究の基盤となるものと考える。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-18652040
ID情報
  • 課題番号 : 18652040
  • 体系的課題番号 : JP18652040