共同研究・競争的資金等の研究課題

2019年4月 - 2022年3月

高齢者を対象とした音声認識・対話システム基盤技術の構築

日本学術振興会  科学研究費助成事業 基盤研究(A)  基盤研究(A)

課題番号
19H01125
体系的課題番号
JP19H01125
配分額
(総額)
45,110,000円
(直接経費)
34,700,000円
(間接経費)
10,410,000円

高齢者の音声認識の高精度化を目的として、高齢者音声データの収集を進めた。これまでに200人を超える話者の読み上げ音声を収録しデータベース化した。このデータを用いてDNN-HMM音声認識器を構築し、高齢者に対する音声認識精度の向上を確認した。並行して、高精度な高齢者音声認識を行うために、ガウスフィルタバンク層を入力層に持つDNN-HMM音響モデルに対する話者適応の研究を行った。高齢者音声が多く集まらない場合でも、適応技術により頑健な音声認識が実現できる可能性を示した。さらにEnd-to-end音声認識技術であるCTCに基づく低遅延の認識方法の研究を行った.対話に関しては、これまでに提案した対話事例の適応手法を適用して獲得した事例を用いた音声対話システムを構築し、それに照応解析機能を付与し、対話を高度化した。ロボットを2体用いた3者雑談対話システムを構築し、個性の異なる2体のロボットを用いることで、雑談対話を長時間飽きることなく続けることができるようになることを狙ったものである。認知力診断の一環として、話し言葉コーパスの音声および書き起こしテキストを情報源として,流暢・非流暢の度合いが付与されたクラスを再現する識別タスクにおいて,LSTMおよびSVMにより音響特徴量,フィラー・語断片等の特徴量の有効性を分析した.認知力診断を織り込む対話に向けて、雑談対話に小さな目的志向対話を挟み込むことでより自然な対話になるような対話制御についても検討を行った。一方で、長谷川式認知症スケールを雑談において被験者の負担なく実施する方法について検討を進めた.具体的には,見当識(状況の基本的な認識)を尋ねる質問に着目し,自身,時間,場所に関する質問の自動生成のためのデータ収集および深層学習を用いた生成モデルの構築を行った.

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-19H01125
ID情報
  • 課題番号 : 19H01125
  • 体系的課題番号 : JP19H01125

この研究課題の成果一覧

論文

  5

MISC

  6

講演・口頭発表等

  2