共同研究・競争的資金等の研究課題

2019年4月 - 2022年3月

高齢者を対象とした音声認識・対話システム基盤技術の構築

日本学術振興会  科学研究費助成事業  基盤研究(A)

課題番号
19H01125
体系的番号
JP19H01125
配分額
(総額)
45,110,000円
(直接経費)
34,700,000円
(間接経費)
10,410,000円

高齢者を対象とした音声対話システムのための音声対話基盤技術の構築を行っている。高齢者の音声認識の高度化のために、高齢者の音声を収録してデータベース化した。それを用いて、DNN-HMMベースの音声認識システム、およびTransformerベースのEnd-to-end音声認識システムの高精度化を図った。高齢者音声は機械学習に耐えるだけの量を収集することは困難である。そこで、一般成人の大量のデータに高齢者音声を複数回繰り返し混ぜたデータを使って学習する方法を試みた結果、いずれのシステムにおいても数回の繰り返しによって大幅に性能が向上することが確認された。対話戦略においては、有限オートマトンによるシナリオ制御とEnd-to-end雑談チャットボットを相互に行き来できる制御方法を開発した。雑談チャットボットは、単純に雑談を行うだけではなく、雑談をしながらある特定の質問に話題を近づけていき、いずれその質問をすると言う、雑談に質問を織り交ぜるための質問誘導モデルを構築し、実際に対話システムに実装した。これにより、例えば長谷川式認知症スケールに用いられるような対話を雑談に織り交ぜて認知テストを暗黙のうちに実施するようなことも可能となった。また、認知テストとは別に、高齢者音声から認知症の傾向をスクリーニングする方法も開発した。高齢者との雑談音声の音響的特徴を用いることで80~90%程度の精度で認知症傾向を検出できることを確認した。その際、地域差(方言)の影響を受けやすいことも見出し、地域差の影響を受けにくい特徴量を選択することで方言に頑健な検出手法も提案した。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-19H01125
ID情報
  • 課題番号 : 19H01125
  • 体系的番号 : JP19H01125

この研究課題の成果一覧

論文

  6

MISC

  6

講演・口頭発表等

  2