2021年3月10日
フォトリアルCGエージェントとのマルチモーダル対話システムの構築
日本音響学会研究発表会講演論文集
- ,
- ,
- ,
- 記述言語
- 日本語
- 会議種別
将来の人間-機械協奏社会を考えたとき, 機械と人間がいかに自然で容易にコミュニケ ーションできるかが重要な課題となる.機械 側のインタフェースが限りなく人間に近い姿 をし,人間に近い対話をすることは,こうし た課題の解決法の一つの方法であると考える. そこで我々は,本物の人間と区別がつかない レベルの 3D CGで描かれ,映像内でリアルに 動作する「Saya」に注目し,Saya をエージェ ントとして音声・マルチモーダル対話を行え るシステムの構築を行っている. 本稿では,Saya および構築した対話システ ムの全体像を紹介するとともに,そこで用い られている音声認識・音声合成・画像認識・ インタラクション制御技術の概要を説明する.