論文

査読有り
2018年11月16日

Web-based environment for user generation of spoken dialog for virtual assistants

EURASIP Journal on Audio, Speech, and Music Processing
  • Ryota Nishimura
  • ,
  • Daisuke Yamamoto
  • ,
  • Takahiro Uchiya
  • ,
  • Ichi Takumi

Vol.2018
No.1
開始ページ
1
終了ページ
13
記述言語
英語
掲載種別
研究論文(学術雑誌)
DOI
10.1186/s13636-018-0142-8

本論文では,ユーザがビデオ仮想アシスタントを用いて対話を編集することを可能にするウェブベースの音声対話生成環境を開発した.提案システムでは,誰もが対話システムの対話の内容を簡単に投稿/編集できる.音声対話共有サービスおよびFST生成器は,音声認識装置,対話制御装置,音声シンセサイザ,および仮想エージェントを含むMMDAgent音声対話システムツールキットの音声対話コンテンツを生成する.ダイアログコンテンツの作成には,ユーザーが投稿したQ&AダイアログとFSTテンプレートが使用される.提案されたシステムは,名古屋工業大学の学生ラウンジで1年以上にわたり運用され,実験中に500以上の対話が追加された.最も投稿されたカテゴリーは,「アニメ,ビデオゲーム,漫画」に関するものであった.音声対話システムに関する知識がない観光スタッフによるシステム利用実験を行った結果,スタッフはシステムの応答の長さを短縮し,より長い応答にはポーズを追加することで,ユーザに理解されやすい対話を実現していた.

リンク情報
DOI
https://doi.org/10.1186/s13636-018-0142-8

エクスポート
BibTeX RIS