2023年3月16日
割り込み発話にも対応可能なリアルタイム話者交替システム
日本音響学会研究発表会講演論文集
- ,
- ,
- ,
- 記述言語
- 日本語
- 会議種別
近年の音声認識技術の発達により, 音声対話シ ステムは正確に会話が行えるようになってきた. しかし, Siri やGoogle assistant といった既存の 対話システムの多くが一問一答対話を行うシステ ムであり, システム発話中のユーザ発話は無視さ れてしまうため, あまり自然な会話は行えない. この問題を解決するために, システムはユーザか らの割り込み発話に対応する必要がある. 既存の割り込み発話に対応した音声対話シス テムでは, ユーザからの割り込み発話に対しシス テム発話を停止し, 全て話者交替を行う手法が多 く採用されている.しかし, ユーザからの発話に は相槌などの話者交替の必要がない発話も含ま れる.そこで, 本研究ではユーザ発話に対しシス テムが話者交替すべきか判定する深層学習モデ ルを提案する. 提案モデルでは, ユーザ発話の先頭300ms の 音声のみから, その発話が相槌, 笑い声かそれ以 外かを判定する.これにより, ユーザ発話終了を 待たず話者交替判定を行うことが可能となる.