共同研究・競争的資金等の研究課題

2016年4月 - 2019年3月

対話システムにおける対話を通じたドメイン知識の獲得

日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

課題番号
16H02869
体系的課題番号
JP16H02869
配分額
(総額)
16,250,000円
(直接経費)
12,500,000円
(間接経費)
3,750,000円

本研究課題は,「話すほど自律的に賢くなる対話システム」の実現を目指している.具体的には,ユーザとの対話中に現れる未知語に関する知識を,ユーザとの自然な対話を通じて取得する.この一環として,昨年度に暗黙的確認というプロセスを提案した.これは単純に「○○って何ですか?」のような明示的確認要求を繰り返してユーザの対話継続意欲を削ぐことなく,知識の獲得やその正誤の検証を行うものである.これは,①未知語のクラス推定,②暗黙的確認要求,③ユーザの応答に基づく暗黙的確認要求に含めた内容の正誤推定,からなる.
本年度は,次の2点においてこの暗黙的確認を拡張した.まず上記③の正誤推定において,単純な肯定否定表現に加えて,その中で使われるクラスの有無や,前後の発話との関係,応答の表層的表現などを素性として扱い,機械学習により正誤を予測する手法を提案した.これにより,正しいクラスを予測するF値が0.308向上した.2点目として複数のユーザからの応答を利用した.暗黙的確認要求に対する単一のユーザの応答のみを使った場合の推定精度は7割程度であったが,複数のユーザに対する暗黙的確認の結果を利用することにより精度をさらに向上させた.ここでは単一のユーザとの対話で得られる確率値を素性として機械学習を行った.
音声を入力とした場合の未知語獲得についても検討を進めた.辞書にない語を単語単位で正しく音声認識するのは不可能であるため,音素レベルでのモデル化を行い,ノンパラメトリックベイズの枠組みで未知語の音素列や単語境界を得ることを試みた.さらに,獲得した知識を保持するために,単純な関係データベース以外の知識表現を用いる検討も行った.

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-16H02869
ID情報
  • 課題番号 : 16H02869
  • 体系的課題番号 : JP16H02869