講演・口頭発表等

2020年3月16日

Uni-directional LSTMとLocal Attention を用いたストリーミング音声認識

日本音響学会研究発表会講演論文集
  • 陳 家浩
  • ,
  • 西村 良太
  • ,
  • 北岡 教英

記述言語
日本語
会議種別

本稿では, 単方向LSTM とlocal attention を用いたストリーミング可能なEnd-to-End 音声認識モデルを提案した. local attention を導入することによって認識精度の改善が確認できた. また, CTC 出力において, local attention は高サブサンプリングレートでの改善効果が大きいことが確認された. これはストリーミングモデルに対しては重要な特性だと考えられる.今後の課題として, 注意機構の特性を活かして, 言語モデルを拡張することによってドメイン外の認識精度を改善することを考えている.

リンク情報
URL
https://web.db.tokushima-u.ac.jp/cgi-bin/edb_browse?EID=370064