2016年4月 - 2019年3月
人の発声機構を考慮した話者固有の情報の抽出と話者照合への応用に関する研究
日本学術振興会 科学研究費助成事業 挑戦的萌芽研究
話者性と音韻性は分離可能であると仮定し,音韻の影響を受けない話者表現を得るためのニューラルネットワークを構築することを試みた.その成果として,音響特徴量から音韻性と話者性をフレーム単位で分離・抽出するディスエンタングリング・ニューラルネットワークの構築に成功した.発話単位で表出する話者情報をフレーム単位の特徴量に反映させるために統計的プーリングを導入し,特に識別の直前にプーリングを行うことの重要性を明らかにした.さらに,分離・抽出された各特徴量が各々話者および音韻の情報のみを含むように特徴抽出器を最適化するために,識別器のエントロピーに基づく損失を新たに導入しその有効性を明らかにした.
- ID情報
-
- 課題番号 : 16K12465
- 体系的課題番号 : JP16K12465