2016年4月 - 2019年3月

人の発声機構を考慮した話者固有の情報の抽出と話者照合への応用に関する研究

日本学術振興会科学研究費助成事業挑戦的萌芽研究

小川哲司
俵直弘

課題番号

16K12465

体系的課題番号

JP16K12465

担当区分

研究代表者

配分額

(総額): 3,380,000円
(直接経費): 2,600,000円
(間接経費): 780,000円

話者性と音韻性は分離可能であると仮定し，音韻の影響を受けない話者表現を得るためのニューラルネットワークを構築することを試みた．その成果として，音響特徴量から音韻性と話者性をフレーム単位で分離・抽出するディスエンタングリング・ニューラルネットワークの構築に成功した．発話単位で表出する話者情報をフレーム単位の特徴量に反映させるために統計的プーリングを導入し，特に識別の直前にプーリングを行うことの重要性を明らかにした．さらに，分離・抽出された各特徴量が各々話者および音韻の情報のみを含むように特徴抽出器を最適化するために，識別器のエントロピーに基づく損失を新たに導入しその有効性を明らかにした．

リンク情報

KAKEN: https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-16K12465

ID情報

課題番号 : 16K12465
体系的課題番号 : JP16K12465

小川哲司

共同研究・競争的資金等の研究課題

人の発声機構を考慮した話者固有の情報の抽出と話者照合への応用に関する研究

メニュー

共著者の一覧