2019年4月 - 2022年3月
日常会話の韻律モデル構築に向けた話者混在音声の分析基盤
日本学術振興会 科学研究費助成事業 基盤研究(B)
日常的な生活環境で収録した話者混在音声から、声の高さの情報であるF0を話者ごとに推定する技術の確立を目指した研究を実施し、以下に挙げる成果が得られた。
(1) 各話者のICレコーダ収録音から当該話者以外の成分を抑圧し、次段のF0推定の精度を向上させるため、話者やマイクの移動に対処した音源分離を試み、日常会話コーパス中に対する分離音声の聞き取り実験を通じて有効性を確認した。
(2) 指定した話者のF0情報を抽出する深層学習の手法を開発した。話者混在音声を対象とした評価実験の結果、分離前と比べて、F0推定誤りを60%以上削減できることがわかった。
(1) 各話者のICレコーダ収録音から当該話者以外の成分を抑圧し、次段のF0推定の精度を向上させるため、話者やマイクの移動に対処した音源分離を試み、日常会話コーパス中に対する分離音声の聞き取り実験を通じて有効性を確認した。
(2) 指定した話者のF0情報を抽出する深層学習の手法を開発した。話者混在音声を対象とした評価実験の結果、分離前と比べて、F0推定誤りを60%以上削減できることがわかった。
- ID情報
-
- 課題番号 : 19H01252
- 体系的課題番号 : JP19H01252