共同研究・競争的資金等の研究課題

2019年4月 - 2022年3月

日常会話の韻律モデル構築に向けた話者混在音声の分析基盤

日本学術振興会  科学研究費助成事業  基盤研究(B)

課題番号
19H01252
体系的課題番号
JP19H01252
配分額
(総額)
17,810,000円
(直接経費)
13,700,000円
(間接経費)
4,110,000円

日常的な生活環境で収録した話者混在音声から、声の高さの情報であるF0を話者ごとに推定する技術の確立を目指した研究を実施し、以下に挙げる成果が得られた。
(1) 各話者のICレコーダ収録音から当該話者以外の成分を抑圧し、次段のF0推定の精度を向上させるため、話者やマイクの移動に対処した音源分離を試み、日常会話コーパス中に対する分離音声の聞き取り実験を通じて有効性を確認した。
(2) 指定した話者のF0情報を抽出する深層学習の手法を開発した。話者混在音声を対象とした評価実験の結果、分離前と比べて、F0推定誤りを60%以上削減できることがわかった。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-19H01252
ID情報
  • 課題番号 : 19H01252
  • 体系的課題番号 : JP19H01252