2019年4月 - 2022年3月

日常会話の韻律モデル構築に向けた話者混在音声の分析基盤

日本学術振興会科学研究費助成事業基盤研究(B)

課題番号

19H01252

体系的課題番号

JP19H01252

配分額

(総額): 17,810,000円
(直接経費): 13,700,000円
(間接経費): 4,110,000円

日常的な生活環境で収録した話者混在音声から、声の高さの情報であるF0を話者ごとに推定する技術の確立を目指した研究を実施し、以下に挙げる成果が得られた。
(1) 各話者のICレコーダ収録音から当該話者以外の成分を抑圧し、次段のF0推定の精度を向上させるため、話者やマイクの移動に対処した音源分離を試み、日常会話コーパス中に対する分離音声の聞き取り実験を通じて有効性を確認した。
(2) 指定した話者のF0情報を抽出する深層学習の手法を開発した。話者混在音声を対象とした評価実験の結果、分離前と比べて、F0推定誤りを60%以上削減できることがわかった。

リンク情報

KAKEN: https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-19H01252

ID情報

課題番号 : 19H01252
体系的課題番号 : JP19H01252

小野順貴

共同研究・競争的資金等の研究課題

日常会話の韻律モデル構築に向けた話者混在音声の分析基盤

メニュー

共著者の一覧