2020年 - 2022年
空間アテンション機構に基づく新しい音響シーン識別手法の確立
日本学術振興会 基盤研究(C) 基盤研究(C)
- 課題番号
- 20K11880
- 体系的課題番号
- JP20K11880
- 担当区分
- 研究代表者
- 配分額
-
- (総額)
- 4,030,000円
- (直接経費)
- 3,100,000円
- (間接経費)
- 930,000円
- 資金種別
- 競争的資金
音響シーン識別において複数のマイクの録音信号を入力することにより、音源の周波数特性などの音響特徴に加えて、個々の音源の方向などの空間特徴を活用することが可能となり、識別性能のさらなる向上が期待できる。本研究の目的は、空間信号処理と識別器の融合による新しい音響シーン識別手法を確立することである。具体的には、音響シーンに存在する複数の音源の中からより重要な音源に自動的に焦点を当てる機能(空間アテンション機構)を有するニューラルネットワークを新たに開発する。これにより、音源の方向や種類などの事前情報を必要とせず、識別に適した指向特性を入力信号から自動的に形成することが可能となる。
<BR>
2021年度は、前年度に引き続き、空間アテンション機構に基づく音響シーン識別手法の開発に取り組んだ。主な研究成果を以下にまとめる。
(1)複数の空間フィルタ出力への自動重み付けに基づく識別手法の開発:これは、異なる指向特性を有する空間フィルタを複数個用意し、それぞれの空間フィルタ出力に対する重みを推定して識別する手法であり、前年度に実験によりその有効性を示した。2021年度は、さらに空間フィルタの数が識別性能に及ぼす影響を調査した。
(2)空間フィルタの自動推定に基づく識別手法の開発:これは、空間フィルタそのものを推定し、推定した空間フィルタの出力を用いて識別する手法である。空間フィルタとしての振る舞いをある程度保証する拘束条件を新たに考案した結果、どの音が識別に有効であるかを自動的に見出し、またそれを強調するための空間フィルタを自動的に生成できることを確認した。
(3)半教師あり学習やWave-U-Netの適用:識別精度の向上を図るために、弱ラベルデータを用いた半教師あり学習やWave-U-Netの適用を検討し、その有効性を示した。これらの研究成果を査読なし国内会議論文、査読付き国際会議論文として発表した。
<BR>
2021年度は、前年度に引き続き、空間アテンション機構に基づく音響シーン識別手法の開発に取り組んだ。主な研究成果を以下にまとめる。
(1)複数の空間フィルタ出力への自動重み付けに基づく識別手法の開発:これは、異なる指向特性を有する空間フィルタを複数個用意し、それぞれの空間フィルタ出力に対する重みを推定して識別する手法であり、前年度に実験によりその有効性を示した。2021年度は、さらに空間フィルタの数が識別性能に及ぼす影響を調査した。
(2)空間フィルタの自動推定に基づく識別手法の開発:これは、空間フィルタそのものを推定し、推定した空間フィルタの出力を用いて識別する手法である。空間フィルタとしての振る舞いをある程度保証する拘束条件を新たに考案した結果、どの音が識別に有効であるかを自動的に見出し、またそれを強調するための空間フィルタを自動的に生成できることを確認した。
(3)半教師あり学習やWave-U-Netの適用:識別精度の向上を図るために、弱ラベルデータを用いた半教師あり学習やWave-U-Netの適用を検討し、その有効性を示した。これらの研究成果を査読なし国内会議論文、査読付き国際会議論文として発表した。
- ID情報
-
- 課題番号 : 20K11880
- 体系的課題番号 : JP20K11880