論文

筆頭著者 責任著者
2013年8月24日

モノラル音響信号に対する音源分離のための無限半正定値テンソル分解

情報処理学会 第100回音楽情報科学研究会
  • 吉井 和佳
  • ,
  • 富岡 亮太
  • ,
  • 持橋 大地
  • ,
  • 後藤 真孝

2013-MUS-100
8
開始ページ
1
終了ページ
10
記述言語
日本語
掲載種別
研究論文(研究会,シンポジウム資料等)
出版者・発行元
情報処理学会

本稿では,モノラルの音響信号に対して音源分離を行うための新しい因子分解法について述べる.この種の音源分離タスクにおいては,非負値行列分解 (NMF) を利用するのが現在の主流である.NMF では,与えられた混合音の振幅あるいはパワースペクトログラムを非負値行列とみなし,それを少数の基底スペクトルとそれらの時間方向のアクティベーションとの積に分解することができる.しかし,NMF の性質上,入力は非負値行列でなくてはならず,混合音の複素スペクトログラムに本来備わっている位相情報は考慮されていなかった.そのため,音源信号を再合成するには,音源信号のスペクトログラムは混合音のスペクトログラムと同一の位相をもつという強い仮定をおく必要があった.本研究では,周波数領域での位相復元を回避するため,混合音を時間領域で直接分解することができる半正定値テンソル分解 (PSDTF) を提案する.PSDTF は NMF の本質的な拡張となっているため,NMF と同様に効率的な乗法更新アルゴリズムに基づく最尤推定が可能であり,ガンマ過程に基づくノンパラメトリックベイズ拡張 (基底数の無限化) も可能である.実験の結果,PSDTF は NMF より高品質な音源分離ができることを確かめた.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110009599037
CiNii Books
http://ci.nii.ac.jp/ncid/AN10438388
URL
http://id.nii.ac.jp/1001/00094881/
ID情報
  • CiNii Articles ID : 110009599037
  • CiNii Books ID : AN10438388

エクスポート
BibTeX RIS