[ 背景・目的 ]
音源分離の一手法として,分離信号の相互相関値が零になる
ときのみ、最小値(零)をとる非負関数を最小化するブラインド信号分離が提案され,
2音源で良い分離が実現されている.しかし,この手法には,3音源以上の混合信号
の分離において,分離パラメータの収束が難しくなる問題がある.本研究では,分離
パラメータの収束点を推定することにより,その収束性の問題を解決することを目的
とする.
[ 提案手法 ]
分離パラメータの収束点は,話者とマイクの位置関係による信
号の到達時間差に依存する.そこで,本研究では,分離パラメータと到達時間差との
関係を定式化した.さらに,話者を撮影した画像から,話者の肌色を抽出することに
より信号到来方位を求め,各マイクへの到達時間差を計算し,関係式から分離パラ
メータの収束点を推定する.
[ 実験と結果 ]
3人の話者による混合信号分離実験を行なった.Table1は,収
束点推定法と従来手法の収束性の比較である.従来手法の結果は,分離パラメータの
初期値をランダムに設定して50回試行し,収束した21回の学習回数の平均と最大値,
最小値である.残りの29回は設定時間内に収束しなかった.このように,収束性の不
安定な3音源分離処理において,提案手法は収束性能を向上させるという結果が得ら
れた.
従来手法 | 収束点推定 | |||
---|---|---|---|---|
平均(21試行) | 最大 | 最小 | ||
学習回数(回) | 12,463,007 | 23,561,452 | 9,074,343 | 9,074,343 TD> |
処理時間(sec) | 736 | 1393 | 568 | 568 |