1.研究の背景
|
人間は,視聴覚などにより周囲の環境を理解し,適切な行動をしている.聴覚は,無指向性,隠蔽物体や暗闇でも機能,という視覚にない特徴を有し,時間分解能と計算量の点で,視覚に較べ優れている.このように,環境の理解,特に初期知覚において聴覚は重要である.聴覚による環境の理解には,「空間内のどこに音源があるか」(音源の定位),「どんな音か」(音源の識別),そして「音はどのようであるか」(音声認識)という,定位と認識が挙げられる.この際,視覚における物体の重なりと同様,音源信号の重なりが,重要な問題となる.
そこで,本グループでは,空間内の音源の定位と,混合信号からの元信号の分離,および,音源の識別について研究する.
|
2.研究の内容 |
- 音源定位
- 実環境での複数音源の方向定位などのこれまでの研究成果に基づき,定位精度の向上,能動的な音源定位による複雑な環境への対応,視覚情報を併用した定位,を研究する.
- 音源分離
- 実環境での複数音源の混合はconvolutive mixtureである.この状況での混合信号から,元信号の非定常性に着目した分離を研究する.非定常性を利用することで,2次の統計量(相関)のみで分離が可能で,計算量の大幅な削減が可能である.
|
|
- 独立成分分析
- 混合信号の分離は,元信号の統計的独立を仮定してなされる.この際,独立性を評価する指標として,3次以上の高次統計量が使用される.そこで,高次統計量をデータから精度良く推定する方法を研究する.
|
3.研究成果の応用 |
- 定位・分離
- 雑音除去,音声認識前処理,ロボットの耳,聴覚障害者用代行機器
- 独立成分分析
- 脳画像処理,地中探査
|