<背景と目的>
聴覚障害者は音源識別が困難であるために,日常生活の様々な場面で不自由を感じて
いる.そこで,本研究では聴覚障害者のために環境音の中から警告音を識別するシス
テムの研究開発を行う.従来,この研究は多変量解析の手法により行われてきたが,
雑音環境での識別率の低下などの問題があった.この問題を解決するために,従来の
研究では1時点のみで音源識別を行っていたものを,本研究では時間による周波数の
特徴の変化情報を用いて識別を行うように改善した.
<音源識別処理>
本研究での音源識別処理の概要は次のようである.あらかじめサンプル音を用いて固
有空間と隠れマルコフモデルを作成しておき,その後入力音識別を行う.マイクロ
フォンより入力される環境音に対し,0.03秒間以上連続して閾値以上のレベルの音が
鳴ったら入力音識別処理を開始する.まず音のサンプリングと平行して,入力音を短
時間FFTなどの前処理を行うことにより周波数情報に変換し,それを固有空間に投影
することにより特徴抽出する.つぎに,オフセットとなるかまたは識別を開始してか
ら3秒間経過したら,それまでに抽出された特徴の時系列データを隠れマルコフモデ
ルに入力することにより,入力音が各識別対象音源である確率をそれぞれ計算する.
そして最も高い確率を示した音源の確率が,一般の様々な音で作られた“一般的な音
“に対応する隠れマルコフモデルの確率より相対的に求められた閾値以上であるな
ら,入力音は最も高い確率を示した音源であると判定する.閾値以下なら入力音は識
別対象音源以外の音であったとする.最後に,その識別結果を画面表示により出力し
使用者に伝える.
<実験>
以上のシステムを計算機に実装し,6種類の警告音(サイレン,非常ベル,警笛,踏
切,クラクション,救急車)を識別対象音源として実験を行った.その結果,雑音の
ない環境では97%,−10dBの雑音環境においても94%の識別率を得ることができた.