氏名: 平岩裕康

論文題目: 視覚障害者のための環境内の文字情報理解支援システム


論文概要

[背景・目的] 我々晴眼者は,周囲の文字情報を瞬時に他から分離し,必 要な情報を得て,目的地にたどり着くなどのことを行っている.しかし,視覚障害者 は視覚の機能が失われているため,そのようなことを行うのは不可能である.そこ で,本研究は,ノートPCとCCDカメラを利用して環境内にある文字列の抽出を行い, 認識した文字情報を音声化することによって視覚障害者に伝えることを目的とする.

[手法] カメラで取得した画像から抽出したエッジの追跡を行い,外接矩 形を作成する.各矩形から文字のもつ一般的特徴を用いて非文字要素を削除し,文字 候補領域を作成する.文字は環境内では単独では存在せず,文字列であることがほと んどなので,最終的に下図のように文字領域の配置を考慮して,文字列に統合した画 像を作成する.
 抽出した文字列を含む部分2値画像をOCRにかけ文字認識を行う.認識結果を音声化 して,視覚障害者に文字情報を伝達する.音声化する際に,重要な情報をもつ文字列 から先に読み上げる.

[実験] あらかじめ撮影しておいた400枚の画像に対して文字抽出・認識実 験を行った.撮影した画像は,文字列を1列以上含んでいるものとした.文字列単位 で抽出成功,一部抽出成功,抽出失敗の3種類に分類したところ,全785列のうち 68.9%の文字列の抽出に成功した.一部抽出成功した30.2%(237列)のうち,85.2% (202列)の文字列が文字認識が完全ならば,人間の知識によって失われた文字部分を 補うことができる程度の抽出であった.93.6%(735列)の文字列を理解可能であるとい える.
 また,地下鉄構内にてフィールド実験を行って,歩行の補助となる有効な情報を提 供できることを確認した.


図 文字列抽出の例

目次に戻る