TOP > 国内特許検索 > 文字認識装置、文字認識方法およびプログラム

文字認識装置、文字認識方法およびプログラム 新技術説明会

国内特許コード P120007582
掲載日 2012年5月23日
出願番号 特願2012-042085
公開番号 特開2013-178659
登録番号 特許第5964078号
出願日 平成24年2月28日(2012.2.28)
公開日 平成25年9月9日(2013.9.9)
登録日 平成28年7月8日(2016.7.8)
発明者
  • 中村 明生
  • 淵田 正隆
出願人
  • 学校法人東京電機大学
発明の名称 文字認識装置、文字認識方法およびプログラム 新技術説明会
発明の概要 【課題】指先でなぞった部分の文字をより高い精度で認識する、汎用的な文字認識装置、文字認識方法およびプログラムを提供することにある。
【解決手段】文字認識装置10は、文字候補認識部102と、文字列領域認識部104と、文字列抽出部106を有する。文字候補認識部102は、1つの文字と推定される領域である文字候補領域を認識する。文字列領域認識部104は、文字候補認識部102が認識した文字候補領域毎に、文字と推定される色を有する領域を膨張させる膨張処理を施し、膨張処理を施した文字候補領域同士で繋がった領域を、文字列領域112として認識する。文字列抽出部106は、文字列領域112に基づき、画像から文字を抽出する。
【選択図】図1
従来技術、競合技術の概要


視覚障害者は、主に点字や音声といった情報によって周囲から情報を取得している。しかし、商品の容器や張り紙など、生活において重要な情報を含む文字情報には、これらの情報が備わっていないことが多い。



点字や音声の情報を備えない文字情報から、音声情報を作成するシステムとして、例えば特許文献1や非特許文献1に記載の装置がある。特許文献1に記載のシステムは、装置への入力情報とする画像の中で、ある特性をもつ色に囲まれた領域を切り出し、その領域に存在する文字を抽出する。そして抽出した文字を文字コードに変換して音声合成部で読み上げるものである。



非特許文献1に記載の装置は、入力画像上の文字を指先でなぞり、なぞった部分にある文字を認識して読み上げるものである。

産業上の利用分野


本発明は文字認識装置、文字認識方法およびプログラムに関する。

特許請求の範囲 【請求項1】
2値化された画像内の指標の位置を検出し、前記指標の位置に基づいて、1つの文字と推定される領域である文字候補領域を認識する文字候補認識手段と、
前記文字候補認識手段が認識した前記文字候補領域毎に、文字と推定される色を有する領域を膨張させる膨張処理を施し、前記膨張処理を施した前記文字候補領域同士で繋がった領域を文字列領域として認識する文字列領域認識手段と、
前記文字列領域に基づき、前記画像から文字列を抽出する文字列抽出手段を有する文字認識装置。

【請求項2】
請求項1に記載の文字認識装置において、
前記文字列抽出手段は、
前記画像全体における2次元座標値を保持しており、前記画像全体における前記2次元座標値と前記文字列領域の前記2次元座標値とを比較して、前記画像から前記文字列を抽出する文字認識装置。

【請求項3】
請求項1に記載の文字認識装置において、
前記文字列抽出手段は、
前記膨張処理を施した画像をマスク情報として別途保持し、前記画像と前記マスク情報の論理積から、前記文字列を抽出する文字認識装置。

【請求項4】
請求項1~3のいずれか一項に記載の文字認識装置において、
前記文字候補認識手段は、
前記画像内で移動する前記指標の位置に基づいて基準領域を生成し前記生成した基準領域を用いて前記画像から前記文字候補領域を認識する文字認識装置。

【請求項5】
コンピュータが、
2値化された画像内の指標の位置を検出し、前記指標の位置に基づいて、1つの文字と推定される領域である文字候補領域を認識し、
前記文字候補領域毎に、文字と推定される色を有する領域を膨張させる膨張処理を施し、前記膨張処理を施した前記文字候補領域同士で繋がった領域を文字列領域として認識し、
前記文字列領域に基づき、前記画像から文字列を抽出する文字認識方法。

【請求項6】
請求項5に記載の文字認識方法において、
前記コンピュータが、
前記画像全体における2次元座標値を保持しており、前記画像全体における前記2次元座標値と前記文字列領域の前記2次元座標値とを比較して、前記画像から前記文字列を抽出する文字認識方法。

【請求項7】
請求項5に記載の文字認識方法において、
前記コンピュータが、
前記膨張処理を施した画像をマスク情報として別途保持し、前記画像と前記マスク情報の論理積から、前記文字列を抽出する文字認識方法。

【請求項8】
請求項5~7のいずれか一項に記載の文字認識方法において、
前記コンピュータが、
前記画像内で移動する前記指標の位置に基づいて基準領域を生成し前記生成した基準領域を用いて前記画像から前記文字候補領域を認識する文字認識方法。

【請求項9】
コンピュータを、
2値化された画像内の指標の位置を検出し、前記指標の位置に基づいて、1つの文字と推定される領域である文字候補領域を認識する手段、
前記文字候補領域毎に、文字と推定される色を有する領域を膨張させる膨張処理を施し、前記膨張処理を施した前記文字候補領域同士で繋がった領域を文字列領域として認識する手段、
前記文字列領域に基づき、前記画像から文字列を抽出する手段として機能させるためのプログラム。

【請求項10】
請求項9に記載のプログラムにおいて、
前記コンピュータを、
前記画像全体における2次元座標値を保持する手段、
前記画像全体における前記2次元座標値と前記文字列領域の前記2次元座標値とを比較して、前記画像から前記文字列を抽出する手段としてさらに機能させるためのプログラム。

【請求項11】
請求項9に記載のプログラムにおいて、
前記コンピュータを、
前記膨張処理を施した画像をマスク情報として別途保持する手段、
前記画像と前記マスク情報の論理積から、前記文字列を抽出する手段としてさらに機能させるためのプログラム。

【請求項12】
請求項9~11のいずれか一項に記載のプログラムにおいて
前記コンピュータを、
前記画像内で移動する前記指標の位置に基づいて基準領域を生成し前記生成した基準領域を用いて前記画像から前記文字候補領域を認識する手段としてさらに機能させるためのプログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2012042085thum.jpg
出願権利状態 登録
ライセンスご希望の方、またシーズの詳細に関することについては、下記「問合せ先」まで直接お問い合わせくださいますよう,お願い申し上げます。


PAGE TOP

close
close
close
close
close
close
close