TOP > 国内特許検索 > 文字認識方法、文字認識プログラム、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置

文字認識方法、文字認識プログラム、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置 実績あり

国内特許コード P03A002074
整理番号 Y01-P103
掲載日 2003年10月1日
出願番号 特願2001-259576
公開番号 特開2002-175498
登録番号 特許第3958003号
出願日 平成13年8月29日(2001.8.29)
公開日 平成14年6月21日(2002.6.21)
登録日 平成19年5月18日(2007.5.18)
優先権データ
  • 特願2000-300214 (2000.9.29) JP
発明者
  • 中川 正樹
  • 稲村 祐一
  • 福島 貴弘
出願人
  • 独立行政法人科学技術振興機構
発明の名称 文字認識方法、文字認識プログラム、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置 実績あり
発明の概要 枠なしで手書き入力された文字に対するより自由度の高い、筆記方向に依存しない枠なし文字認識(自由筆記文字列認識)を行う。入力文字列パターン入力部5により、ユーザ2による枠なしで自由な方向で入力された文字列のパターンが入力される(S101)。入力された文字列パターンに含まれる各文字は、文字サイズ推定処理部11により、文字サイズを推定される(S103)。つぎに、文字切出し処理部12は、例えば、改行、筆記方向変化点に基づいて文字列の筆記方向の推定を行う(S105)。さらに、文字切出し処理部12は、推定された筆記方向に基づいて仮分割及び仮分割修正を行う(S107、S109)。つぎに、最尤文字列探索処理部13では、文字切出しの行われた文字列に対して、認識エンジン部14及び最尤文字列探索部15により文字認識を行うと共に、この文字認識の結果を認識結果出力部6に出力する。認識結果出力部6は、この認識結果をアプリケーション3の表示画面上に表示するために出力する(S111)。
従来技術、競合技術の概要
近年、表示装置を備えたコンピュータに文字を入力する際、キーボードを使用せず、マウス、タブレット等の適宜の卓上型のディジタイザ(座標読み取り装置)を使用して、設定された枠内に手書き入力を行い、この手書き入力された文字を文字認識する方法が知られている。ここで、手書き入力とは、ストローク入力(文字要素入力)とも呼ばれ、例えば、文字入力、描画の一筆、2点間の描線等、表現し得る文字や線等の入力をいう。この方法によれば、キーボード操作に不慣れな人々でも、コンピュータ等の表示装置上に所望の文字を入力し、種々の文章を作成することができるようになる。
【0003】
また、従来の方法では、コンピュータのアプリケーション(応用ソフト)によっては、予め1文字ごとに記入すべき枠が設定されている場合があった。このような枠内の単一文字での認識(以後、単文字認識)は、本来、PDA(携帯型情報端末)などの小型端末での文字入力の一手法として実用化されており、この認識能力は、実用に十分耐えうるものであって、既存のPDAやノートPC等の文字入力インタフェースとして定着している。
【0004】
しかしながら、この単文字認識では、筆記者(ユーザ)が手書き入力をする際、記入位置がその枠内に限定され、書きにくくなったり、また、文字を一つの枠内に対して1文字しか手書き入力できないので、ユーザが連続した文章を作成する際、時間と手間とが必要となる場合が想定される。その結果として、この単文字認識では、文字記入枠内に1文字ずつ記入された文字を順次認識していくため、筆記者にとっては、文字を複数の文字列としてではなく個々の文字として入力することが、例えば、心理的負担となり、円滑な文字入力を期待できないことがある。
【0005】
上述の事項を防止するためには、予め枠を設定しない、いわゆる「枠なし」文字列認識を提案すればよい。この枠なし文字列認識は、近年の「教育の情報化」に伴った学校教育における対話型電子黒板(通常、白板)の導入、PDA及びペンPCに搭載される液晶画面の大型化に伴った記入及び描画スペースの拡大等により、例えば、ペンインタフェースを用いた文字入力時の自由度(所望の筆記方向で文字入力すること)に関する要求に応じて注目を集めており、いわゆるオンライン手書き文字認識技術の流れは、枠内の単一文字での認識(以後、単文字認識)から、上述の文字記入枠という概念を取り払い、筆記者の意図する所望の文字列(フレーズ)を心理的負担なく入力する手法である、記入/描画スペースに入力された文字列を一括して認識できる枠なし文字列認識へと移行しつつある。
【0006】
図17は、従来の枠なし文字列認識及び単文字認識を開始した際の表示画面についての説明図である。
枠なし文字列認識の表示画面100には、例えば、枠のない入出力表示画面(描画領域)101、機能入力部102とが表示される。また、筆記者が文字列(ここでは、「東京農工大学工学部電子情報工学科」)を記入すると、各文字の区切り位置を示す外接矩形103が表示され、文字列を一括認識し、例えば、この外接矩形103内に各文字の認識結果を表示することもできる。機能入力部102は、複数の機能に対応し、認識対象である手書き入力文字に対して、例えば、クリックして適宜の指示を実行すれば、手書き入力文字に対して最適な操作を行うように配置されている。機能入力部102は、例えば、認識ボタン、消去ボタン等を備える。
【0007】
また、単文字認識の表示画面200には、例えば、予め枠203を設定された入出力表示画面201、機能入力部202とが表示されている。また、筆記者が、例えば、電子ペン204を用いて枠203内に1文字ずつ記入すると(ここでは、「学」、「工」、「大」)、記入された文字は、単文字認識される。
産業上の利用分野
本発明は、文字認識方法、文字認識プログラム、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置に係り、特に、キーボードを使用せず、記入枠(筆記枠)を設けることなく、自由な方向(例えば、縦、横及び斜め方向)で手書き入力された文字(文字列)を認識することのできる文字認識方法、文字認識プログラム、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置
に関する。
特許請求の範囲 【請求項1】 枠又は線なしで、かつ筆記方向を特定せずに手書き入力された文字列の各文字要素に関する情報を入力する文字列入力ステップと、
前記文字列入力ステップにより入力された文字列の文字サイズを推定する文字サイズ推定ステップと、
文字列に含まれる各文字要素間距離と、推定された文字サイズに対応する第1のしきい値とに基づいて、文字列の改行状況を検出して文字列を文字列構成要素に分割し、及び、改行で区切られた文字列構成要素について文字列の始点と終点を結ぶ直線から文字サイズ以上離れた最遠点を求めることにより前記最遠点を筆記方向の変化点として検出し、改行で区切られた各文字列構成要素を筆記方向の前記変化点でさらに分割し、及び、文字列構成要素の外接矩形の縦の長さ及び横の長さに基づき文字列構成要素毎に筆記方向を推定する筆記方向推定ステップと、
前記筆記方向推定ステップにより推定された筆記方向に沿って、文字列仮分割して文字構成要素を求める仮分割ステップと、
前記仮分割ステップにより仮分割された各文字構成要素に対し、各文字構成要素の外接矩形の重なり面積が第2のしきい値以上であれば該文字構成要素を統合する仮分割修正ステップと
を含む文字認識方法。
【請求項2】 前記仮分割修正ステップにより修正された文字列に対して文字認識を行うと共に、該文字認識の認識結果を出力する認識結果出力ステップをさらに含む請求項に記載の文字認識方法。
【請求項3】 前記文字サイズ推定ステップでは、
文字の各文字要素の幅又は高さのうち大きい値をストロークサイズとし、該ストロークサイズから文字サイズを推定するようにした請求項1又は2に記載の文字認識方法。
【請求項4】 前記筆記方向推定ステップでは、
筆記方向変化の検出を再帰的に行い、筆記方向が複数回変化する文字列にも対応するようにした請求項1乃至3のいずれかに記載の文字認識方法。
【請求項5】 前記筆記方向推定ステップでは、
筆記方向を推定する際、特定された文字列構成要素の外接矩形の横の長さが縦の長さより大きければ筆記方向を横方向と推定し、及び、横の長さが縦の長さより小さければ筆記方向を縦方向と推定するようにした請求項1乃至4のいずれかに記載の文字認識方法。
【請求項6】 前記仮分割ステップでは、
文字列の筆記方向変化が所定値よりも小さく、かつ、分割後の文字サイズが推定文字サイズよりも大きければ、評価中の文字要素を仮分割するようにした請求項1乃至5のいずれかに記載の文字認識方法。
【請求項7】 前記仮分割ステップでは、
文字列の各文字列構成要素の筆記方向情報に基づいて、横方向又は縦方向の文字要素同士の重心間射影距離、及び/又は、該文字要素の外接矩形の横方向又は縦方向の重なり具合を評価し、仮分割を行うようにした請求項1乃至6のいずれかに記載の文字認識方法。
【請求項8】 枠又は線なしで、かつ筆記方向を特定せずに手書き入力された文字列の各文字要素に関する情報を入力する文字列入力ステップと、
前記文字列入力ステップにより入力された文字列の文字サイズを推定する文字サイズ推定ステップと、
文字列に含まれる各文字要素間距離と、推定された文字サイズに対応する第1のしきい値とに基づいて、文字列の改行状況を検出して文字列を文字列構成要素に分割し、及び、改行で区切られた文字列構成要素について文字列の始点と終点を結ぶ直線から文字サイズ以上離れた最遠点を求めることにより前記最遠点を筆記方向の変化点として検出し、改行で区切られた各文字列構成要素を筆記方向の前記変化点でさらに分割し、及び、文字列構成要素の外接矩形の縦の長さ及び横の長さに基づき文字列構成要素毎に筆記方向を推定する筆記方向推定ステップと、
前記筆記方向推定ステップにより推定された筆記方向に沿って、文字列仮分割して文字構成要素を求める仮分割ステップと、
前記仮分割ステップにより仮分割された各文字構成要素に対し、各文字構成要素の外接矩形の重なり面積が第2のしきい値以上であれば該文字構成要素を統合する仮分割修正ステップと
コンピュータに実行させるための文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項9】 枠又は線なしで、かつ筆記方向を特定せずに手書き入力された文字列の各文字要素に関する情報を入力する入力文字列パターン入力部と、
前記入力文字列パターン入力部により入力された文字列の文字サイズを推定する文字サイズ推定処理部と、
前記文字列の切出し処理を行う文字切出し処理部と
を備え、
前記文字切出し処理部は、
文字列に含まれる各文字要素間距離と、推定された文字サイズに対応する第1のしきい値とに基づいて、文字列の改行状況を検出して文字列を文字列構成要素に分割し、及び、改行で区切られた文字列構成要素について文字列の始点と終点を結ぶ直線から文字サイズ以上離れた最遠点を求めることにより前記最遠点を筆記方向の変化点として検出し、改行で区切られた各文字列構成要素を筆記方向の前記変化点でさらに分割し、及び、文字列構成要素の外接矩形の縦の長さ及び横の長さに基づき文字列構成要素毎に筆記方向を推定する筆記方向推定手段と、
前記筆記方向推定手段により推定された筆記方向に沿って、文字列仮分割して文字構成要素を求める仮分割手段と、
前記仮分割手段により仮分割された各文字構成要素に対し、各文字構成要素の外接矩形の重なり面積が第2のしきい値以上であれば該文字構成要素を統合する仮分割修正手段と
を備えた文字認識装置。
【請求項10】 前記仮分割修正手段により修正された文字列に対して文字認識を行う認識エンジン部と、
前記認識エンジン部による認識結果を表示するアプリケーションと
をさらに備えた請求項に記載の文字認識装置。
【請求項11】 枠又は線なしで、かつ筆記方向を特定せずに手書き入力された文字列の各文字要素に関する情報を入力する文字列入力ステップと、
前記文字列入力ステップにより入力された文字列の文字サイズを推定する文字サイズ推定ステップと、
文字列に含まれる各文字要素間距離と、推定された文字サイズに対応する第1のしきい値とに基づいて、文字列の改行状況を検出して文字列を文字列構成要素に分割し、及び、改行で区切られた文字列構成要素について文字列の始点と終点を結ぶ直線から文字サイズ以上離れた最遠点を求めることにより前記最遠点を筆記方向の変化点として検出し、改行で区切られた各文字列構成要素を筆記方向の前記変化点でさらに分割し、及び、文字列構成要素の外接矩形の縦の長さ及び横の長さに基づき文字列構成要素毎に筆記方向を推定する筆記方向推定ステップと、
前記筆記方向推定ステップにより推定された筆記方向に沿って、文字列仮分割して文字構成要素を求める仮分割ステップと、
前記仮分割ステップにより仮分割された各文字構成要素に対し、各文字構成要素の外接矩形の重なり面積が第2のしきい値以上であれば該文字構成要素を統合する仮分割修正ステップと
をコンピュータに実行させるための文字認識プログラム。
産業区分
  • 入出力装置
国際特許分類(IPC)
Fターム
出願権利状態 権利存続中
ライセンス状況 通常実施権[L01-13]
ライセンスをご希望の方、特許の内容に興味を持たれた方は、問合せボタンを押してください。


PAGE TOP

close
close
close
close
close
close
close