TOP > 国内特許検索 > 文字認識方法、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置

文字認識方法、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置 実績あり

国内特許コード P020000293
整理番号 Y99-P239
掲載日 2003年5月27日
出願番号 特願2000-167953
公開番号 特開2001-351065
登録番号 特許第3893013号
出願日 平成12年6月5日(2000.6.5)
公開日 平成13年12月21日(2001.12.21)
登録日 平成18年12月15日(2006.12.15)
発明者
  • 中川 正樹
  • 坂東 宏和
出願人
  • 国立研究開発法人科学技術振興機構
発明の名称 文字認識方法、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置 実績あり
発明の概要 【課題】 枠なしで手書き入力した文字に対する文字認識及び認識の訂正を容易に行う。
【解決手段】 手書き文字列が、枠のない表示画面上にペンダウン入力され(S101)、モードを判定する(S103)。手書き文字入力モードであれば、ストローク入力された手書き文字を文字認識する(S105)。表示・訂正モードであれば、認識された各々の文字の外接矩形を求め、ペンダウン入力された位置が、外接矩形領域の外側か内側かを判定する(S107)。外接矩形領域の外側にあれば、このストローク入力によって描かれた描線による訂正の指示が複数文字に分けるための「区切り」かひとつの文字にまとめるための「囲み」かを判定する(S109)。この描線が区切りであれば、区切りによる訂正処理及び文字認識を行う(S111)。この描線が囲みであれば、囲みによる訂正処理及び文字認識を行う(S113)。一方、ペンダウン入力位置が、外接矩形領域の内側にあれば、単文字候補表示・選択(S117)、又は、単文字再入力及び文字認識を行う(S119)。
従来技術、競合技術の概要


近年、表示装置を備えたコンピュータに文字を入力する際、キーボードを使用せず、マウス、タブレット等の適宜の卓上型のディジタイザ(座標読み取り装置)を使用して、設定された枠内に手書き入力を行い、この手書き入力された文字を文字認識する方法が知られている。ここで、手書き入力とは、ストローク入力とも呼ばれ、例えば、文字入力、描画の一筆、2点間の描線等、表現し得る文字や線等の入力をいう。
この方法によれば、キーボード操作に不慣れな人々でも、コンピュータ等の表示装置上に所望の文字を入力し、種々の文章を作成することができるようになる。

産業上の利用分野


本発明は、文字認識方法、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置に係り、特に、キーボードを使用せず、記入枠なしで手書き入力された文字(文字列)を認識すると共に、この認識された文字(文字列)の修正を簡単に行うことのできる文字認識方法、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置に関する。

特許請求の範囲 【請求項1】
入力モード処理部が、入力装置から枠なしで手書き文字列を入力するステップと、
表示・訂正モード処理部が、入力モード処理部により枠なしで手書き入力された入力文字と、文字認識を行う認識エンジンによる前記入力文字の認識結果とを、表示装置の表示画面上に表示する第1表示ステップと、
表示・訂正モード処理部が、入力装置から囲み又は区切りを示す描線を入力するステップと、
表示・訂正モード処理部が、前記第1表示ステップにより表示された認識結果に対して、訂正モードにおいて訂正を指示するために入力された前記描線の入力位置が、入力文字についての第1外接矩形の内側か外側かを判断する位置判断ステップと、
表示・訂正モード処理部が、前記位置判断ステップにより、描線の入力位置が第1外接矩形の外側であると判断された場合、訂正の指示が、複数の認識文字に対する囲みか、ひとつの認識文字に対する区切りかを判定する判定ステップと、
表示・訂正モード処理部が、前記判定ステップに基づいて、複数の認識文字をひとつの入力文字として訂正又はひとつの認識文字を複数の入力文字として訂正し、その訂正の指示に従い再び認識エンジンにより文字認識を行うための訂正認識ステップと
表示・訂正モード処理部が、前記訂正認識ステップにより文字認識された認識結果を、表示装置の表示画面上に表示する第2表示ステップとを含み、
前記訂正認識ステップは、
認識エンジンが、囲み又は区切りにより訂正され再認識された候補文字を抽出すると共に、候補文字と他の認識文字候補との間をつなぐ経路を形成するステップと、
認識エンジンが、候補文字以外に関連し、訂正に矛盾する経路を削除するステップと、
認識エンジンが、候補文字と形成された経路に基づき、最適な経路を探索するステップとを含む文字認識方法。

【請求項2】
前記訂正認識ステップは、
認識エンジンが、訂正された手書き入力文字よりも前方の認識結果を確定するステップをさらに含み、訂正された手書き入力文字よりも後方の手書き入力文字のみを再探索するようにした請求項に記載の文字認識方法。

【請求項3】
入力モード処理部が、入力装置から枠なしで手書き文字列を入力するステップと、
表示・訂正モード処理部が、入力モード処理部により枠なしで手書き入力された入力文字と、文字認識を行う認識エンジンによる前記入力文字の認識結果とを、表示装置の表示画面上に表示する第1表示ステップと、
表示・訂正モード処理部が、入力装置から囲み又は区切りを示す描線を入力するステップと、
表示・訂正モード処理部が、前記第1表示ステップにより表示された認識結果に対して、訂正モードにおいて訂正を指示するために入力された前記描線の入力位置が、入力文字についての第1外接矩形の内側か外側かを判断する位置判断ステップと、
表示・訂正モード処理部が、前記位置判断ステップにより、描線の入力位置が第1外接矩形の外側であると判断された場合、訂正の指示が、複数の認識文字に対する囲みか、ひとつの認識文字に対する区切りかを判定する判定ステップと、
表示・訂正モード処理部が、前記判定ステップに基づいて、複数の認識文字をひとつの入力文字として訂正又はひとつの認識文字を複数の入力文字として訂正し、その訂正の指示に従い再び認識エンジンにより文字認識を行うための訂正認識ステップと、
表示・訂正モード処理部が、前記訂正認識ステップにより文字認識された認識結果を、表示装置の表示画面上に表示する第2表示ステップとを含み、
前記判定ステップでは、表示・訂正モード処理部が、
訂正を指示するために入力された描線についての第2外接矩形を形成し、前記第2外接矩形の長手方向についての該描線の始点と終点との差と、第1外接矩形の長手方向の一辺の長さとを比較することで、
その差が一辺の長さの所定割合よりも小さければ、訂正の指示が囲みと判定し、
その差が一辺の長さの所定割合よりも小さくなければ、訂正の指示が区切りと判定するようにした文字認識方法。

【請求項4】
表示・訂正モード処理部は、訂正モードにおいて、訂正を指示するために入力された描線の入力位置が、第1外接矩形の内側にあり、描線が所定長以下又は入力時間が所定時間以下である場合、
手書き入力文字、第1外接矩形又は認識結果の近傍に候補文字を表示し、正しい候補文字が選択されることで認識文字を訂正する表示選択ステップをさらに含む請求項1乃至のいずれかに記載の文字認識方法。

【請求項5】
表示・訂正モード処理部は、訂正モードにおいて、訂正を指示するために入力された描線の入力位置が、第1外接矩形の内側にあり、描線が所定長以上又は入力時間が所定時間以上である場合、
新たに入力された手書き入力文字に対して、認識エンジンにより文字認識を行うための再入力認識ステップをさらに含む請求項1乃至のいずれかに記載の文字認識方法。

【請求項6】
認識エンジンは、前記手書き入力文字が英単語である場合、
近接している英文字をひとつの単語として区切り、格納された単語辞書中の候補を検索することで、英単語を文字認識するようにした請求項1乃至のいずれかに記載の文字認識方法。

【請求項7】
前記第1及び第2表示ステップでは、表示・訂正モード処理部が入力文字、認識文字、及び/又は、外接矩形について、描線の色、濃さ又は太さを適宜に変更して表示するようにした請求項1乃至のいずれかに記載の文字認識方法。

【請求項8】
表示・訂正モード処理部は、手書き入力文字が促音を示す小さい文字であった場合、
前記第1及び第2表示ステップでは、
通常の大きさの文字と促音を示す小さい文字とを区別して表示するようにした請求項1乃至のいずれかに記載の文字認識方法。

【請求項9】
前記認識ステップで求められた入力文字ごとの第1外接矩形の内側の領域は、ユーザインタフェースのボタンとして機能するようにした請求項1乃至のいずれかに記載の文字認識方法。

【請求項10】
入力モード処理部が、入力装置から枠なしで手書き文字列を入力するステップと、
表示・訂正モード処理部が、入力モード処理部により枠なしで手書き入力された入力文字と、文字認識を行う認識エンジンによる前記入力文字の認識結果とを、表示装置の表示画面上に表示する第1表示ステップと、
表示・訂正モード処理部が、入力装置から囲み又は区切りを示す描線を入力するステップと、
表示・訂正モード処理部が、前記第1表示ステップにより表示された認識結果に対して、訂正モードにおいて訂正を指示するために入力された前記描線の入力位置が、入力文字についての第1外接矩形の内側か外側かを判断する位置判断ステップと、
表示・訂正モード処理部が、前記位置判断ステップにより、描線の入力位置が第1外接矩形の外側であると判断された場合、訂正の指示が、複数の認識文字に対する囲みか、ひとつの認識文字に対する区切りかを判定する判定ステップと、
表示・訂正モード処理部が、前記判定ステップに基づいて、複数の認識文字をひとつの入力文字として訂正又はひとつの認識文字を複数の入力文字として訂正し、その訂正の指示に従い再び認識エンジンにより文字認識を行うための訂正認識ステップであって、
認識エンジンが、囲み又は区切りにより訂正され再認識された候補文字を抽出すると共に、候補文字と他の認識文字候補との間をつなぐ経路を形成するステップと、
認識エンジンが、候補文字以外に関連し、訂正に矛盾する経路を削除するステップと、
認識エンジンが、候補文字と形成された経路に基づき、最適な経路を探索するステップとを含む前記訂正認識ステップと、
表示・訂正モード処理部が、前記訂正認識ステップにより文字認識された認識結果を、表示装置の表示画面上に表示する第2表示ステップとをコンピュータに実行させるための文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体。

【請求項11】
入力モード処理部が、入力装置から枠なしで手書き文字列を入力するステップと、
表示・訂正モード処理部が、入力モード処理部により枠なしで手書き入力された入力文字と、文字認識を行う認識エンジンによる前記入力文字の認識結果とを、表示装置の表示画面上に表示する第1表示ステップと、
表示・訂正モード処理部が、入力装置から囲み又は区切りを示す描線を入力するステップと、
表示・訂正モード処理部が、前記第1表示ステップにより表示された認識結果に対して、訂正モードにおいて訂正を指示するために入力された前記描線の入力位置が、入力文字についての第1外接矩形の内側か外側かを判断する位置判断ステップと、
表示・訂正モード処理部が、前記位置判断ステップにより、描線の入力位置が第1外接矩形の外側であると判断された場合、訂正の指示が、複数の認識文字に対する囲みか、ひとつの認識文字に対する区切りかを判定する判定ステップであって、訂正を指示するために入力された描線についての第2外接矩形を形成し、前記第2外接矩形の長手方向についての該描線の始点と終点との差と、第1外接矩形の長手方向の一辺の長さとを比較することで、その差が一辺の長さの所定割合よりも小さければ、訂正の指示が囲みと判定し、その差が一辺の長さの所定割合よりも小さくなければ、訂正の指示が区切りと判定する前記判定ステップと、
表示・訂正モード処理部が、前記判定ステップに基づいて、複数の認識文字をひとつの入力文字として訂正又はひとつの認識文字を複数の入力文字として訂正し、その訂正の指示に従い再び認識エンジンにより文字認識を行うための訂正認識ステップと、
表示・訂正モード処理部が、前記訂正認識ステップにより文字認識された認識結果を、表示装置の表示画面上に表示する第2表示ステップとをコンピュータに実行させるための文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体。

【請求項12】
枠なしで手書き入力された入力文字と、入力文字の認識結果とを表示するアプリケーションと、
認識結果の表示及び誤認識の訂正を行うための表示・訂正モード処理部と、
文字認識を行う認識エンジンとを備え、
前記表示・訂正モード処理部は、
前記アプリケーションにより表示された認識結果に対して、訂正モードにおいて訂正を指示するために入力された描線の入力位置が、入力文字についての第1外接矩形の内側か外側かを判断する位置判断手段と、
前記位置判断手段により、描線の入力位置が第1外接矩形の外側であると判断された場合、訂正の指示が、複数の認識文字に対する囲みか、ひとつの認識文字に対する区切りかを判定する判定手段と、
前記判定手段に基づいて、複数の認識文字をひとつの入力文字として訂正又はひとつの認識文字を複数の入力文字として訂正し、その訂正の指示に従い再び前記認識エンジンにより文字認識を行うための訂正認識手段とを備え
前記訂正認識手段は、
囲み又は区切りにより訂正され再認識された候補文字を抽出すると共に、候補文字と他の認識文字候補との間をつなぐ経路を形成し、
候補文字以外に関連し、訂正に矛盾する経路を削除し、
候補文字と形成された経路に基づき、最適な経路を探索するようにした文字認識装置。

【請求項13】
枠なしで手書き入力された入力文字と、入力文字の認識結果とを表示するアプリケーションと、
認識結果の表示及び誤認識の訂正を行うための表示・訂正モード処理部と、
文字認識を行う認識エンジンとを備え、
前記表示・訂正モード処理部は、
前記アプリケーションにより表示された認識結果に対して、訂正モードにおいて訂正を指示するために入力された描線の入力位置が、入力文字についての第1外接矩形の内側か外側かを判断する位置判断手段と、
前記位置判断手段により、描線の入力位置が第1外接矩形の外側であると判断された場合、訂正の指示が、複数の認識文字に対する囲みか、ひとつの認識文字に対する区切りかを判定する判定手段と、
前記判定手段に基づいて、複数の認識文字をひとつの入力文字として訂正又はひとつの認識文字を複数の入力文字として訂正し、その訂正の指示に従い再び前記認識エンジンにより文字認識を行うための訂正認識手段とを備え、
前記判定手段では、
訂正を指示するために入力された描線についての第2外接矩形を形成し、前記第2外接矩形の長手方向についての該描線の始点と終点との差と、第1外接矩形の長手方向の一辺の長さとを比較することで、
その差が一辺の長さの所定割合よりも小さければ、訂正の指示が囲みと判定し、
その差が一辺の長さの所定割合よりも小さくなければ、訂正の指示が区切りと判定するようにした文字認識装置。

【請求項14】
入力モードにおいて、入力文字に対して文字認識を行い、前記認識エンジンにより入力文字の第1外接矩形及び認識結果を求めるための入力モード処理部をさらに備えた請求項12又は13に記載の文字認識装置。

【請求項15】
前記第1外接矩形の内側の領域を、ユーザインタフェースの入力ボタンとした請求項12乃至14のいずれかに記載の文字認識装置。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2000167953thum.jpg
出願権利状態 登録
ライセンス状況 通常実施権[L01-13]
ライセンスをご希望の方、特許の内容に興味を持たれた方は、問合せボタンを押してください。


PAGE TOP

close
close
close
close
close
close
close