TOP > 中国の大学の特許 > 北京大学の特許一覧 > 原稿方向の検出方法及び装置 > 明細書

明細書 :原稿方向の検出方法及び装置

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第5271956号 (P5271956)
公開番号 特開2011-008770 (P2011-008770A)
登録日 平成25年5月17日(2013.5.17)
発行日 平成25年8月21日(2013.8.21)
公開日 平成23年1月13日(2011.1.13)
発明の名称または考案の名称 原稿方向の検出方法及び装置
国際特許分類 G06K   9/20        (2006.01)
G06T   1/00        (2006.01)
FI G06K 9/20 320N
G06T 1/00 310Z
請求項の数または発明の数 16
全頁数 15
出願番号 特願2010-101989 (P2010-101989)
出願日 平成22年4月27日(2010.4.27)
優先権出願番号 200910088352.6
優先日 平成21年6月26日(2009.6.26)
優先権主張国 中華人民共和国(CN)
審査請求日 平成24年3月21日(2012.3.21)
特許権者または実用新案権者 【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
【識別番号】509352679
【氏名又は名称】方正国際軟件(北京)有限公司
【識別番号】500212103
【氏名又は名称】北京大学
【氏名又は名称】PEKING UNIVERSITY
発明者または考案者 【氏名】六尾 敏明
【氏名】リー ピンリ
【氏名】チャン ホンジー
【氏名】ユエン モンヨウ
個別代理人の代理人 【識別番号】000006150、【氏名又は名称】京セラドキュメントソリューションズ株式会社
審査官 【審査官】伊藤 隆夫
参考文献・文献 特開平04-195485(JP,A)
特開2001-312697(JP,A)
特開2009-020884(JP,A)
特開平10-224596(JP,A)
調査した分野 G06K 9/00-9/82
特許請求の範囲 【請求項1】
原稿を走査して前記原稿の文字の筆画図を得るステップと、
前記筆画図により前記文字の十字特徴を抽出するステップと、
前記十字特徴により原稿方向を検出するステップと、
を含み、
前記筆画図により前記文字の十字特徴を抽出するステップは、
前記筆画図の筆画ノード、直筆画、非直筆画及びそれらの連結関係により、前記文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出するステップと、前記文字が前記横方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを左向きまたは右向きとして抽出するステップと、
前記文字が前記縦方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを上向きまたは下向きとして抽出するステップと、
を含むことを特徴とする原稿方向の検出方法。
【請求項2】
前記連結関係は貫通関係を含み、
2つの前記筆画ノードは、
同一筆画ノードに連結される上下の2筆画ノードの端点間の距離が前記同一筆画ノードの高さより小さく、且つ前記上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされることを特徴とする請求項に記載の原稿方向の検出方法。
【請求項3】
前記文字は、
その2つの前記直筆画が同一の前記筆画ノードに連結され、且つ貫通関係を有するという条件と、
前記筆画ノードの端点から前記直筆画の境界までの距離が前記直筆画の平均ラン幅の1/
2よりも大きいという条件と、
前記筆画ノードに連結される他の筆画ノードがいずれも前記直筆画に対して同一側に位置するという条件を同時に満たすと、前記横方向十字特徴構造とされることを特徴とする請求項2に記載の原稿方向の検出方法。
【請求項4】
前記同一側が右側であると、前記文字の十字特徴の向きが左向きであり、
前記同一側が左側であると、前記文字の十字特徴の向きが右向きであることを特徴とする請求項3に記載の原稿方向の検出方法。
【請求項5】
前記文字は、
第1の筆画ノードの上部または下部に連結される第2の筆画ノードの数が1であり、前記第1の筆画ノードの幅がその高さの2倍よりも大きいという条件と、
前記第2の筆画ノードに連結される貫通ノードがあり、且つ前記貫通ノードが前記第1の筆画ノードの中間部に位置するという条件と、
前記第1の筆画ノードに連結される筆画が全て前記直筆画である、或は前記第1の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画であるという条件を同時に満たすと、前記縦方向十字特徴構造とされることを特徴とする請求項2に記載の原稿方向の検出方法。
【請求項6】
前記第1の筆画ノードに連結される筆画が全て前記直筆画である場合、
前記第1の筆画ノードの下部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが上向きであり、
前記第1の筆画ノードの上部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが下向きであり、
前記第1の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画である場合、
前記非直筆画が前記第1の筆画ノードの下部に位置するとき、前記文字の十字特徴の向きが上向きであり、
前記非直筆画が前記第1の筆画ノードの上部に位置するとき、前記文字の十字特徴の向きが下向きであることを特徴とする請求項5に記載の原稿方向の検出方法。
【請求項7】
前記十字特徴により原稿方向を検出するステップは、
前記十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計するステップと、
最も多い数に対応する前記十字特徴の向きを前記原稿方向に設定するステップと、
を含むことを特徴とする請求項1乃至6のいずれか1項に記載の原稿方向の検出方法。
【請求項8】
前記原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、前記原稿の十字特徴の向きが前記所定の向きになるまで、前記原稿を補正するステップを更に含むことを特徴とする請求項7に記載の原稿方向の検出方法。
【請求項9】
原稿を走査して前記原稿の文字の筆画図を得る走査モジュールと、
前記筆画図により前記文字の十字特徴を抽出する抽出モジュールと、
前記十字特徴により原稿方向を検出する検出モジュールと、
を含み、
前記抽出モジュールは、
前記筆画図の筆画ノード、直筆画、非直筆画及びそれらの連結関係により、前記文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出する十字特徴構造抽出ユニットと、
前記十字特徴構造に基づいて、さらに前記文字の十字特徴の向きを抽出し、前記文字が前記横方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを左向きまたは右向きとして抽出し、前記文字が前記縦方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを上向きまたは下向きとして抽出する十字特徴向き抽出ユニットと、
を含むことを特徴とする原稿方向の検出装置
【請求項10】
前記連結関係は貫通関係を含み、
2つの前記筆画ノードは、
同一筆画ノードに連結される上下の2筆画ノードの端点間の距離が前記同一筆画ノードの高さより小さく、且つ前記上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされることを特徴とする請求項9に記載の原稿方向の検出装置。
【請求項11】
前記文字は、
その2つの前記直筆画が同一の前記筆画ノードに連結され、且つ貫通関係を有するという条件と、
前記筆画ノードの端点から前記直筆画の境界までの距離が前記直筆画の平均ラン幅の1/
2よりも大きいという条件と、
前記筆画ノードに連結される他の筆画ノードがいずれも前記直筆画に対して同一側に位置するという条件を同時に満たすと、前記横方向十字特徴構造とされることを特徴とする請求項10に記載の原稿方向の検出装置。
【請求項12】
前記同一側が右側であると、前記文字の十字特徴の向きが左向きであり、
前記同一側が左側であると、前記文字の十字特徴の向きが右向きであることを特徴とする請求項11に記載の原稿方向の検出装置。
【請求項13】
前記文字は、
第3の筆画ノードの上部または下部に連結される第4の筆画ノードの数が1であり、前記第3の筆画ノードの幅がその高さの2倍よりも大きいという条件と、
前記第4の筆画ノードに連結される貫通ノードがあり、且つ前記貫通ノードが前記第3の筆画ノードの中間部に位置するという条件と、
前記第3の筆画ノードに連結される筆画が全て前記直筆画である、或は前記第3の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画であるという条件を同時に満たすと、前記縦方向十字特徴構造とされることを特徴とする請求項10に記載の原稿方向の検出装置。
【請求項14】
前記第3の筆画ノードに連結される筆画が全て前記直筆画である場合、
前記第3の筆画ノードの下部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが上向きであり、
前記第3の筆画ノードの上部に2つの他の筆画ノードが連結されたとき、前記文字の十字特徴の向きが下向きであり、
前記第3の筆画ノードに連結される筆画が1つの前記非直筆画を除いて全部前記直筆画である場合、
前記非直筆画が前記第3の筆画ノードの下部に位置するとき、前記文字の十字特徴の向きが上向きであり、
前記非直筆画が前記第3の筆画ノードの上部に位置するとき、前記文字の十字特徴の向きが下向きであることを特徴とする請求項13に記載の原稿方向の検出装置。
【請求項15】
前記検出モジュールは、
前記十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計する統計ユニットと、
最も多い数に対応する十字特徴の向きを前記原稿方向に設定する設定ユニットと、
を含むことを特徴とする請求項9乃至14のいずれか1項に記載の原稿方向の検出装置。
【請求項16】
前記原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、前記原稿の十字特徴の向きが前記所定の向きになるまで、前記原稿を補正する補正モジュールを更に含むことを特徴とする請求項15に記載の原稿方向の検出装置。
発明の詳細な説明 【技術分野】
【0001】
本発明は、画像処理分野に関し、詳しくは原稿方向の検出方法及び装置に関する。
【背景技術】
【0002】

従来、走査装置により画像を走査する場合に、画像の最初のセット方向に基づいて画像が形成されることが知られている。画像が斜めに或は逆向きにセットされると、ユーザの手に入る走査後の画像形成結果も斜め或は逆向きになる。走査される画像が原稿である場合、斜め或は逆向きの方向が混乱している画像形成結果を得る恐れがある。
原稿の画像形成結果に対して原稿方向の検出を行うことができないため、正確な読み方向が得られない。従って、ユーザがそれらを複数回に回転すること、即ち、人力補正により、正確な読み方向を得る必要があり、とても面倒なことになる。
上述した問題点を解決するために、関連技術には、原稿における文字を認識してその認識結果に基づいて原稿方向を判定する原稿方向の検出方法が提案されている。
【発明の概要】
【発明が解決しようとする課題】
【0003】

ところが、発明者は、上記方法を実現する際に、当該方法では、検出中において文字認識を先に完成しなければならないことに起因して、要求される計算量が大きくなり、長い遅延時間や高コストの欠点があることが分かった。
本発明は、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題を解決できる原稿方向の検出方法を提供することを目的とする。
【課題を解決するための手段】
【0004】

本発明において、原稿を走査して原稿の文字の筆画図を得るステップと、筆画図により文字の十字特徴を抽出するステップと、十字特徴により原稿方向を検出するステップとを含み、前記筆画図により前記文字の十字特徴を抽出するステップは、前記筆画図の筆画ノード、直筆画、非直筆画及びそれらの連結関係により、前記文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出するステップと、前記文字が前記横方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを左向きまたは右向きとして抽出するステップと、前記文字が前記縦方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを上向きまたは下向きとして抽出するステップと、を含む原稿方向の検出方法が提供されている。
本発明において、原稿を走査して原稿の文字の筆画図を得る走査モジュールと、筆画図により文字の十字特徴を抽出する抽出モジュールと、十字特徴により原稿方向を検出する検出モジュールとを含み、前記抽出モジュールは、前記筆画図の筆画ノード、直筆画、非直筆画及びそれらの連結関係により、前記文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出する十字特徴構造抽出ユニットと、前記十字特徴構造に基づいて、さらに前記文字の十字特徴の向きを抽出し、前記文字が前記横方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを左向きまたは右向きとして抽出し、前記文字が前記縦方向十字特徴構造の場合、さらに前記文字の十字特徴の向きを上向きまたは下向きとして抽出する十字特徴向き抽出ユニットと、を含む原稿方向の検出装置も提供されている。

【発明の効果】
【0005】

十字特徴により原稿方向を検出し、これを走査装置による原稿方向自動補正の基礎とするため、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題が解消され、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果が実現される。
【図面の簡単な説明】
【0006】

【図1】本発明の一実施例に係る原稿方向の検出方法を示すフローチャートである。
【図2】本発明の一実施例に係る検出方法の筆画ノードを示す模式図である。
【図3】図2に対応する筆画図である。
【図4】1文字の模式図である。
【図5】図4に対応する筆画図である。
【図6】本発明の一実施例に係る貫通関係を示す模式図である。
【図7】本発明の一実施例に係る横方向十字特徴構造を示す模式図である。
【図8】本発明の一実施例に係る縦方向十字特徴構造を示す模式図である。
【図9】本発明の他の実施例に係る原稿方向の検出装置を示す構成図である。

【発明を実施するための最良の形態】
【0007】
以下、図面を参照した上で、実施例に基づいて、本発明を詳しく説明する。
図1には、本発明の一実施例に係る原稿方向の検出方法を示すフローチャートである。この原稿方向の検出方法は、原稿を走査して原稿における文字の筆画図を得るステップS10と、筆画図により文字の十字特徴を抽出するステップS20と、十字特徴により原稿方向を検出するステップS30とを含む。
本実施例において、まず、原稿を一回走査して文字の筆画情報を含む筆画図を取得し、次に筆画図からその十字特徴を抽出し、最後に十字特徴により原稿方向を検出する。この十字特徴による方法により、原稿方向の正確な検出を実現でき、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題が解消され、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果が実現される。
また、ステップS20は、具体的に、筆画図における筆画ノードbody、直筆画wing、非直筆画及びそれらの連結関係により、文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出することと、文字が横方向十字特徴構造である場合、さらに文字の十字特徴の向きを左向きまたは右向きとして抽出することと、文字が縦方向十字特徴構造である場合、さらに文字の十字特徴の向きを上向きまたは下向きとして抽出することを含む。
本実施例において、まず、筆画図から文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出し、次に文字の十字特徴の向きをさらに抽出し、横方向構造の場合、向きを左向きまたは右向きとし、縦方向構造の場合は、向きを上向きまたは下向きとする。筆画図は、原稿を走査して得られたものであり、筆画ノード、直筆画、非直筆画など、文字を構成する基本要素の間の連結関係を反映しているため、筆画図から文字の十字特徴を抽出するのは完全に実行できる。
プログレッシブ記録された画像において、同じ階調値を有する幾つかの画素からなるシーケンスがラン(run)と呼ばれ、ランの中の画像数がランレングス(run-length)と呼ばれている。文字に対して画像処理をするとき、run-lengthの近い隣接ランを連結して筆画ノード(Stroke Node)を得ることができる。図2に示すように、点線楕円ボックスで表した領域において、各ランのrun-lengthが近く、互いに大きな差がない。即ち、各点線ボックスは一つのStroke Nodeに対応する。図2の文字「大」は、合計6つのStroke Nodeがある。
Stroke Nodeの基本種類は、横画、縦画、点、左払い、右払いを含む。また、Stroke Nodeには、位置や長さなどの属性が含まれている。
筆画ノード間の連結関係をグラフで表すと、筆画図(Stroke Graph)が得られる。図3には、基本種類のStroke Nodeで図2の文字の原始画像を表す、図2に対応する筆画図を示す。筆画図において、辺を用いて筆画ノード間の連結関係を表し、マトリックス構造で連結関係を記憶する。図5は、図4に示す文字に対応する筆画図である。図5には、合計(0~17)の18個の筆画ノードがある。それらの連結関係は、辺を用いて(3, 0)、(3, 2)、(4, 3)、(6, 5)、(7, 4)、(7, 6)、(9, 7)、(10, 7)、(11, 8)、(12, 8)、(13, 9)、(13, 12)、(14, 13)、(14, 11)、(15, 10)、(17, 14)と表すことができる。各辺はそれぞれ数字対に表され、この数字対の要素が、隣接する2つの筆画ノードの番号である。
筆画は、a)1つ又は複数の筆画ノードを連結してなる、b)一方の端部が筆画ノードに連結され、他方の端部が1つの辺のみを有する、c)他の筆画ノードの辺がいずれも2つあり、且つそれぞれ上方と下方に位置する、d)各筆画ノードの平均幅が近似するという条件を満たすと、直筆画と見なされる。
図6には、本発明の一実施例に係る貫通関係の模式図を示す。連結関係は貫通関係を含む。2つの筆画ノードは、同一筆画ノードに繋がる上下の2筆画ノードそれぞれの連結箇所のrun-lengthの中心点であるbcxとhcxとの距離wが該同一筆画ノードの高さhより小さく、且つ上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされる。
本実施例において、上述した関係を満たしている2つの筆画ノードは、互いの貫通ノードと設定されている。貫通関係は、重要な連結関係であって、文字の十字特徴を抽出する基礎でもある。
図7には、本発明の一実施例に係る横方向十字特徴構造の模式図を示す。文字は、その2つの直筆画wingが同一の筆画ノードbodyに連結され、且つ貫通関係を有するという条件と、筆画ノードbodyの端点から直筆画の境界までの距離が直筆画wingの平均run-length幅の1/2よりも大きいという条件と、筆画ノードbodyに連結される他の筆画ノードがいずれも直筆画wingに対して同一側に位置するという条件を同時に満たすと、横方向十字特徴構造とされる。
本実施例において、文字の直筆画wingと筆画ノードbodyとが貫通連結であるか否か、それらの距離、および他の筆画ノードの位置によれば、文字の十字特徴構造を横方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、同一側が右側であると、文字の十字特徴の向きが左向きであり、同一側が左側であると、文字の十字特徴の向きが右向きである。
本実施例において、横方向十字特徴構造を得た後、筆画ノードbodyに連結される他の筆画ノードが直筆画wingの左側に位置するか、右側に位置するかを判定するだけで、横方向十字特徴の向きを得ることができる。図7には、筆画ノードbodyに連結される他の筆画ノードが直筆画wingの左側に位置するため、当該文字の十字特徴の向きが右向きであることがわかった。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
図8には、本発明の一実施例に係る縦方向十字特徴構造の模式図を示す。文字は、第1の筆画ノードbodyの上部に連結される第2の筆画ノードの数が1、即ちupNum=1であり、downNumの値が1又は2でもよく、第1の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第2の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第1の筆画ノードbodyの中間部に位置するという条件と、第1の筆画ノードbodyに連結される筆画が全て直筆画である、或は第1の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
また、文字は、第1の筆画ノードbodyの下部に連結される第2の筆画ノードの数が1、即ちdownNum=1であり、upNumの値が1又は2でもよく、第1の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第2の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第1の筆画ノードbodyの中間部に位置するという条件と、第1の筆画ノードbodyに連結される筆画が全て直筆画である、或は第1の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
本実施例において、文字の第1の筆画ノードbodyに連結される第2の筆画ノードの数、第1の筆画ノードbodyの幅と高さの比、第2の筆画ノードは貫通ノードがあるか否か、当該貫通ノードと第1の筆画ノードbodyとの関係、及び第1の筆画ノードbodyに連結される筆画の性質によれば、文字の十字特徴構造を縦方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、第1の筆画ノードbodyに連結される筆画が全て直筆画である場合、第1の筆画ノードbodyの下部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが上向きであり、第1の筆画ノードbodyの上部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが下向きである。
また、第1の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画である場合、非直筆画が第1の筆画ノードbodyの下部に位置するとき、文字の十字特徴の向きが上向きであり非直筆画が第1の筆画ノードbodyの上部に位置するとき、文字の十字特徴の向きが下向きである。
本実施例において、縦方向十字特徴構造を得た後、第1の筆画ノードbodyに連結される他の筆画ノードが第1の筆画ノードbodyの上部に位置するか、下部に位置するかを判定するだけで、縦方向十字特徴の向きを得ることができる。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
また、ステップS30は、十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計することと、最も多い数に対応する十字特徴の向きを原稿方向に設定することを含む。
本実施例において、原稿中の大量の文字の十字特徴の向きを統計することにより、左向き、右向き、上向き、下向きのそれぞれに対応する文字数を取得し、文字数の最も多い向きを原稿方向として設定する。即ち、筆画図から抽出された十字特徴の向きを原稿方向の検出の基礎とする。これにより、本実施例の原稿方向検出方法によれば、原稿方向の検出速度が加速され、原稿方向の検出精度が向上する。
また、原稿方向の検出方法は、原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、原稿の十字特徴の向きが前記所定の向きになるまで、原稿を補正するステップを更に含む。
本実施例において、検出された原稿方向に基づいて所定の向きでない原稿を補正することにより、ユーザが読みやすい所定の向きの原稿を得る。
図9には、本発明の他の実施例に係る原稿方向の検出装置の構成図を示す。この原稿方向の検出装置は、原稿を走査して原稿の文字の筆画図を得る走査モジュール10と、筆画図により文字の十字特徴を抽出する抽出モジュール20と、十字特徴により原稿方向を検出する検出モジュール30とを含む。
本実施例において、まず、走査モジュール10により原稿を一回走査して文字の筆画情報を含む筆画図を取得し、次に抽出モジュール20により筆画図からその十字特徴を抽出し、最後に検出モジュール30により十字特徴に基づいて原稿方向を検出する。この十字特徴による原稿方向の検出装置は、原稿方向の正確な検出を実現でき、関連技術に要求された大量の計算量による長い遅延時間や高コストの問題を解消し、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果を実現している。
また、抽出モジュール20は、筆画図の筆画ノードbody、直筆画wing、非直筆画及びそれらの連結関係により、文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出する十字特徴構造抽出ユニットと、十字特徴構造に基づいて、さらに文字の十字特徴の向きを抽出し、文字が横方向十字特徴構造である場合、さらに文字の十字特徴の向きを左向きまたは右向きとして抽出し、文字が縦方向十字特徴構造である場合、さらに文字の十字特徴の向きを上向きまたは下向きとして抽出する十字特徴向き抽出ユニットとを含む。
本実施例において、まず、十字特徴構造抽出ユニットにより筆画図から文字の十字特徴構造を横方向十字特徴構造または縦方向十字特徴構造として抽出し、次に十字特徴向き抽出ユニットによりさらに文字の十字特徴の向きを抽出し、横方向構造である場合、向きを左向きまたは右向きとし、縦方向構造である場合は、向きを上向きまたは下向きとする。筆画図は、原稿を走査して得られたものであり、筆画ノードbody、直筆画wing、非直筆画など、文字を構成する基本要素の間の連結関係を反映しているため、筆画図から文字の十字特徴を抽出するのは完全に実行できる。
また、連結関係は貫通関係を含み、2つの筆画ノードは、同一筆画ノードに繋がる上下の2筆画ノードそれぞれの連結箇所のrun-lengthの中心点間の距離が該同一筆画ノードの高さより小さく、且つ上下の2筆画ノードの鉛直方向の投影は重なり合う部分があるという条件を満たすと、互いの貫通ノードとされ、連結関係が貫通関係とされる。
本実施例において、上述した関係を満たしている2つの筆画ノードは、互いの貫通ノードと設定されている。貫通関係は、重要な連結関係であって、文字の十字特徴を抽出する基礎でもある。
また、文字は、その2つの直筆画wingが同一の筆画ノードbodyに連結され、且つ貫通関係を有するという条件と、筆画ノードbodyの端点から直筆画の境界までの距離が直筆画wingの平均run-length幅の1/2よりも大きいという条件と、筆画ノードbodyに連結される他の筆画ノードがいずれも直筆画wingに対して同一側に位置するという条件を同時に満たすと、横方向十字特徴構造とされる。
本実施例において、文字の直筆画wingと筆画ノードbodyとが貫通連結であるか否か、それらの距離、および他の筆画ノードの位置によれば、文字の十字特徴構造を横方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、同一側が右側であると、文字の十字特徴の向きが左向きであり、同一側が左側であると、文字の十字特徴の向きが右向きである。
本実施例において、横方向十字特徴構造を得た後、筆画ノードbodyに連結される他の筆画ノードが直筆画wingの左側に位置するか、右側に位置するかを判定するだけで、横方向十字特徴の向きを得ることができる。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
また、文字は、第3の筆画ノードbodyの上部に連結される第4の筆画ノードの数が1、即ちupNum=1であり、downNumの値が1又は2でもよく、第3の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第4の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第3の筆画ノードbodyの中間部に位置するという条件と、第3の筆画ノードbodyに連結される筆画が全て直筆画である、或は第3の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
また、文字は、第3の筆画ノードbodyの下部に連結される第4の筆画ノードの数が1、即ちdownNum=1であり、upNumの値が1又は2でもよく、第3の筆画ノードbodyの幅がその高さの2倍よりも大きいという条件と、第4の筆画ノードに連結される貫通ノードがあり、且つ貫通ノードが第3の筆画ノードbodyの中間部に位置するという条件と、第3の筆画ノードbodyに連結される筆画が全て直筆画である、或は第3の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画であるという条件を同時に満たすと、縦方向十字特徴構造とされる。
本実施例において、文字の第3の筆画ノードbodyに連結される第4の筆画ノードの数、第3の筆画ノードbodyの幅と高さの比、第4の筆画ノードは貫通ノードがあるか否か、当該貫通ノードと第3の筆画ノードbodyとの関係、及び第3の筆画ノードbodyに連結される筆画の性質によれば、文字の十字特徴構造を縦方向十字特徴構造として抽出することができる。本実施例が簡単で直観的である。
また、第3の筆画ノードbodyに連結される筆画が全て直筆画である場合、第3の筆画ノードbodyの下部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが上向きであり、第3の筆画ノードbodyの上部に2つの他の筆画ノードが連結されたとき、文字の十字特徴の向きが下向きである。
また、第3の筆画ノードbodyに連結される筆画が1つの非直筆画を除いて全部直筆画である場合、非直筆画が第3の筆画ノードbodyの下部に位置するとき、文字の十字特徴の向きが上向きであり、非直筆画が第3の筆画ノードbodyの上部に位置するとき、文字の十字特徴の向きが下向きである。
本実施例において、縦方向十字特徴構造を得た後、第3の筆画ノードbodyに連結される他の筆画ノードが第3の筆画ノードbodyの上部に位置するか、下部に位置するかを判定するだけで、縦方向十字特徴の向きを得ることができる。本実施例は、簡単で直観的である。その上、判定標準が明確で、誤判定率が低いため、検出精度が確保される。
また、検出モジュール30は、十字特徴の向きがそれぞれ左向き、右向き、上向き、下向きである原稿中の文字の数を統計する統計ユニットと、最も多い数に対応する十字特徴の向きを原稿方向に設定する設定ユニットとを含む。
本実施例において、統計ユニットにより原稿中の大量の文字の十字特徴の向きを統計して、左向き、右向き、上向き、下向きのそれぞれに対応する文字数を取得し、設定ユニットにより文字数の最も多い向きを原稿方向に設定する。即ち、筆画図から抽出された十字特徴の向きを原稿方向の検出の基礎とする。これにより、本実施例の原稿方向検出装置によれば、原稿方向の検出速度が加速され、原稿方向の検出精度が向上する。
また、原稿方向の検出装置は、原稿の十字特徴の向きが、左向き、右向き、上向き、下向きのいずれかである所定の向きではないとき、原稿の十字特徴の向きが前記所定の向きになるまで、原稿を補正する補正モジュールを更に含む。
本実施例の補正モジュールは、検出された原稿方向に基づいて所定の向きでない原稿を補正することにより、ユーザが読みやすい所定の向きの原稿を得る。
以上の説明から、本発明の上記実施例によれば、計算量が小さくなり、原稿方向の正確な検出を高速に行うことができ、正確な読み方向を得やすい効果が実現されることが分かった。
なお、上述した本発明の各モジュールや各ステップは、汎用の計算装置で実現することができ、単一の計算装置に集積してもよく、複数の計算装置からなるネットワークに配置してもよい。また、各モジュールや各ステップは、計算装置が実行可能なプログラムコードで実現することができる。従って、それらを記憶装置に記憶して計算装置に実行させてもよく、それぞれ各集積回路モジュールとして作成してもよく、それらのうちの複数のモジュール又はステップを単一の集積回路モジュールとして作成して実現してもよい。このように、本発明は、如何なる特定のハードウェアとソフトウェアとの組合せに限定されない。
以上は、本発明の好適な実施例に過ぎず、本発明を限定するものではない。本発明は、様々な変更や変形が可能である。本発明の精神及び原則を逸脱しない範囲で、如何なる変更、同等代替、改良なども本発明の保護範囲内に含まれる。
【符号の説明】
【0008】
10 走査モジュール
20 抽出モジュール
30 検出モジュール
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8