TOP > 中国の大学の特許 > 北京大学の特許一覧 > 原稿レイアウトの方向検出方法及び装置

原稿レイアウトの方向検出方法及び装置

国内特許コード P150011732
掲載日 2015年3月30日
出願番号 特願2010-101990
公開番号 特開2011-188465
出願日 平成22年4月27日(2010.4.27)
公開日 平成23年9月22日(2011.9.22)
優先権データ
  • 201010119229.9 (2010.3.5) CN
発明者
  • 六尾 敏明
  • リー ピンリ
  • チャン ホンジー
  • ユエン モンヨウ
出願人
  • 京セラドキュメントソリューションズ株式会社
  • 方正国際軟件(北京)有限公司
  • 北京大学
発明の名称 原稿レイアウトの方向検出方法及び装置
発明の概要 【課題】複雑な原稿レイアウトに対し正確な検出結果を得られないという問題を解決できる原稿レイアウトの方向検出方法及び装置を提供する。
【解決手段】本発明の原稿レイアウトの方向検出方法は、原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、複数の文字ユニットの言語類別属性を決定するステップと、言語類別属性に基づいて複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量(global statistics)に取り入れるステップと、全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップと、各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及びその対応する全体の信頼度を決定するステップとを含む。
【選択図】図1
従来技術、競合技術の概要
デジタル文書交換が次第に現代通信の主流方式になっているにもかかわらず、契約、有価シートなどの、法律効力と認証の必要がある内容を有するものは、紙文書の形式で伝達、保存しなければならない。そのような紙文書の管理及び内容の伝達を行うために、走査によってデジタル化させる必要がある。日常の執務場所及び文書を集めて管理する機構において、大量の紙文書の走査に対する需要がきわめて大きい。
大量の紙文書を走査する際に、文書のすべてを正方向に配置しなければならない。事後、文書方向を補正する方法としては、一枚ずつ人為的にざっと見て画像を回転させる方法と、コンピュータープログラムによって自動的に文書画像の方向を認識して正方向に回転させる方法がある。事後文書方向を自動的に判定する方法としては、OCR(Optical Character Recognition, 光学的文字認識)技術によって文書画像中の文字を認識してレイアウト方向を判断する方法と、特徴認識アルゴリズムによってレイアウト方向を判断する方法がある。
国内外の関連特許及び文献にも、原稿レイアウトの検出技術が記載されている。1991年に、「高速レイアウト方向検出」という名称の特許文献1においてローマ字の上がり下がりと文字の書字方向との間の関係が提案された。1998年に、「複雑で、不明晰である無方向性の文書画像の言語認識」という名称の文章において、ベルの実験研究者によりアジア文字の書字方向に関連する特徴が提案された。これらの特許及び文献は、原稿レイアウトにおけるキャラクター又は句読点特徴と書字方向との関係を尋ねることに力を注いだ。

産業上の利用分野 本発明は、画像処理分野に関し、詳しくは原稿レイアウト方向の検出方法及び装置に関する。

特許請求の範囲 【請求項1】
原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、前記複数の文字ユニットの言語類別属性を決定するステップと、
前記言語類別属性に基づいて前記複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量に取り入れるステップと、
前記全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップと、
前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて前記原稿レイアウトの方向及び対応する全体の信頼度を決定するステップとを、含むことを特徴とする原稿レイアウトの方向検出方法。

【請求項2】
請求項1において、
原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分けるステップは、
原稿レイアウトの画像を2値化させた後、連結領域検出を行うことと、
検出された連結領域に対し、それぞれ水平及び垂直方向に行検出を行うことと、
1行に連結された前記連結領域の行内連結領域の数、行内連結領域のサイズ及び相対的位置関係、並びに行内連結領域の複雑度に基づいて前記連結領域が文字行であるか否かを判定することと、
文字行と判定された前記連結領域を文字領域とし、前記文字行を分けて文字ユニットを得ることと、
を含むことを特徴とする原稿レイアウトの方向検出方法。

【請求項3】
請求項2において、
原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、前記複数の文字ユニットの言語類別属性を決定するステップは、
前記文字ユニットの文字連結領域の内部連結領域のサイズ、形態及び相対的位置関係に基づいてその言語属性特徴値を決定することと、
前記言語属性特徴値を、予めデータベースに記憶されている対応する参考値と比較して、前記文字ユニットの言語類別属性を決定することと、
をさらに含むことを特徴とする原稿レイアウトの方向検出方法。

【請求項4】
請求項1において、
前記全体の統計量における各書字方向属性特徴値に基づいてそれぞれ前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップは、
前記各書字方向属性特徴値を、予めデータベースに記憶されている参考値と比較して、前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を決定することを含むことを特徴とする原稿レイアウトの方向検出方法。

【請求項5】
請求項1において、
前記文字ユニットは、少なくともローマ単語、アジア文字セグメント及び句読点のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出方法。

【請求項6】
請求項1において、
前記言語類別は、少なくともアジア言語類別及びローマ字言語類別のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出方法。

【請求項7】
請求項4において、
前記書字方向特徴は、少なくともアジア文字の左右払い特徴、ローマ字言語文字の開口方向特徴と上がり下がり特徴、及び句読点の文字に対する位置特徴のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出方法。

【請求項8】
原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、前記複数の文字ユニットの言語類別属性を決定する分割モジュールと、
前記言語類別属性に基づいて前記複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量に取り入れる第1の算出モジュールと、
前記全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得する第2の算出モジュールと、
前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて前記原稿レイアウトの方向及びその対応する全体の信頼度を決定する第3の算出モジュールを、含むことを特徴とする原稿レイアウトの方向検出装置。

【請求項9】
請求項8において、
前記分割モジュールは、
原稿レイアウトの画像を2値化させた後、連結領域検出を行う連結領域検出ユニットと、
検出された連結領域に対し、それぞれ水平及び垂直方向に行検出を行う行検出ユニットと、
1行に連結された前記連結領域の行内連結領域の数、行内連結領域のサイズ及び相対的位置関係、並びに行内連結領域の複雑度に基づいて前記連結領域が文字行であるか否かを判定する文字行判定ユニットと、
文字行と判定された前記連結領域を文字領域とし、前記文字行を分けて文字ユニットを得る分割ユニットと、
を含むことを特徴とする原稿レイアウトの方向検出装置。

【請求項10】
請求項8において、
前記第1の算出モジュールは、
前記文字ユニットの文字連結領域の内部連結領域のサイズ、形態及び相対的位置関係に基づいてその言語属性特徴値を決定する属性特徴値ユニットと、
前記言語属性特徴値を、予めデータベースに記憶されている対応する参考値と比較して、前記文字ユニットの言語類別属性を決定する第1の比較ユニットと、
をさらに含むことを特徴とする原稿レイアウトの方向検出装置。

【請求項11】
請求項8において、
前記第2の算出モジュールは、
前記各書字方向属性特徴値を、予めデータベースに記憶されている参考値と比較して、前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を決定する第2の比較ユニットを含むことを特徴とする原稿レイアウトの方向検出装置。

【請求項12】
請求項9において、
前記文字ユニットは、少なくともローマ単語、アジア文字セグメント及び句読点のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出装置。

【請求項13】
請求項8において、
前記言語類別は、少なくともアジア言語類別及びローマ字言語類別のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出装置。

【請求項14】
請求項11において、
前記書字方向特徴は、少なくとも、アジア文字の左右払い特徴、ローマ字言語文字の開口方向特徴と上がり下がり特徴、及び句読点の文字に対する位置特徴のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出装置。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2010101990thum.jpg
出願権利状態 公開
分野
  • 電気
  • 物理学
※ 特許の内容に興味を持たれた方は、下記問合せ先にご相談下さい。


PAGE TOP

close
close
close
close
close
close