Top > Search of Japanese Patents > DOCUMENT PROCESSING APPARATUS, METHOD AND PROGRAM

DOCUMENT PROCESSING APPARATUS, METHOD AND PROGRAM meetings

Patent code P06P003723
File No. A222P33
Posted date Dec 13, 2006
Application number P2005-150406
Publication number P2006-332823A
Patent number P4230478
Date of filing May 24, 2005
Date of publication of application Dec 7, 2006
Date of registration Dec 12, 2008
Inventor
  • (In Japanese)寅市 和男
  • (In Japanese)諸岡 泰男
Applicant
  • (In Japanese)国立研究開発法人科学技術振興機構
Title DOCUMENT PROCESSING APPARATUS, METHOD AND PROGRAM meetings
Abstract PROBLEM TO BE SOLVED: To provide a document processing apparatus, method and program which can generate a document file capable of relieving the load of a document processing.
SOLUTION: The document processing apparatus includes: a partial image extract section 20 that extracts one or more partial images included in either of text document areas and non-text areas from the document file wherein the text document areas and the non-text areas are mixed; a layout information generating section 40 for generating layout information of the partial images extracted by the partial image extract section 20; a functionalized processing section 30 for applying functional approximation processing to the partial images extracted by the partial image extract section 20 to extract a feature quantity; and a document file storage section 50 for storing the feature quantity extracted by the functionalized processing section 30 on the basis of the layout information produced by the layout information generating section 40.
Outline of related art and contending technology (In Japanese)

従来から、XML、SGML、HTMLなどの論理構造言語によって文書処理を行う手法が知られている(例えば、特許文献1~4参照。)。これらの論理構造言語を用いることにより、コンピュータに適した形式で文書を処理することが可能になる。
【特許文献1】
特開平11-250041号公報(第6-21頁、図1-14)
【特許文献2】
特開2003-308311号公報(第3-6頁、図1-6)
【特許文献3】
特開2003-316766号公報(第5-14頁、図1-23)
【特許文献4】
特開2004-178010号公報(第7-18頁、図1-17)

Field of industrial application (In Japanese)

本発明は、文字と各種画像とが混在した文書をコンピュータで扱われる形式に変換する文書処理装置、方法およびプログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
テキスト文書領域と非テキスト文書領域とが混在するビットマップ形式の文書ファイルの中から、前記テキスト文書領域および前記非テキスト領域のいずれかに含まれる輪郭線を有する1つ以上の部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された前記部分画像のレイアウト情報を生成するレイアウト情報生成手段と、
前記部分画像抽出手段によって抽出された前記部分画像に対して関数化近似処理を行って特徴量を抽出する関数化処理手段と、
前記レイアウト情報生成手段によって生成された前記レイアウト情報とともに、前記関数化処理手段によって抽出された特徴量を格納する文書情報格納手段と、
を備えることを特徴とする文書処理装置。

【請求項2】
 
請求項1において、
前記関数化処理手段は、前記部分画像の輪郭形状、濃度分布、色変化などを一あるいは複数の関数で近似する処理を行うことにより前記特徴量の抽出を行うことを特徴とする文書処理装置。

【請求項3】
 
請求項1または2において、
紙媒体に印刷された画像を光学的に読み取って前記文書ファイルを作成する文書ファイル取込手段をさらに備えることを特徴とする文書処理装置。

【請求項4】
 
テキスト文書領域と非テキスト文書領域とが混在するビットマップ形式の文書ファイルの中から、前記テキスト文書領域および前記非テキスト領域のいずれかに含まれる輪郭線を有する1つ以上の部分画像を抽出する部分画像抽出ステップと、
前記部分画像抽出ステップによって抽出された前記部分画像のレイアウト情報を生成するレイアウト情報生成ステップと、
前記部分画像抽出ステップによって抽出された前記部分画像に対して関数化近似処理を行って特徴量を抽出する関数化処理ステップと、
前記レイアウト情報生成ステップによって生成された前記レイアウト情報とともに、前記関数化処理ステップによって抽出された特徴量を格納する文書情報格納ステップと

を有することを特徴とする文書処理方法。

【請求項5】
 
請求項4において、
紙媒体に印刷された画像を光学的に読み取って前記文書ファイルを作成する文書ファイル取込ステップをさらに有することを特徴とする文書処理方法。

【請求項6】
 
コンピュータを、
テキスト文書領域と非テキスト文書領域とが混在するビットマップ形式の文書ファイルの中から、前記テキスト文書領域および前記非テキスト領域のいずれかに含まれる輪郭線を有する1つ以上の部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された前記部分画像のレイアウト情報を生成するレイアウト情報生成手段と、
前記部分画像抽出手段によって抽出された前記部分画像に対して関数化近似処理を行って特徴量を抽出する関数化処理手段と、
前記レイアウト情報生成手段によって生成された前記レイアウト情報とともに、前記関数化処理手段によって抽出された特徴量を格納する文書情報格納手段と、
して機能させる文書処理プログラム。

【請求項7】
 
請求項6において、
コンピュータを、さらに、紙媒体に印刷された画像を光学的に読み取って前記文書ファイルを作成する文書ファイル取込手段として機能させる文書処理プログラム。

【請求項8】
 
請求項1~3のいずれかに記載された前記文書情報格納手段から前記レイアウト情報と前記特徴量を読み出し、前記特徴量に基づいて前記部分画像を復元し、前記レイアウト情報に基づいてこの復元された部分画像の合成を行うことを特徴とする文書表示装置。

【請求項9】
 
請求項1~3のいずれかに記載された前記文書情報格納手段に格納された前記特徴量と、検索対象画像に対応する前記特徴量とに基づいて、前記検索対象画像に類似する前記部分画像の有無を判定することを特徴とする文書検索装置。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2005150406thum.jpg
State of application right Registered
Reference ( R and D project ) CREST New High-Performance Information Processing Technology Supporting Information-Oriented Society - Aiming at the Creation of New High-Speed, Large-Capacity Computing Technology Based on Quantum Effects, Molecular Functions, Parallel Processing, etc.- AREA
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close