Top > Search of Japanese Patents > IMAGE RECOGNITION DEVICE, IMAGE RECOGNITION METHOD AND PROGRAM

IMAGE RECOGNITION DEVICE, IMAGE RECOGNITION METHOD AND PROGRAM

Patent code P09A014761
Posted date Oct 30, 2009
Application number P2005-376676
Publication number P2007-179285A
Patent number P4691659
Date of filing Dec 27, 2005
Date of publication of application Jul 12, 2007
Date of registration Mar 4, 2011
Inventor
  • (In Japanese)山川 烈
  • (In Japanese)堀尾 恵一
  • (In Japanese)相川 暁
Applicant
  • (In Japanese)国立大学法人九州工業大学
Title IMAGE RECOGNITION DEVICE, IMAGE RECOGNITION METHOD AND PROGRAM
Abstract PROBLEM TO BE SOLVED: To recognize description contents shown in an input image in a short time without requiring complicated adjustment.
SOLUTION: This image recognition device includes: an input image acquisition part 32 acquiring an input image; a gazing point decision part 34 deciding a prescribed number of gazing points in the input image; a characteristic data generation part 38 generating data (characteristic data) related to a partial image of a position of each the gazing point in the input image; and a partial template image characteristic data storage part 40 storing the data (characteristic data) related to each of the partial images of the positions of the prescribed number of the gazing points in a template image showing the description contents associatively to each of the plurality of description contents. The description contents shown in the input image are decided on the basis of the characteristic data related to the input image and the characteristic data stored in the partial template image characteristic data storage part 40.
Outline of related art and contending technology (In Japanese)


従来、パターン認識の手法は数多く提案されているが、その中で下記非特許文献1に開示されたネオコグニトロンは、入力画像の局所的な特徴を階層型ニューラルネットワークの各層で抽出するとともに、それらを段階的に統合して、最終的な入力画像のパターン認識を行うものであって、位置ずれ、拡大、縮小に強い画像認識を可能とする技術として知られている。
【非特許文献1】
福島邦彦著,「神経回路網と情報処理」,朝倉書店,1989年

Field of industrial application (In Japanese)


本発明は画像認識装置、画像認識方法及びプログラムに関し、特に入力画像からそこに示される記述内容を判定する画像認識装置、画像認識方法及びプログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
入力画像を取得する入力画像取得手段と、
所定数のユニットが配置された競合層を備える自己組織化マップに、前記入力画像における記述箇所の位置座標のベクトルを入力することにより、前記競合層の前記所定数のユニットの重みベクトルを更新し、更新後の前記所定数のユニットの重みベクトルを、前記入力画像における前記所定数の注視点の位置座標のベクトルとして取得する注視点判定手段と、
前記入力画像における前記各注視点の位置の部分画像を前記入力画像から抽出するとともに、それら部分画像に基づいて、該部分画像に示される記述内容の一部の延伸方向を示すデータを生成する部分入力画像データ生成手段と、
判定結果として用いられる複数の記述内容のそれぞれに対応づけて、該記述内容を示すテンプレート画像における前記所定数の注視点の位置の部分画像のそれぞれに示される該記述内容の一部の延伸方向を示すデータを記憶する部分テンプレート画像データ記憶手段と、
前記部分入力画像データ生成手段により生成されるデータと、前記各記述内容に対応づけて前記部分テンプレート画像データ記憶手段に記憶されるデータと、に基づいて、前記入力画像に示される記述内容を判定する記述内容判定手段と、
を含むことを特徴とする画像認識装置。

【請求項2】
 
請求項1に記載の画像認識装置において、
前記部分テンプレート画像データ記憶手段は、前記各記述内容を示すテンプレート画像の前記所定数の注視点の位置の部分画像のデータのそれぞれを、前記所定数のユニットのいずれかに対応づけて記憶し、
前記記述内容判定手段は、前記各記述内容について、相互に対応関係にあるユニットに対応づけられた、前記入力画像に係るデータと前記各テンプレート画像に係るデータとの各相関量を算出するとともに、それら相関量に基づいて前記入力画像に示される記述内容を判定する、
ことを特徴とする画像認識装置。

【請求項3】
 
請求項2に記載の画像認識装置において、
前記自己組織化マップの前記競合層には、前記所定数のユニットが回転対称性を有するようにして配置され、
前記記述内容判定手段は、前記回転対称性に従って前記対応関係を変更しながら、前記入力画像に係るデータと前記各テンプレート画像に係るデータとの相関量を算出する、
ことを特徴とする画像認識装置。

【請求項4】
 
請求項1乃至3のいずれかに記載の画像認識装置において、
前記部分入力画像データ生成手段は、適応部分空間自己組織化マップに前記入力画像における前記各注視点の位置の部分画像を入力し、前記適応部分空間自己組織化マップの応答を、該部分画像に示される記述内容の一部の延伸方向を示すデータとして取得する、
ことを特徴とする画像認識装置。

【請求項5】
 
入力画像を取得する入力画像取得ステップと、
所定数のユニットが配置された競合層を備える自己組織化マップに、前記入力画像における記述箇所の位置座標のベクトルを入力することにより、前記競合層の前記所定数のユニットの重みベクトルを更新し、更新後の前記所定数のユニットの重みベクトルを、前記入力画像における前記所定数の注視点の位置座標のベクトルとして取得する注視点判定ステップと、
前記入力画像における前記各注視点の位置の部分画像を前記入力画像から抽出するとともに、それら部分画像に基づいて、該部分画像に示される記述内容の一部の延伸方向を示すデータを生成する部分入力画像データ生成ステップと、
判定結果として用いられる複数の記述内容のそれぞれに対応づけて、該記述内容を示すテンプレート画像における前記所定数の注視点の位置の部分画像のそれぞれに示される該記述内容の一部の延伸方向を示すデータを記憶する部分テンプレート画像データ記憶手段を参照して、前記部分入力画像データ生成手段により生成されるデータと、前記各記述内容に対応づけて前記部分テンプレート画像データ記憶手段に記憶されるデータと、に基づいて、前記入力画像に示される記述内容を判定する記述内容判定ステップと、
を含むことを特徴とする画像認識方法。

【請求項6】
 
入力画像を取得する入力画像取得手段、
所定数のユニットが配置された競合層を備える自己組織化マップに、前記入力画像における記述箇所の位置座標のベクトルを入力することにより、前記競合層の前記所定数のユニットの重みベクトルを更新し、更新後の前記所定数のユニットの重みベクトルを、前記入力画像における前記所定数の注視点の位置座標のベクトルとして取得する注視点判定手段と、
前記入力画像における前記各注視点の位置の部分画像を前記入力画像から抽出するとともに、それら部分画像に基づいて、該部分画像に示される記述内容の一部の延伸方向を示すデータを生成する部分入力画像データ生成手段、
判定結果として用いられる複数の記述内容のそれぞれに対応づけて、該記述内容を示すテンプレート画像における前記所定数の注視点の位置の部分画像のそれぞれに示される該記述内容の一部の延伸方向を示すデータを記憶する部分テンプレート画像データ記憶手段、及び
前記部分入力画像データ生成手段により生成されるデータと、前記各記述内容に対応づけて前記部分テンプレート画像データ記憶手段に記憶されるデータと、に基づいて、前記入力画像に示される記述内容を判定する記述内容判定手段
としてコンピュータを機能させるためのプログラム。

IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2005376676thum.jpg
State of application right Registered
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close