TOP > 国内特許検索 > 画像認識装置、画像認識方法及びプログラム

画像認識装置、画像認識方法及びプログラム

国内特許コード P09A014761
掲載日 2009年10月30日
出願番号 特願2005-376676
公開番号 特開2007-179285
登録番号 特許第4691659号
出願日 平成17年12月27日(2005.12.27)
公開日 平成19年7月12日(2007.7.12)
登録日 平成23年3月4日(2011.3.4)
発明者
  • 山川 烈
  • 堀尾 恵一
  • 相川 暁
出願人
  • 国立大学法人九州工業大学
発明の名称 画像認識装置、画像認識方法及びプログラム
発明の概要

【課題】複雑な調整を要せず、しかも短時間で入力画像に示される記述内容の認識を行うこと。
【解決手段】入力画像を取得する入力画像取得部32と、入力画像における所定数の注視点を判定する注視点判定部34と、入力画像における前記各注視点の位置の部分画像に関するデータ(特徴データ)を生成する特徴データ生成部38と、複数の記述内容のそれぞれに対応づけて、該記述内容を示すテンプレート画像における前記所定数の注視点の位置の部分画像のそれぞれに関するデータ(特徴データ)を記憶する部分テンプレート画像特徴データ記憶部40と、を含み、入力画像に係る特徴データと、前記各記述内容に対応づけて前記部分テンプレート画像特徴データ記憶部40に記憶される特徴データと、に基づいて、入力画像に示される記述内容を判定する。
【選択図】図18

従来技術、競合技術の概要


従来、パターン認識の手法は数多く提案されているが、その中で下記非特許文献1に開示されたネオコグニトロンは、入力画像の局所的な特徴を階層型ニューラルネットワークの各層で抽出するとともに、それらを段階的に統合して、最終的な入力画像のパターン認識を行うものであって、位置ずれ、拡大、縮小に強い画像認識を可能とする技術として知られている。

【非特許文献1】福島邦彦著,「神経回路網と情報処理」,朝倉書店,1989年

産業上の利用分野


本発明は画像認識装置、画像認識方法及びプログラムに関し、特に入力画像からそこに示される記述内容を判定する画像認識装置、画像認識方法及びプログラムに関する。

特許請求の範囲 【請求項1】
入力画像を取得する入力画像取得手段と、
所定数のユニットが配置された競合層を備える自己組織化マップに、前記入力画像における記述箇所の位置座標のベクトルを入力することにより、前記競合層の前記所定数のユニットの重みベクトルを更新し、更新後の前記所定数のユニットの重みベクトルを、前記入力画像における前記所定数の注視点の位置座標のベクトルとして取得する注視点判定手段と、
前記入力画像における前記各注視点の位置の部分画像を前記入力画像から抽出するとともに、それら部分画像に基づいて、該部分画像に示される記述内容の一部の延伸方向を示すデータを生成する部分入力画像データ生成手段と、
判定結果として用いられる複数の記述内容のそれぞれに対応づけて、該記述内容を示すテンプレート画像における前記所定数の注視点の位置の部分画像のそれぞれに示される該記述内容の一部の延伸方向を示すデータを記憶する部分テンプレート画像データ記憶手段と、
前記部分入力画像データ生成手段により生成されるデータと、前記各記述内容に対応づけて前記部分テンプレート画像データ記憶手段に記憶されるデータと、に基づいて、前記入力画像に示される記述内容を判定する記述内容判定手段と、
を含むことを特徴とする画像認識装置。

【請求項2】
請求項に記載の画像認識装置において、
前記部分テンプレート画像データ記憶手段は、前記各記述内容を示すテンプレート画像の前記所定数の注視点の位置の部分画像のデータのそれぞれを、前記所定数のユニットのいずれかに対応づけて記憶し、
前記記述内容判定手段は、前記各記述内容について、相互に対応関係にあるユニットに対応づけられた、前記入力画像に係るデータと前記各テンプレート画像に係るデータとの各相関量を算出するとともに、それら相関量に基づいて前記入力画像に示される記述内容を判定する、
ことを特徴とする画像認識装置。

【請求項3】
請求項に記載の画像認識装置において、
前記自己組織化マップの前記競合層には、前記所定数のユニットが回転対称性を有するようにして配置され、
前記記述内容判定手段は、前記回転対称性に従って前記対応関係を変更しながら、前記入力画像に係るデータと前記各テンプレート画像に係るデータとの相関量を算出する、
ことを特徴とする画像認識装置。

【請求項4】
請求項1乃至3のいずれかに記載の画像認識装置において、
前記部分入力画像データ生成手段は、適応部分空間自己組織化マップに前記入力画像における前記各注視点の位置の部分画像を入力し、前記適応部分空間自己組織化マップの応答を、該部分画像に示される記述内容の一部の延伸方向を示すデータとして取得する、
ことを特徴とする画像認識装置。

【請求項5】
入力画像を取得する入力画像取得ステップと、
所定数のユニットが配置された競合層を備える自己組織化マップに、前記入力画像における記述箇所の位置座標のベクトルを入力することにより、前記競合層の前記所定数のユニットの重みベクトルを更新し、更新後の前記所定数のユニットの重みベクトルを、前記入力画像における前記所定数の注視点の位置座標のベクトルとして取得する注視点判定ステップと、
前記入力画像における前記各注視点の位置の部分画像を前記入力画像から抽出するとともに、それら部分画像に基づいて、該部分画像に示される記述内容の一部の延伸方向を示すデータを生成する部分入力画像データ生成ステップと、
判定結果として用いられる複数の記述内容のそれぞれに対応づけて、該記述内容を示すテンプレート画像における前記所定数の注視点の位置の部分画像のそれぞれに示される該記述内容の一部の延伸方向を示すデータを記憶する部分テンプレート画像データ記憶手段を参照して、前記部分入力画像データ生成手段により生成されるデータと、前記各記述内容に対応づけて前記部分テンプレート画像データ記憶手段に記憶されるデータと、に基づいて、前記入力画像に示される記述内容を判定する記述内容判定ステップと、
を含むことを特徴とする画像認識方法。

【請求項6】
入力画像を取得する入力画像取得手段、
所定数のユニットが配置された競合層を備える自己組織化マップに、前記入力画像における記述箇所の位置座標のベクトルを入力することにより、前記競合層の前記所定数のユニットの重みベクトルを更新し、更新後の前記所定数のユニットの重みベクトルを、前記入力画像における前記所定数の注視点の位置座標のベクトルとして取得する注視点判定手段と、
前記入力画像における前記各注視点の位置の部分画像を前記入力画像から抽出するとともに、それら部分画像に基づいて、該部分画像に示される記述内容の一部の延伸方向を示すデータを生成する部分入力画像データ生成手段、
判定結果として用いられる複数の記述内容のそれぞれに対応づけて、該記述内容を示すテンプレート画像における前記所定数の注視点の位置の部分画像のそれぞれに示される該記述内容の一部の延伸方向を示すデータを記憶する部分テンプレート画像データ記憶手段、及び
前記部分入力画像データ生成手段により生成されるデータと、前記各記述内容に対応づけて前記部分テンプレート画像データ記憶手段に記憶されるデータと、に基づいて、前記入力画像に示される記述内容を判定する記述内容判定手段
としてコンピュータを機能させるためのプログラム。

産業区分
  • 計算機応用
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2005376676thum.jpg
出願権利状態 権利存続中
詳細は、下記「問合せ先」まで直接お問い合わせください。


PAGE TOP

close
close
close
close
close
close
close