TOP > 国内特許検索 > 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム

画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム コモンズ 新技術説明会

国内特許コード P10A015413
掲載日 2010年4月23日
出願番号 特願2008-106546
公開番号 特開2009-258953
登録番号 特許第5018614号
出願日 平成20年4月16日(2008.4.16)
公開日 平成21年11月5日(2009.11.5)
登録日 平成24年6月22日(2012.6.22)
発明者
  • 柳井 啓司
出願人
  • 国立大学法人電気通信大学
発明の名称 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム コモンズ 新技術説明会
発明の概要

【課題】 GPSにより取得した撮影場所の位置情報(緯度経度)付きのデジタル画像に対する、一般的な物体やシーン等の被写体認識の精度を向上させ、デジタル写真の自動分類や検索を可能にする。
【解決手段】 認識対象(被写体)の画像に加え、撮影位置を中心とした小領域に対応する、様々な縮尺の航空写真画像および/または地図画像の画像特徴量を、認識対象のデジタル画像の画像特徴量に付加して利用する。
【選択図】 図1

従来技術、競合技術の概要

近年、デジタルカメラ、カメラ付き携帯電話などの普及や、ハードディスク、その他記憶媒体の大容量化によって、一般の個人が大量にデジタル画像を保有、蓄積することが出来るようになった。
しかしながら、撮影されたデジタル画像の蓄積先、例えば、パーソナル・コンピュータ(PC)、デジタルカメラ、カメラ付き携帯電話などのデジタル機器は、撮影、蓄積された画像中の被写体(認識対象)を判別する機能をもっていない。
よって、画像の取り扱いに関するデジタル機器と人とのセマンティックギャップは狭まることはなく、現状では、大量の画像データの分類や検索には、人手の介入が不可欠である。
人手により、撮影画像の内容に関するメタデータを記述することも可能であるが、手間がかかるため、撮影した画像すべてに意味、内容等に関するメタデータを記載することは、現実的ではない。

画像の意味、内容に基づく処理を人手の介入なしに実現するためには、被写体、例えば、「ライオン」「自動車」「花」「山」「夕焼け」などの一般的な対象の認識(一般画像認識)を行なう必要がある。
現実世界で撮影された画像に対して、コンピュータなどのデジタル機器が、その画像中に含まれる被写体を一般的な名称で認識することを「一般物体認識(generic object recognition)」と呼び、画像認識の研究において最も重要な課題の一つである(例えば、非特許文献1、2など参照)。

一般に、現実世界で撮影された画像に対する物体認識には、大きく分けて、identification(同定)と、classification(分類)の、2種類の認識がある。
identificationは個々の物体(the object)を区別する認識であり、入力された画像とデータベース中のモデルの照合を行い、どのモデルに対応する物体が画像中に存在するかどうかを出力結果とする。
一方、classificationは物体の種類(an object)を区別する認識で、人間が決めた分類(class)と画像中の物体(被写体)とを対応付け、物体のクラス名(多くの場合は一般名称)を出力結果とする。
「物体認識」はidentificationを指すのが一般的であるが、「一般物体認識」はclassificationの認識を意味するものであり、本明細書においても、これらの用語の定義に基づいて説明する。

現在、デジタル画像に対する「一般物体認識」の研究が急速に進歩しつつある。ここでいう「一般物体認識」での対象画像とは、例えば、デジタルカメラやカメラ付携帯電話などで撮影したデジタル写真などの画像であり、認識対象はそうした画像中の「ライオン」「自動車」「花」「山」「夕焼け」などの各種の物体やシーンなどの被写体である。

「一般画像認識」では、画像のみの持つ情報(画像データ)から認識するのが最も基本的な方法であるが、近年においては、デジタル画像の撮影時に、デジタルカメラもしくはカメラ付き携帯電話によって自動的に埋め込まれた付加情報(メタデータ)を、認識に利用する研究が提案されている。
例えば、撮影された時間を用いれば、画像データだけでは難しい、「夕日」であるか「朝日」であるかの区別は、容易に行うことが可能となる。

また、非特許文献3に示されたように、メタデータとして、撮影時間のほか、撮影時におけるフラッシュの利用の有無や、レンズの焦点距離等のデータを、画像認識に利用する提案がなされている。しかし、従来の各種文献等においては、位置情報の利用について開示されていない。
メタデータ中の重要な情報として、位置情報がある。位置情報は通常GPS(Global Positioning System)によって取得するが、最近のデジタルカメラや携帯電話にはGPSが内蔵されたものもあり、撮影した画像に位置情報を、メタデータとして埋め込むことが可能な撮像機器が多く登場している。

また、独立したGPSデバイスをデジタルカメラと一緒に持ち歩くことによって、撮影時の位置情報を記録し、PC(パーソナル・コンピュータ)により、デジタル画像のファイルに、付加情報として位置情報を埋め込むことも可能である。
また、画像ファイル中の位置情報を、画像認識に利用することも一部で試みられている(例えば、特許文献1参照)。

しかし、位置情報は緯度経度の2つの数値のみからなる情報であり、それ自体では一般物体認識の手がかりに利用することは困難であり、はかばかしい成果を挙げていない。この困難さは、位置情報を、どのように認識の手がかりとして利用するかが簡単でないとの問題に起因するものである。


【非特許文献1】柳井啓司:「一般物体認識の現状と今後」、情報処理学会コンピュータビジョン・イメージメディア研究会招待講演予稿、CVM2006、CVM155-17(2006年)
【非特許文献2】柳井啓司:「一般物体認識の現状と今後」、情報処理学会論文誌:コンピュータビジョン・イメージメディア、Vol.48, No.SIG16(CVIM19), pp.1-24, 2007.
【非特許文献3】M. Boutell and J. Luo:Bayesian Fusion of Camera Metadata Cues in Semantic Scene Classification, Proceeding of Computer Vision and Pattern Recognition, pp. 623-630, 2004.
【特許文献1】特開2007-41762号(第18頁、第4図)

産業上の利用分野

本発明は、画像処理方法、およびその方法を実行するプログラム、記憶媒体、撮像機器、画像処理システムに関する。詳しくは、画像内の認識対象(被写体)を分類するための画像処理技術に関する。

特許請求の範囲 【請求項1】
所定の認識対象を含む複数の学習用画像と、前記学習用画像の各々に対応する、前記学習用画像の撮影位置を含む航空写真画像および/または地図画像とを用いた学習処理によって生成された、画像中の前記認識対象の有無を判別するための判別器と、
認識対象画像と、前記認識対象画像の撮影位置を含む航空写真画像および/または地図画像とを取得する画像取得手段と、
前記判別器を用いて、前記認識対象画像中に前記認識対象が含まれているかどうかを判別する判別手段とを備えたことを特徴とする画像認識装置。
【請求項2】
前記判別器は、前記学習用画像から得られた画像特徴量と、前記学習用画像に対応する航空写真画像および/または地図画像から得られた画像特徴量とを組み合わせたものであり、
前記判別手段は、前記認識対象画像から画像特徴量を取得するとともに、前記認識対象画像に対応する航空写真画像および/または地図画像から画像特徴量を取得し、前記画像特徴量の両方を組み合わせて前記判別を行うものであることを特徴とする請求項1記載の画像認識装置。
【請求項3】
前記航空写真画像および/または地図画像は、縮尺の異なる複数の画像であることを特徴とする請求項1又は2記載の画像認識装置。
【請求項4】
前記学習用画像に対応する前記航空写真画像および/または地図画像の中心位置が、前記学習用画像の撮影位置とほぼ一致するものであり、
前記認識対象画像に対応する前記航空写真画像および/または地図画像の中心位置が、前記認識対象画像の撮影位置とほぼ一致するものであることを特徴とする請求項1乃至3のいずれか一項に記載の画像認識装置。
【請求項5】
前記認識対象画像は、前記認識対象画像の撮影位置を表す位置情報が関連づけられたものであり、
前記画像取得手段は、前記認識対象画像と関連づけられた位置情報に基づいて、複数の位置における航空写真画像および/または地図画像が記憶された記憶手段から、前記認識対象画像の撮影位置を含む航空写真画像および/または地図画像を取得するものであることを特徴とする請求項1乃至4のいずれか一項に記載の画像認識装置。
【請求項6】
前記学習用画像に対応する前記航空写真画像および/または地図画像の中心位置が、前記学習用画像の撮影位置とほぼ一致するものであり、
前記画像取得手段は、前記記憶手段に記憶された複数の航空写真画像および/または地図画像から、前記認識対象画像の撮影位置をほぼ中心とする航空写真画像および/または地図画像を生成するものであることを特徴とする請求項5記載の画像認識装置。
【請求項7】
前記記憶手段が、ネットワークを介してアクセス可能なデータベースであることを特徴とする請求項5又は6記載の画像認識装置。
【請求項8】
認識対象画像と、前記認識対象画像の撮影位置を含む航空写真画像および/または地図画像とを取得するステップと、
所定の認識対象を含む複数の学習用画像と、前記学習用画像の各々に対応する、前記学習用画像の撮影位置を含む航空写真画像および/または地図画像とを用いた学習処理によって生成された、画像中の前記認識対象の有無を判別するための判別器を用いて、前記認識対象画像中に前記認識対象が含まれているかどうかを判別するステップとを含むことを特徴とする画像認識方法。
【請求項9】
コンピュータを、請求項1乃至7のいずれか一項に記載の画像認識装置として機能させるための画像認識プログラム。
産業区分
  • 計算機応用
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2008106546thum.jpg
出願権利状態 権利存続中
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください


PAGE TOP

close
close
close
close
close
close
close