TOP > 国内特許検索 > コンピュータプログラム、識別装置及び識別方法 > 明細書

明細書 :コンピュータプログラム、識別装置及び識別方法

発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2019-128842 (P2019-128842A)
公開日 令和元年8月1日(2019.8.1)
発明の名称または考案の名称 コンピュータプログラム、識別装置及び識別方法
国際特許分類 G06T   7/00        (2017.01)
G06T   7/60        (2017.01)
G06N  20/00        (2019.01)
G06N   3/08        (2006.01)
FI G06T 7/00 350C
G06T 7/60 110
G06N 99/00 153
G06N 3/08
請求項の数または発明の数 11
出願形態 OL
全頁数 16
出願番号 特願2018-010771 (P2018-010771)
出願日 平成30年1月25日(2018.1.25)
新規性喪失の例外の表示 特許法第30条第2項適用申請有り 平成29年8月7日に、Cornell University Library ウェブサイトのarXiv.orgのarXiv:1708.01986にて公開
発明者または考案者 【氏名】伊勢 武史
【氏名】皆川 まり
【氏名】大西 信徳
出願人 【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
個別代理人の代理人 【識別番号】100114557、【弁理士】、【氏名又は名称】河野 英仁
【識別番号】100078868、【弁理士】、【氏名又は名称】河野 登夫
審査請求 未請求
テーマコード 5L096
Fターム 5L096AA06
5L096CA02
5L096DA02
5L096DA04
5L096EA35
5L096EA39
5L096GA19
5L096GA34
5L096HA09
5L096HA11
5L096KA04
5L096KA15
要約 【課題】形状が定まらず、特徴も明瞭でないものを識別することができるコンピュータプログラム、識別装置及び識別方法を提供する。
【解決手段】コンピュータプログラムは、コンピュータに、被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得する処理と、画像から所定の画素数で構成される画素ブロックを複数特定する処理と、特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する処理と、生成した学習用データに基づいて、識別対象を識別するための学習モデルを学習させる処理とを実行させる。
【選択図】図1
特許請求の範囲 【請求項1】
コンピュータに、被識別体に含まれる識別対象を識別させるためのコンピュータプログラムであって、
コンピュータに、
被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得する処理と、
前記画像から所定の画素数で構成される画素ブロックを複数特定する処理と、
特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する処理と、
生成した学習用データに基づいて、前記識別対象を識別するための学習モデルを学習させる処理と
を実行させるコンピュータプログラム。
【請求項2】
コンピュータに、
前記画素ブロック毎に、該画素ブロックの画素値を入力データとし、前記画素ブロックに関連付けられたラベルを出力データとする学習用データを生成する処理を実行させる請求項1に記載のコンピュータプログラム。
【請求項3】
コンピュータに、
前記画素ブロック毎に、該画素ブロックの画素値を入力データとし、前記識別対象に対応しないラベルを出力データとする学習用データを生成する処理を実行させる請求項1又は請求項2に記載のコンピュータプログラム。
【請求項4】
コンピュータに、
植物に含まれる識別対象が混然一体に撮像された学習用の画像を取得する処理と、
生成した学習用データに基づいて、前記植物に含まれる識別対象を識別するための学習モデルを学習させる処理と
を実行させる請求項1から請求項3のいずれか一項に記載のコンピュータプログラム。
【請求項5】
コンピュータに、
前記学習モデルを学習させた結果に基づいて、被識別体に含まれる識別対象が混然一体に撮像された画像内の複数の画素ブロックそれぞれに対応させて前記識別対象の種類を表示する処理を実行させる請求項1から請求項4のいずれか一項に記載のコンピュータプログラム。
【請求項6】
コンピュータに、被識別体に含まれる識別対象を識別させるためのコンピュータプログラムであって、
コンピュータに、
被識別体に含まれる識別対象が混然一体に撮像された画像を取得する処理と、
前記画像から所定の画素数で構成される画素ブロックを複数特定する処理と、
特定した複数の画素ブロックそれぞれの画素値に基づいて入力データを生成する処理と、
生成した入力データ及び所定の学習済の学習モデルに基づいて、前記被識別体に含まれる識別対象を識別する処理と
を実行させるコンピュータプログラム。
【請求項7】
コンピュータに、
前記被識別体が撮像された画像内の複数の画素ブロックそれぞれに対応させて識別対象の種類を表示する処理を実行させる請求項6に記載のコンピュータプログラム。
【請求項8】
被識別体に含まれる識別対象を識別する識別装置であって、
被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得する取得部と、
前記画像から所定の画素数で構成される画素ブロックを複数特定する特定部と、
該特定部で特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する生成部と、
該生成部で生成した学習用データに基づいて、前記識別対象を識別するための学習モデルを学習させる処理部と
を備える識別装置。
【請求項9】
被識別体に含まれる識別対象を識別する識別装置であって、
被識別体に含まれる識別対象が混然一体に撮像された画像を取得する取得部と、
前記画像から所定の画素数で構成される画素ブロックを複数特定する特定部と、
該特定部で特定した複数の画素ブロックそれぞれの画素値に基づいて入力データを生成する生成部と、
該生成部で生成した入力データに基づいて、前記被識別体に含まれる識別対象を識別する学習済の学習モデルと
を備える識別装置。
【請求項10】
被識別体に含まれる識別対象を識別する識別方法であって、
被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得部が取得し、
前記画像から所定の画素数で構成される画素ブロックを特定部が複数特定し、
特定された複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成部が生成し、
生成された学習用データに基づいて、前記識別対象を識別するための学習モデルを処理部が学習させる識別方法。
【請求項11】
被識別体に含まれる識別対象を識別する識別方法であって、
被識別体に含まれる識別対象が混然一体に撮像された画像を取得部が取得し、
前記画像から所定の画素数で構成される画素ブロックを特定部が複数特定し、
特定された複数の画素ブロックそれぞれの画素値に基づいて入力データを生成部が生成し、
生成された入力データに基づいて、前記被識別体に含まれる識別対象を学習済の学習モデルが識別する識別方法。
発明の詳細な説明 【技術分野】
【0001】
本発明は、コンピュータプログラム、識別装置及び識別方法に関する。
【背景技術】
【0002】
近年、深層学習アルゴリズムがさまざまな分野で利用され、特に機械による物体認識に広く活用されている。深層学習の手法に基づく物体認識は、特徴がはっきりした物の識別において、人間の能力をしのぐようになった。
【0003】
特許文献1には、ニューラルネットワーク等の機械学習を行って、検索対象者の顔モデルを生成して人物を認識する技術が開示されている。
【先行技術文献】
【0004】

【特許文献1】特開2017-33372号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
顔には、二つの目、一つの鼻、一つの口というように、それぞれ特徴を有する部位が、ほぼ決まった位置に存在する。このような形状が定まり、特徴がはっきりしたものについては、深層学習により精度よく認識することが可能である。しかし、従来の深層学習の手法では、形状が定まらず、特徴も明瞭でないものを識別することは困難であった。
【0006】
本発明は斯かる事情に鑑みてなされたものであり、形状が定まらず、特徴も明瞭でないものを識別することができるコンピュータプログラム、識別装置及び識別方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の実施の形態に係るコンピュータプログラムは、コンピュータに、被識別体に含まれる識別対象を識別させるためのコンピュータプログラムであって、コンピュータに、被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得する処理と、前記画像から所定の画素数で構成される画素ブロックを複数特定する処理と、特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する処理と、生成した学習用データに基づいて、前記識別対象を識別するための学習モデルを学習させる処理とを実行させる。
【0008】
本発明の実施の形態に係る識別装置は、被識別体に含まれる識別対象を識別する識別装置であって、被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得する取得部と、前記画像から所定の画素数で構成される画素ブロックを複数特定する特定部と、該特定部で特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する生成部と、該生成部で生成した学習用データに基づいて、前記識別対象を識別するための学習モデルを学習させる処理部とを備える。
【0009】
本発明の実施の形態に係る識別方法は、被識別体に含まれる識別対象を識別する識別方法であって、被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得部が取得し、前記画像から所定の画素数で構成される画素ブロックを特定部が複数特定し、特定された複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成部が生成し、生成された学習用データに基づいて、前記識別対象を識別するための学習モデルを処理部が学習させる。
【0010】
本発明の実施の形態に係るコンピュータプログラムは、コンピュータに、被識別体に含まれる識別対象を識別させるためのコンピュータプログラムであって、コンピュータに、被識別体に含まれる識別対象が混然一体に撮像された画像を取得する処理と、前記画像から所定の画素数で構成される画素ブロックを複数特定する処理と、特定した複数の画素ブロックそれぞれの画素値に基づいて入力データを生成する処理と、生成した入力データ及び所定の学習済の学習モデルに基づいて、前記被識別体に含まれる識別対象を識別する処理とを実行させる。
【0011】
本発明の実施の形態に係る識別装置は、被識別体に含まれる識別対象を識別する識別装置であって、被識別体に含まれる識別対象が混然一体に撮像された画像を取得する取得部と、前記画像から所定の画素数で構成される画素ブロックを複数特定する特定部と、該特定部で特定した複数の画素ブロックそれぞれの画素値に基づいて入力データを生成する生成部と、該生成部で生成した入力データに基づいて、前記被識別体に含まれる識別対象を識別する学習済の学習モデルとを備える。
【0012】
本発明の実施の形態に係る識別方法は、被識別体に含まれる識別対象を識別する識別方法であって、被識別体に含まれる識別対象が混然一体に撮像された画像を取得部が取得し、前記画像から所定の画素数で構成される画素ブロックを特定部が複数特定し、特定された複数の画素ブロックそれぞれの画素値に基づいて入力データを生成部が生成し、生成された入力データに基づいて、前記被識別体に含まれる識別対象を学習済の学習モデルが識別する。
【発明の効果】
【0013】
本発明によれば、被識別体に含まれ、形状が定まらず、特徴も明瞭でない識別対象を識別することができる。
【図面の簡単な説明】
【0014】
【図1】本実施の形態の識別装置の構成の一例を示すブロック図である。
【図2】学習モデルの構成の一例を示す模式図である。
【図3】学習用の画像の一例を示す説明図である。
【図4】切り出し画像の一例を示す説明図である。
【図5】学習用データの構成の一例を示す説明図である。
【図6】学習処理部による学習の一例を示す説明図である。
【図7】学習済の学習モデルの検証用の画像の一例を示す説明図である。
【図8】学習済の学習モデルによる識別結果の一例を示す模式図である。
【図9】航空写真の一例を示す説明図である。
【図10】学習済の学習モデルによる識別結果の一例を示す説明図である。
【図11】処理部の学習モードでの処理手順の一例を示すフローチャートである。
【図12】処理部の識別モードでの処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、本発明をその実施の形態を示す図面に基づいて説明する。図1は本実施の形態の識別装置50の構成の一例を示すブロック図である。識別装置50は、画像取得部51、メモリ52、処理部53、出力部54、及び表示部55を備える。処理部53は、画素ブロック特定部531、学習処理部532、学習データ生成部533、学習モデル534、及び入力データ生成部535を備える。識別装置50には、表示装置60を接続することができる。以下では、学習モデル534を学習させるモードを学習モードといい、学習済の学習モデル534で識別対象を識別させるモードを識別モードという。

【0016】
画像取得部51は、学習モデル534を学習させるための画像、及び学習済の学習モデル534で識別対象を識別させるための画像を取得する。画像取得部51は、取得した画像をメモリ52に記憶する。画像は、被識別体(例えば、植物など)の画像である。画像には、識別対象(例えば、種類の異なる植物など)が混然一体に撮像された画像とすることができる。識別対象が混然一体とは、被識別体が写った一枚の画像の中に識別対象が混在し、識別対象の形状をはっきり定義することが困難であって不定形な識別対象を含む。画像の解像度は、例えば、4608×3456ピクセルとすることができるが、これに限定されない。

【0017】
画素ブロック特定部531は、学習モード及び識別モードにおいて、メモリ52から画像を読み出し、読み出した画像から所定の画素数で構成される画素ブロックを複数特定する。すなわち、一枚の画像を小さな領域に分割し、分割した画像を切り出す。画素ブロック、すなわち切り出し画像の解像度は、例えば、56×56ピクセルとすることができるが、これに限定されない。

【0018】
画素ブロック特定部531は、学習モードにおいて、一枚の画像を小さな領域に分割する際に、分割する領域を重複させながら切り出すことができる。重複度合いは、例えば、20%、50%、90%など適宜設定すればよい。重複度合いを増やすことにより、一枚の画像から生成する切り出し画像の数を増やすことができ、一枚の画像から抽出することができる学習用のデータ量を増加することができる。例えば、一枚の画像から、約1000枚、1万枚、5万枚などの切り出し画像を生成することができる。

【0019】
学習データ生成部533は、画素ブロック特定部531が特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する。ラベルは、識別対象の種類を区別するためのものであればよい。

【0020】
具体的には、学習データ生成部533は、画素ブロック毎に、画素ブロックの画素値を入力データとし、画素ブロックに関連付けられたラベルを出力データとする学習用データを生成する。これにより、学習モデル534に対して、形状が定まらず、特徴も明瞭でない識別対象を識別するための学習用データを与えることができる。

【0021】
学習データ生成部533は、画素ブロック毎に、画素ブロックの画素値を入力データとし、識別対象に対応しないラベルを出力データとする学習用データを生成することができる。これにより、学習モデル534に対して、識別対象ではないことを識別するための学習用データを与えることができる。

【0022】
学習処理部532は、学習データ生成部533が生成した学習用データに基づいて、学習モデル534を学習させる。これにより、様々な識別対象が混在する画像を学習済の学習モデル534に与えると、画像の様々な部分に存在する識別対象の種類を識別することができる。これにより、被識別体に含まれ、形状が定まらず、特徴も明瞭でない識別対象を識別することができる。

【0023】
図2は学習モデル534の構成の一例を示す模式図である。学習モデル534は、深層学習(ディープラーニング)を含むニューラルネットワークモデルであり、入力層、出力層及び複数の中間層から構成されている。なお、図2では、便宜上、2つ中間層を図示しているが、中間層の層数は2つに限定されず、3つ以上であってもよい。

【0024】
入力層、出力層及び中間層には、1つ又は複数のノード(ニューロン)が存在し、各層のノードは、前後の層に存在するノードと一方向に所望の重みで結合されている。入力層のノードの数と同数の成分を有するベクトルが、学習モデル534の入力データとして与えられる。入力データは、切り出し画像の各画素値とすることができる。出力データは、切り出し画像のラベルとすることができる。

【0025】
入力層の各ノードに与えられたデータは、最初の中間層に入力して与えられると、重みおよび活性化関数を用いて中間層の出力が算出され、算出された値が次の中間層に与えられ、以下同様にして出力層の出力が求められるまで次々と後の層(下層)に伝達される。なお、ノードを結合する重みのすべては、学習アルゴリズムによって計算される。

【0026】
学習モデル534及び学習処理部532は、例えば、CPU(例えば、複数のプロセッサコアを実装したマルチ・プロセッサなど)、GPU(Graphics Processing Units)、DSP(Digital Signal Processors)、FPGA(Field-Programmable Gate Arrays)などのハードウェアを組み合わせることによって構成することができる。また、量子プロセッサを組み合わせることもできる。学習モデル534は、ニューラルネットワークモデルに限定されるものではなく、他の機械学習モデルでもよい。

【0027】
次に、学習モードの詳細について説明する。以下では、被識別体として植物を例とし、種類の異なる識別対象として、コケを例として説明する。本明細書で植物の意義は、一つの花、あるいは一つの葉の如く、形状や種類が定義されず、不定形の植物に係る識別対象が混在していることを表す。

【0028】
図3は学習用の画像の一例を示す説明図である。図3に示す画像は、庭園の草が生えている地面を撮像したものであり、画像中には、ハイゴケが写っている。画像の解像度は、4608×3456ピクセルである。同様に、スギゴケ、チョウチンゴケが写っている画像を学習用の画像として用意する。

【0029】
図4は切り出し画像の一例を示す説明図である。図4では、便宜上、切り出し画像を12枚図示しているが、図3に示すような1枚の画像から所要枚数の切り出し画像を作り出すことができる。

【0030】
図5は学習用データの構成の一例を示す説明図である。切り出し画像のサンプルNo.を、X1、X2、X3、X4、X5、X6、…とする。サンプルNo.X1、X2、X3、X4、X5、X6、…の切り出し画像は、それぞれスギゴケ、チョウチンゴケ、ハイゴケ、チョウチンゴケ、コケ以外、スギゴケ、…の画像であるので、サンプルNo.X1、X2、X3、X4、X5、X6、…の切り出し画像の教師ラベルは、A、B、C、B、S、A、…としている。

【0031】
サンプルNo.X1の切り出し画像の各画素値を、x11、x12、…、x1Nとする。サンプルNo.X2の切り出し画像の各画素値を、x21、x22、…、x2Nとする。サンプルNo.X3の切り出し画像の各画素値を、x31、x32、…、x3Nとする。サンプルNo.X4の切り出し画像の各画素値を、x41、x42、…、x4Nとする。サンプルNo.X5の切り出し画像の各画素値を、x51、x52、…、x5Nとする。サンプルNo.X6の切り出し画像の各画素値を、x61、x62、…、x6Nとする。他のサンプルの切り出し画像の各画素値も同様である。

【0032】
図6は学習処理部532による学習の一例を示す説明図である。学習処理部532は、学習データ生成部533が生成した学習データに基づいて学習モデル534を学習させる。具体的には、学習処理部532は、サンプルNo.X1の学習用入力データ(x11、x12、…、x1N)を、入力層のそれぞれの入力ノードに入力し、出力層の出力ノードの出力値y1が1(教師ラベルA)に近づくように学習を行う。ここで、出力値y1、y2、y3、y4は、それぞれ教師ラベルA、B、C、Sに対応しているとする。

【0033】
また、図示していないが、学習処理部532は、サンプルNo.X2の学習用入力データ(x21、x22、…、x2N)を、入力層のそれぞれの入力ノードに入力し、出力層の出力ノードの出力値y2が1(教師ラベルB)に近づくように学習を行う。他のサンプルについても同様である。

【0034】
図7は学習済の学習モデル534の検証用の画像の一例を示す説明図である。図7に示す画像は、複数種類のコケ及びコケ以外の植物が混然一体となって写っている。すなわち、図7に示す画像は、人物の顔の画像や、形状のはっきりした物体の画像ではなく、識別対象が混然一体に撮像された植物の画像である。ここで、植物には、一つの花、あるいは一つの葉のように形状をある程度定義することができるものは除外される。植物は、様々な種の植物に係る識別対象が混在するようなものである。識別対象は、植物に含まれ、形状を定義することが困難な植物の種が含まれる。図7の例では、コケが識別対象となる。

【0035】
画素ブロック特定部531は、図7に示す画像から所定の画素数で構成される画素ブロックを複数特定する。画素ブロック(切り出し画像)の解像度は、例えば、56×56ピクセルとすることができるが、これに限定されない。

【0036】
入力データ生成部535は、切り出し画像それぞれの各画素の画素値に基づいて入力データを生成する。入力データの構成は、図5で例示した学習用入力データと同様である。

【0037】
学習済の学習モデル534は、入力データ生成部535が生成した入力データに基づいて識別結果を出力する。

【0038】
出力部54は、学習済の学習モデル534からの識別結果を不図示の装置などに出力することができる。

【0039】
表示部55は、学習済の学習モデル534からの識別結果に基づいて表示用データ
を生成し、生成した表示用データを表示装置60に出力することができる。

【0040】
具体的には、表示部55は、学習済の学習モデル534からの識別結果に基づいて、被識別体であって、識別対象が混然一体に撮像された画像内の複数の画素ブロックそれぞれに対応させて識別対象の種類を表示する。例えば、識別対象の種類に応じて、表示態様を変えることができ、あるいは、識別対象の位置が分かるように表示することができる。これにより、一枚の画像内に混在する識別対象の種類を識別可能に表示することができる。

【0041】
図8は学習済の学習モデル534による識別結果の一例を示す模式図である。符号A、B、C、Sは、図5の例と同様に、スギゴケ、チョウチンゴケ、ハイゴケ、コケ以外を表す識別子である。識別子は、符号に限定されるものではなく、色又は模様が異なる図形などでもよい。便宜上、図中の一部のみ符号を図示しているが、符号による識別は画像全体で行われる。検証結果(識別精度)は、スギゴケで99%、チョウチンゴケで95%、ハイゴケで74%である。ハイゴケの精度が他のゴケに比べて低いのは、成長の形態が明確でないためであると考えられる。

【0042】
上述の例では、コケを識別するものであったが、本実施の形態の識別装置50は、他の識別対象の識別にも適用することができる。例えば、航空画像で上空から撮影された木や植物をより正確に識別することができる。また、荒野や農場、森林などの広大な管理区域での個体数調査にも適用することができる。

【0043】
次に、航空写真を用いた竹林面積の推定に適用する場合について説明する。

【0044】
学習モデル534の学習モードでは、竹の写った画像、及び竹以外(例えば、市街地、農地、森林など)の画像から、28×28ピクセルの切り出し画像を生成して、学習モデル534を学習させる。

【0045】
次に、竹林を竹林以外から識別したい画像を用意する。図9は航空写真の一例を示す説明図である。図9では、竹林が存在しているのは分かるが、目視では竹林と竹林以外とを明確に区別することができない。

【0046】
画像取得部51は、図9に示す画像を取得する。画素ブロック特定部531は、図9に示す画像から所定の画素数で構成される画素ブロック(切り出し画像)を複数特定する。画素ブロック(切り出し画像)の解像度は、例えば、28×28ピクセルとすることができる。入力データ生成部535は、切り出し画像それぞれの各画素の画素値に基づいて入力データを生成する。学習済の学習モデル534は、入力データ生成部535が生成した入力データに基づいて識別結果を出力する。

【0047】
図10は学習済の学習モデル534による識別結果の一例を示す説明図である。図10は、図9の航空写真に識別結果を重畳させて表示したものである。図中、濃度の高い(暗い)四角形は竹林であると識別した箇所を示し、濃度の低い(明るい)四角形は竹林以外であると識別した箇所を示す。このように、本実施の形態の識別装置50によれば、竹林が混然一体となった航空写真から竹林と竹林以外とを識別することができる。

【0048】
図11は処理部53の学習モードでの処理手順の一例を示すフローチャートである。処理部53は、学習用の画像を取得し(S11)、取得した画像から複数の画素ブロックを特定する(S12)。処理部53は、特定した画素ブロックの各画素の画素値を入力データとし、当該画素ブロックのラベルを出力データとする学習データを生成する(S13)。

【0049】
処理部53は、学習データに基づいて学習モデルを学習させる(S14)。処理部53は、処理を終了するか否かを判定する(S15)。処理を終了するか否かは、例えば、検証用の画像を用いて識別結果の精度が所要の精度に到達したか否かにより判定することができる。処理を終了しない場合(S15でNO)、処理部53は、ステップS13以降の処理を繰り返す。処理を終了する場合(S15でYES)、処理部53は、処理を終了する。

【0050】
図12は処理部53の識別モードでの処理手順の一例を示すフローチャートである。処理部53は、識別用の画像を取得し(S21)、取得した画像から複数の画素ブロックを特定する(S22)。処理部53は、特定した画素ブロックの各画素の画素値に基づいて入力データを生成する(S23)。

【0051】
処理部53は、生成した入力データを学習済の学習モデル534に入力し(S24)、識別結果を出力し(S25)、処理を終了する。

【0052】
本実施の形態の処理部53及び表示部55は、CPU(プロセッサ)、GPU、RAM(メモリ)などを備えた汎用コンピュータを用いて実現することもできる。すなわち、図11及び図12に示すような、各処理の手順を定めたコンピュータプログラムをコンピュータに備えられたRAM(メモリ)にロードし、コンピュータプログラムをCPU(プロセッサ)で実行することにより、コンピュータ上で処理部53及び表示部55を実現することができる。

【0053】
なお、図示していないが、記録媒体Mに記録されたコンピュータプログラムは、持ち運びが自由なメディアに記録されたものに限定されるものではなく、インターネット又は他の通信回線を通じて伝送されるコンピュータプログラムも含めることができる。また、コンピュータには、複数のプロセッサを搭載した1台のコンピュータ、あるいは、通信ネットワークを介して接続された複数台のコンピュータで構成されるコンピュータシステムも含まれる。

【0054】
本実施の形態によれば、従来の深層学習アルゴリズムでは認知することができないもの、例えば、草などの形状が定まっていないもの、あるいは特徴を定義しにくいもの等であっても精度良く識別することが可能となる。また、コケや草などは生育条件によっても大きさ、形状が様々であり、従来の深層学習アルゴリズムでは識別をさらに困難にしている。しかし、本実施の形態によれば、本来的に混然一体となった識別対象を識別することができるので、生育条件によって、大きさ、形状が変わっても、識別することが可能となる。

【0055】
本実施の形態に係るコンピュータプログラムは、コンピュータに、被識別体に含まれる識別対象を識別させるためのコンピュータプログラムであって、コンピュータに、被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得する処理と、前記画像から所定の画素数で構成される画素ブロックを複数特定する処理と、特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する処理と、生成した学習用データに基づいて、前記識別対象を識別するための学習モデルを学習させる処理とを実行させる。

【0056】
本実施の形態に係る識別装置は、被識別体に含まれる識別対象を識別する識別装置であって、被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得する取得部と、前記画像から所定の画素数で構成される画素ブロックを複数特定する特定部と、該特定部で特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する生成部と、該生成部で生成した学習用データに基づいて、前記識別対象を識別するための学習モデルを学習させる処理部とを備える。

【0057】
本実施の形態に係る識別方法は、被識別体に含まれる識別対象を識別する識別方法であって、被識別体に含まれる識別対象が混然一体に撮像された学習用の画像を取得部が取得し、前記画像から所定の画素数で構成される画素ブロックを特定部が複数特定し、特定された複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成部が生成し、生成された学習用データに基づいて、前記識別対象を識別するための学習モデルを処理部が学習させる。

【0058】
コンピュータプログラムは、被識別体の画像であって、識別対象が混然一体に撮像された学習用の画像を取得する。識別対象が混然一体とは、被識別体の画像の中に識別対象が混在し、識別対象の形状をはっきり定義することが困難であって不定形な対象を含む。画像は一枚あればよい。画像の解像度は、例えば、4608×3456ピクセルとすることができるが、これに限定されない。

【0059】
コンピュータプログラムは、画像から所定の画素数で構成される画素ブロックを複数特定する。すなわち、一枚の画像を小さな領域に分割し、分割した画像を切り出す。画素ブロック、すなわち切り出し画像の解像度は、例えば、56×56ピクセルとすることができるが、これに限定されない。また、一枚の画像を小さな領域に分割する際に、分割する領域を重複させながら切り出すことができる。重複度合いは、例えば、20%、50%、90%など適宜設定すればよい。重複度合いを増やすことにより、一枚の画像から生成する切り出し画像の数を増やすことができ、一枚の画像から抽出することができる学習用のデータ量を増加することができる。

【0060】
コンピュータプログラムは、特定した複数の画素ブロックそれぞれに、識別対象の種類に対応するラベルを関連付けて学習用データを生成する。ラベルは、例えば、識別対象の種類を区別することができるものであればよい。

【0061】
コンピュータプログラムは、生成した学習用データに基づいて、識別対象を識別するための学習モデルを学習させる。これにより、様々な識別対象が混在する画像を学習済の学習モデルに与えると、画像の様々な部分に存在する識別対象の種類を識別することができる。これにより、被識別体に含まれ、形状が定まらず、特徴も明瞭でない識別対象を識別することができる。

【0062】
本実施の形態に係るコンピュータプログラムは、コンピュータに、前記画素ブロック毎に、該画素ブロックの画素値を入力データとし、前記画素ブロックに関連付けられたラベルを出力データとする学習用データを生成する処理を実行させる。

【0063】
コンピュータプログラムは、画素ブロック毎に、画素ブロックの画素値を入力データとし、画素ブロックに関連付けられたラベルを出力データとする学習用データを生成する。これにより、学習モデルに対して、形状が定まらず、特徴も明瞭でない識別対象を識別するための学習用データを与えることができる。

【0064】
本実施の形態に係るコンピュータプログラムは、コンピュータに、前記画素ブロック毎に、該画素ブロックの画素値を入力データとし、前記識別対象に対応しないラベルを出力データとする学習用データを生成する処理を実行させる。

【0065】
コンピュータプログラムは、画素ブロック毎に、画素ブロックの画素値を入力データとし、識別対象に対応しないラベルを出力データとする学習用データを生成する。これにより、学習モデルに対して、識別対象ではないことを識別するための学習用データを与えることができる。

【0066】
本実施の形態に係るコンピュータプログラムは、コンピュータに、植物に含まれる識別対象が混然一体に撮像された学習用の画像を取得する処理と、生成した学習用データに基づいて、前記植物に含まれる識別対象を識別するための学習モデルを学習させる処理とを実行させる。

【0067】
コンピュータプログラムは、植物の画像であって、識別対象が混然一体に撮像された学習用の画像を取得する。ここで、植物には、一つの花、あるいは一つの葉のように形状をある程度定義することができるものは除外される。例えば、植物とは、様々な種が混在するようなものである。識別対象は、植物に含まれる、形状を定義することが困難な植物の種などを含む。

【0068】
コンピュータプログラムは、生成した学習用データに基づいて、植物に含まれる識別対象を識別するための学習モデルを学習させる。これにより、植物が撮像された一枚の画像を学習済の学習モデルに与えると、画像の様々な部分に存在する植物の種類を識別することができる。これにより、形状が定まらず、特徴も明瞭でない植物の種類を識別することができる。

【0069】
本実施の形態に係るコンピュータプログラムは、コンピュータに、前記学習モデルを学習させた結果に基づいて、被識別体に含まれる識別対象が混然一体に撮像された画像内の複数の画素ブロックそれぞれに対応させて前記識別対象の種類を表示する処理を実行させる。

【0070】
コンピュータプログラムは、学習モデルを学習させた結果に基づいて、被識別体であって、識別対象が混然一体に撮像された画像内の複数の画素ブロックそれぞれに対応させて識別対象の種類を表示する。例えば、識別対象の種類に応じて、表示態様を変えることができ、あるいは、識別対象の位置が分かるように表示することができる。これにより、一枚の画像内に混在する識別対象の種類を識別可能に表示することができる。

【0071】
本実施の形態に係るコンピュータプログラムは、コンピュータに、被識別体に含まれる識別対象を識別させるためのコンピュータプログラムであって、コンピュータに、被識別体に含まれる識別対象が混然一体に撮像された画像を取得する処理と、前記画像から所定の画素数で構成される画素ブロックを複数特定する処理と、特定した複数の画素ブロックそれぞれの画素値に基づいて入力データを生成する処理と、生成した入力データ及び所定の学習済の学習モデルに基づいて、前記被識別体に含まれる識別対象を識別する処理とを実行させる。

【0072】
本実施の形態に係る識別装置は、被識別体に含まれる識別対象を識別する識別装置であって、被識別体に含まれる識別対象が混然一体に撮像された画像を取得する取得部と、前記画像から所定の画素数で構成される画素ブロックを複数特定する特定部と、該特定部で特定した複数の画素ブロックそれぞれの画素値に基づいて入力データを生成する生成部と、該生成部で生成した入力データに基づいて、前記被識別体に含まれる識別対象を識別する学習済の学習モデルとを備える。

【0073】
本実施の形態に係る識別方法は、被識別体に含まれる識別対象を識別する識別方法であって、被識別体に含まれる識別対象が混然一体に撮像された画像を取得部が取得し、前記画像から所定の画素数で構成される画素ブロックを特定部が複数特定し、特定された複数の画素ブロックそれぞれの画素値に基づいて入力データを生成部が生成し、生成された入力データに基づいて、前記被識別体に含まれる識別対象を学習済の学習モデルが識別する。

【0074】
コンピュータプログラムは、被識別体であって、識別対象が混然一体に撮像された画像を取得する。画像は、識別対象を識別しようとする画像である。

【0075】
コンピュータプログラムは、画像から所定の画素数で構成される画素ブロックを複数特定し、特定した複数の画素ブロックそれぞれの画素値に基づいて入力データを生成する。コンピュータプログラムは、生成した入力データを学習済の学習モデルに与えて、被識別体に含まれる識別対象を識別する。これにより、被識別体に含まれ、形状が定まらず、特徴も明瞭でない識別対象を識別することができる。

【0076】
本実施の形態に係るコンピュータプログラムは、コンピュータに、前記被識別体が撮像された画像内の複数の画素ブロックそれぞれに対応させて識別対象の種類を表示する処理を実行させる。

【0077】
コンピュータプログラムは、被識別体が撮像された画像内の複数の画素ブロックそれぞれに対応させて識別対象の種類を表示する。これにより、一枚の画像内に混在する識別対象の種類を識別可能に表示することができる。
【符号の説明】
【0078】
50 識別装置
51 画像取得部
52 メモリ
53 処理部
531 画素ブロック特定部
532 学習処理部
533 学習データ生成部
534 学習モデル
535 入力データ生成部
54 出力部
55 表示部
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9
【図11】
10
【図12】
11