TOP > 国内特許検索 > クラスタ評価装置、クラスタ数算出装置、クラスタ装置、クラスタ評価方法、およびプログラム > 明細書

明細書 :クラスタ評価装置、クラスタ数算出装置、クラスタ装置、クラスタ評価方法、およびプログラム

発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2018-010438 (P2018-010438A)
公開日 平成30年1月18日(2018.1.18)
発明の名称または考案の名称 クラスタ評価装置、クラスタ数算出装置、クラスタ装置、クラスタ評価方法、およびプログラム
国際特許分類 G06F  17/30        (2006.01)
FI G06F 17/30 210D
G06F 17/30 170B
G06F 17/30 350C
請求項の数または発明の数 12
出願形態 OL
全頁数 25
出願番号 特願2016-138105 (P2016-138105)
出願日 平成28年7月13日(2016.7.13)
新規性喪失の例外の表示 特許法第30条第2項適用申請有り 平成28年2月8日 国立大学法人京都大学工学部情報学科主催の「京都大学工学部情報学科卒業研究諮問会」において文書をもって発表 平成28年2月12日 http://www.gakkai-web.net/gakkai/ieice/G_2016/Settings/ab/d_12_097.htmlを通じて発表 平成28年3月1日 一般社団法人電子情報通信学会発行の「2016年総合大会講演論文集」に発表 平成28年3月17日 一般社団法人電子情報通信学会主催の「2016年電子情報通信学会総合大会」において文書をもって発表 平成28年4月11日 http://www.mm.media.kyoto-u.ac.jp/ja/thesis/ http://www.mm.media.kyoto-u.ac.jp/ja/thesis/2015-b-ina/ http://www.mm.media.kyoto-u.ac.jp/en/thesis/2015-b-ina/ http://www.mm.media.kyoto-u.ac.jp/wp-content/uploads/2016/04/2015-b-ina.pdf を通じて発表
発明者または考案者 【氏名】橋本 敦史
【氏名】伊奈 拓郎
【氏名】飯山 将晃
【氏名】森 幹彦
【氏名】笠原 秀一
【氏名】美濃 導彦
出願人 【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
個別代理人の代理人 【識別番号】100115749、【弁理士】、【氏名又は名称】谷川 英和
審査請求 未請求
要約 【課題】従来は、写真等の分類対象を適切に分類することを支援することが困難であった。
【解決手段】2以上の要素を含む2以上のクラスタ情報が格納されるクラスタ情報格納部と、2以上の各クラスタごとに、対応するクラスタ情報を用いて、クラスタに含まれる2以上の各要素間の類似度を算出する要素間類似度算出部と、クラスタごとに2以上の各要素間の類似度から、各クラスタの内部全体の類似度を代表する類似度である内部類似度を算出する内部類似度算出部と、内部類似度のうちの最小の類似度である最小内部類似度と、最小内部類似度を除く1以上の内部類似度のうちの1以上の内部類似度である採用内部類似度との差異に関する情報である第一評価値を算出する第一評価値算出部と、第一評価値を出力する評価値出力部とを具備するクラスタ評価装置により、写真等の分類対象を適切に分類することを支援できる。
【選択図】図1
特許請求の範囲 【請求項1】
2以上の要素を含むクラスタに関する情報である2以上のクラスタ情報が格納されるクラスタ情報格納部と、
前記2以上の各クラスタごとに、対応するクラスタ情報を用いて、クラスタに含まれる2以上の各要素間の類似度を算出する要素間類似度算出部と、
前記2以上の各クラスタごとに、前記2以上の各要素間の類似度から、各クラスタの内部全体の類似度を代表する類似度である内部類似度を算出する内部類似度算出部と、
前記内部類似度算出部が算出した内部類似度のうちの最小の類似度である最小内部類似度と、当該最小内部類似度とは異なる情報であり、前記内部類似度算出部が算出した1以上の内部類似度から取得される採用内部類似度との差異に関する情報である第一評価値を算出する第一評価値算出部と、
前記第一評価値を出力する評価値出力部とを具備するクラスタ評価装置。
【請求項2】
前記採用内部類似度は、
2番目に小さな内部類似度である請求項1記載のクラスタ評価装置。
【請求項3】
前記第一評価値は、
最小内部類似度と採用内部類似度との差である請求項1または請求項2記載のクラスタ評価装置。
【請求項4】
前記要素は、画像内のオブジェクトであり、
2以上の画像が格納される画像格納部と、
前記画像格納部に格納されている2以上の各画像内の1以上の要素を認識する画像認識部と、
前記画像認識部が認識した要素であり、同一の画像内の2以上の要素が同一のクラスタに属さない度合いに関する情報である第二評価値を算出する第二評価値算出部と、
前記第一評価値と前記第二評価値とをパラメータとする増加関数により、総合評価値を算出する総合評価値算出部とをさらに具備し、
前記評価値出力部は、
前記総合評価値を出力する請求項1から請求項3いずれか一項に記載のクラスタ評価装置。
【請求項5】
前記第二評価値算出部は、
前記画像認識部が認識した要素であり、同一の画像内の2以上の要素の組み合わせである1以上の要素組を取得し、当該1以上の各要素組が異なるクラスタに属するか同一のクラスタに属するかを、前記クラスタ情報格納部の2以上のクラスタ情報を用いて判断し、前記1以上の各要素組が異なるクラスタに属する割合が大きいほど、高い評価値となる第二評価値を算出する請求項4記載のクラスタ評価装置。
【請求項6】
3以上の要素を3以上N(Nは4以上の自然数)までのクラスタ数に分類されるようにクラスタリングし、3以上Nまでのクラスタ数ごとに、2以上の各要素を含むクラスタのクラスタ情報の集合である2以上のクラスタ情報群を取得するクラスタリング部と、
前記2以上のクラスタ情報群ごとに、請求項1から請求項5いずれか記載のクラスタ評価装置を動作させ、当該クラスタ評価装置が出力する第一評価値または総合評価値である評価値を取得する制御部と、
前記制御部が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ数である最良クラスタ数を取得する最良クラスタ数取得部と、
前記最良クラスタ数を出力する最良クラスタ数出力部とを具備するクラスタ数算出装置。
【請求項7】
2以上の画像が格納される画像格納部と、
前記画像格納部に格納されている2以上の各画像内の1以上の要素を認識し、3以上の要素を取得する画像認識部をさらに具備し、
前記クラスタリング部が分類する3以上の要素は、前記画像認識部が取得した3以上の要素である請求項6記載のクラスタ数算出装置。
【請求項8】
3以上の要素を3以上N(Nは4以上の自然数)までのクラスタ数に分類されるように、かつ類似度の大きい要素が同一のクラスタに属するようにクラスタリングし、3以上Nまでのクラスタ数ごとに、2以上の各要素を含むクラスタのクラスタ情報の集合である2以上のクラスタ情報群を取得するクラスタリング部と、
前記2以上のクラスタ情報群ごとに、請求項1から請求項5いずれか記載のクラスタ評価装置を動作させ、当該クラスタ評価装置が出力する第一評価値または総合評価値である評価値を取得する制御部と、
前記制御部が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ情報群である最良クラスタ情報群を取得する最良クラスタ情報群取得部と、
前記最良クラスタ情報群を出力する最良クラスタ情報群出力部とを具備するクラスタ装置。
【請求項9】
2以上の画像が格納される画像格納部と、
前記画像格納部に格納されている2以上の各画像内の1以上の要素を認識し、3以上の要素を取得する画像認識部をさらに具備し、
前記クラスタリング部が分類する3以上の要素は、前記画像認識部が取得した3以上の要素である請求項8記載のクラスタ装置。
【請求項10】
前記画像は、写真であり、
前記要素は、人の顔である請求項8または請求項9記載のクラスタ装置。
【請求項11】
記録媒体は、
2以上の要素を含むクラスタに関する情報である2以上のクラスタ情報が格納されるクラスタ情報格納部を具備し、
要素間類似度算出部、内部類似度算出部、第一評価値算出部、および評価値出力部により実現されるクラスタ評価方法であって、
前記要素間類似度算出部が、前記2以上の各クラスタごとに、対応するクラスタ情報を用いて、クラスタに含まれる2以上の各要素間の類似度を算出する要素間類似度算出ステップと、
前記内部類似度算出部が、前記2以上の各クラスタごとに、前記2以上の各要素間の類似度から、各クラスタの内部全体の類似度を代表する類似度である内部類似度を算出する内部類似度算出ステップと、
前記第一評価値算出部が、前記内部類似度算出ステップで算出された内部類似度のうちの最小の類似度である最小内部類似度と、当該最小内部類似度とは異なる情報であり、前記内部類似度算出部が算出した1以上の内部類似度から取得される採用内部類似度との差異に関する情報である第一評価値を算出する第一評価値算出ステップと、
前記評価値出力部が、前記第一評価値を出力する評価値出力ステップとを具備するクラスタ評価装置。
【請求項12】
コンピュータがアクセス可能な記録媒体は、
2以上の要素を含むクラスタに関する情報である2以上のクラスタ情報が格納されるクラスタ情報格納部を具備し、
コンピュータを、
前記2以上の各クラスタごとに、対応するクラスタ情報を用いて、クラスタに含まれる2以上の各要素間の類似度を算出する要素間類似度算出部と、
前記2以上の各クラスタごとに、前記2以上の各要素間の類似度から、各クラスタの内部全体の類似度を代表する類似度である内部類似度を算出する内部類似度算出部と、
前記内部類似度算出部が算出した内部類似度のうちの最小の類似度である最小内部類似度と、当該最小内部類似度とは異なる情報であり、前記内部類似度算出部が算出した1以上の内部類似度から取得される採用内部類似度との差異に関する情報である第一評価値を算出する第一評価値算出部と、
前記第一評価値を出力する評価値出力部として機能させるためのプログラム。
発明の詳細な説明 【技術分野】
【0001】
本発明は、写真等の分類対象を適切に分類することを支援するクラスタ評価装置等に関するものである。
【背景技術】
【0002】
従来、Spectral Clusteringと呼ばれる手法を用いたクラスタリング技術があった(例えば、非特許文献1参照)。クラスタリング技術とは、写真等の分類対象を適切に分類する技術である。
また、従来、クラスタを形成しうる注目対象ではない要素(かかる要素をOutlierと言う。)でも、盲目的にクラスタを形成すると考えて、それらしきものを取り除く手法(outlierが形成したクラスタを特定する方法は不詳)が提案されている(例えば、非特許文献2参照)。
【先行技術文献】
【0003】

【非特許文献1】Stella X. Yu and Jianbo Shi, "Multiclass Spectral Clustering", International Conference on Computer Vision, pp.11-17, October 2003.
【非特許文献2】Li, Z., Liu, J., Chen, S., Tang, X, "Noise robust spectral clustering," International Conference on Conputer Vision, pp.1-8, Oct.2007.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術においては、写真等の分類対象を適切に分類することを支援することが困難であった。
【0005】
具体的には、従来技術において、Outlierを適切に判断し、当該Outlierを取り除いたり、適切なクラスタ数を決定したりすることが困難であった。そのために、従来技術では、写真等の分類対象を適切に分類できなかった。
【課題を解決するための手段】
【0006】
本第一の発明のクラスタ評価装置は、2以上の要素を含むクラスタに関する情報である2以上のクラスタ情報が格納されるクラスタ情報格納部と、2以上の各クラスタごとに、対応するクラスタ情報を用いて、クラスタに含まれる2以上の各要素間の類似度を算出する要素間類似度算出部と、2以上の各クラスタごとに、2以上の各要素間の類似度から、各クラスタの内部全体の類似度を代表する類似度である内部類似度を算出する内部類似度算出部と、内部類似度算出部が算出した内部類似度のうちの最小の類似度である最小内部類似度と、最小内部類似度とは異なる情報であり、前記内部類似度算出部が算出した1以上の内部類似度から取得される採用内部類似度との差異に関する情報である第一評価値を算出する第一評価値算出部と、第一評価値を出力する評価値出力部とを具備するクラスタ評価装置である。
【0007】
かかる構成により、写真等の分類対象を適切に分類することを支援するための、クラスタの適切な評価が可能となる。
【0008】
また、本第二の発明のクラスタ評価装置は、第一の発明に対して、採用内部類似度は、2番目に小さな内部類似度であるクラスタ評価装置である。
【0009】
かかる構成により、写真等の分類対象を適切に分類することを支援できる。
【0010】
また、本第三の発明のクラスタ評価装置は、第一または第二の発明に対して、第一評価値は、最小内部類似度と採用内部類似度との差であるクラスタ評価装置である。
【0011】
かかる構成により、写真等の分類対象を適切に分類することを支援するための、クラスタの適切な評価が可能となる。
【0012】
また、本第四の発明のクラスタ評価装置は、第一から第三いずれか1つの発明に対して、要素は、画像内のオブジェクトであり、2以上の画像が格納される画像格納部と、画像格納部に格納されている2以上の各画像内の1以上の要素を認識する画像認識部と、画像認識部が認識した要素であり、同一の画像内の2以上の要素が同一のクラスタに属さない度合いに関する情報である第二評価値を算出する第二評価値算出部と、第一評価値と第二評価値とをパラメータとする増加関数により、総合評価値を算出する総合評価値算出部とをさらに具備し、評価値出力部は、総合評価値を出力するクラスタ評価装置である。
【0013】
かかる構成により、写真等の分類対象を適切に分類することを支援するための、クラスタの適切な評価が可能となる。
【0014】
また、本第五の発明のクラスタ評価装置は、第四の発明に対して、第二評価値算出部は、画像認識部が認識した要素であり、同一の画像内の2以上の要素の組み合わせである1以上の要素組を取得し、1以上の各要素組が異なるクラスタに属するか同一のクラスタに属するかを、クラスタ情報格納部の2以上のクラスタ情報を用いて、判断し、1以上の各要素組が異なるクラスタに属する割合が大きいほど、高い評価値となる第二評価値を算出するクラスタ評価装置である。
【0015】
かかる構成により、写真等の分類対象を適切に分類することを支援するための、クラスタの適切な評価が可能となる。
【0016】
また、本第六の発明のクラスタ数算出装置は、3以上の要素を3以上N(Nは4以上の自然数)までのクラスタ数に分類されるようにクラスタリングし、3以上Nまでのクラスタ数ごとに、2以上の各要素を含むクラスタのクラスタ情報の集合である2以上のクラスタ情報群を取得するクラスタリング部と、2以上のクラスタ情報群ごとに、クラスタ評価装置を動作させ、クラスタ評価装置が出力する第一評価値または総合評価値である評価値を取得する制御部と、制御部が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ数である最良クラスタ数を取得する最良クラスタ数取得部と、最良クラスタ数を出力する最良クラスタ数出力部とを具備するクラスタ数算出装置である。
【0017】
かかる構成により、写真等の分類対象を適切に分類する場合のクラスタ数を自動的に決定できる。
【0018】
また、本第七の発明のクラスタ数算出装置は、第6の発明に対して、2以上の画像が格納される画像格納部と、画像格納部に格納されている2以上の各画像内の1以上の要素を認識し、3以上の要素を取得する画像認識部をさらに具備し、クラスタリング部が分類する3以上の要素は、前記画像認識部が取得した3以上の要素であるクラスタ数算出装置である。
【0019】
かかる構成により、写真等の分類対象を適切に分類する場合のクラスタ数を自動的に決定できる。
【0020】
また、本第八の発明のクラスタ装置は、3以上の要素を3以上N(Nは4以上の自然数)までのクラスタ数に分類されるように、かつ類似度の大きい要素が同一のクラスタに属するようにクラスタリングし、3以上Nまでのクラスタ数ごとに、2以上の各要素を含むクラスタのクラスタ情報の集合である2以上のクラスタ情報群を取得するクラスタリング部と、2以上のクラスタ情報群ごとに、クラスタ評価装置を動作させ、クラスタ評価装置が出力する第一評価値または総合評価値である評価値を取得する制御部と、制御部が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ情報群である最良クラスタ情報群を取得する最良クラスタ情報群取得部と、最良クラスタ情報群を出力する最良クラスタ情報群出力部とを具備するクラスタ装置である。
【0021】
かかる構成により、写真等の分類対象を適切に分類できる。
【0022】
また、本第九の発明のクラスタ装置は、第八の発明に対して、2以上の画像が格納される画像格納部と、画像格納部に格納されている2以上の各画像内の1以上の要素を認識し、3以上の要素を取得する画像認識部をさらに具備し、クラスタリング部が分類する3以上の要素は、前記画像認識部が取得した3以上の要素であるクラスタ装置である。
【0023】
かかる構成により、写真等の分類対象を適切に分類できる。
【0024】
また、本第十の発明のクラスタ装置は、第八または第九の発明に対して、画像は、写真であり、要素は、人の顔であるクラスタ装置である。
【0025】
かかる構成により、写真内の人の顔を適切に分類できる。
【発明の効果】
【0026】
本発明によるクラスタ評価装置によれば、写真等の分類対象を適切に分類することを支援できる。
【図面の簡単な説明】
【0027】
【図1】実施の形態1におけるクラスタ評価装置1のブロック図
【図2】同クラスタ評価装置1の動作例について説明するフローチャート
【図3】同内部類似度算出処理について説明するフローチャート
【図4】同第二評価値算出処理について説明するフローチャート
【図5】実施の形態2におけるクラスタ数算出装置2のブロック図
【図6】同クラスタ数算出装置2の動作例について説明するフローチャート
【図7】実施の形態3におけるクラスタ装置3のブロック図
【図8】同クラスタ装置3の動作について説明するフローチャート
【図9】上記実施の形態における実験の仮想データセットの詳細を示す図
【図10】同実験結果を示す図
【図11】同実験結果を示す図
【図12】同実験結果を示す図
【図13】同コンピュータシステムの概観図
【図14】同コンピュータシステムのブロック図
【発明を実施するための形態】
【0028】
以下、クラスタ評価装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。

【0029】
(実施の形態1)
本実施の形態において、2以上のクラスタに分類された情報に対して、適切な評価が行えるクラスタ評価装置について説明する。

【0030】
また、本実施の形態において、2以上の要素からなる2以上のクラスタにおいて、クラスタ内の類似度を算出し、最小の類似度と他の1以上の類似度うちの1以上の類似度とから、差に関する内部評価値を算出し、内部評価値を用いて評価することにより、2以上のクラスタに分類された情報に対して、適切な評価が行えるクラスタ評価装置について説明する。なお、内部評価値は、後述する第一評価値である。また、内部評価値は、例えば、最小の類似度と2番目に小さい類似度との差異の情報である。

【0031】
図1は、本実施の形態におけるクラスタ評価装置1のブロック図である。クラスタ評価装置1は、受付部10、格納部11、処理部12、および出力部13を備える。

【0032】
格納部11は、画像格納部111、およびクラスタ情報格納部112を備える。処理部12は、画像認識部121、要素間類似度算出部122、内部類似度算出部123、第一評価値算出部124、第二評価値算出部125、および総合評価値算出部126を備える。出力部13は、評価値出力部131を備える。

【0033】
受付部10は、各種の指示や情報等を受け付ける。各種の指示や情報等とは、動作の開始指示、画像、クラスタ情報等である。各種の指示や情報等の入力手段は、キーボードやタッチパネルやマウスやメニュー画面によるもの等、何でも良い。受付部10は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。

【0034】
格納部11は、各種の情報等が格納される。各種の情報等とは、例えば、後述する画像、後述する要素、クラスタ情報、クラスタ評価装置1の処理を実現するプログラム等である。

【0035】
画像格納部111は、2以上の画像が格納される。画像は、例えば、写真であるが、画像作成ソフトで作成したファイル等でも良い。画像の内容やフォーマット等は問わないことは言うまでもない。なお、クラスタ評価装置1が画像格納部111を有する場合、クラスタリングの対象は画像に関する情報である。ただし、クラスタリングの対象は、画像に関する情報でなくても良い。クラスタリングの対象は、例えば、文書、音情報、音声データ等でも良い。なお、クラスタリングの対象は、クラスタ評価の対象でもある。

【0036】
クラスタ情報格納部112は、2以上のクラスタ情報が格納される。クラスタ情報は、2以上の要素を含むクラスタに関する情報である。要素は、分類対象である。要素は、例えば、画像内のオブジェクトである。要素は、例えば、写真内の人の顔の画像、写真、文書ファイル等の処理対象である。処理対象とは、通常、分類対象である。また、オブジェクトとは、例えば、顔、人、犬や猫等の動物、自動車や建物等の静物等である。また、写真内の人の顔の画像は、写真内の人の顔を含む矩形の領域の画像情報でも良く、写真内の人の顔を輪郭抽出した情報でも良い。また、クラスタとは、分類のことであり、クラス、グループと言っても良い。また、クラスタ情報は、例えば、クラスタを構成する1または2以上の写真でも良く、クラスタを構成する1または2以上の要素でも良く、クラスタを構成する1または2以上の要素へのアクセスための情報でも良い。要素を含むクラスタ情報とは、要素を識別する要素識別子を含むクラスタ情報と同意義である、と考えても良い。

【0037】
処理部12は、各種の処理を行う。各種の処理とは、例えば、画像認識部121、要素間類似度算出部122、内部類似度算出部123、第一評価値算出部124、第二評価値算出部125、総合評価値算出部126が行う処理である。

【0038】
画像認識部121は、画像格納部111に格納されている2以上の各画像内の1以上の要素を認識する。要素の認識とは、要素の切り出し、要素に対応する領域を特定する情報の取得である。なお、要素は、上述した通り、例えば、顔の画像部分であるが、人物全体の画像部分、特定のオブジェクト(例えば、犬や猫等の動物、自動車など)の画像部分等でも良い。なお、分類対象が画像に関する情報でない場合、クラスタ評価装置1は、画像格納部111や画像認識部121は有さない。

【0039】
要素間類似度算出部122は、2以上の各クラスタごとに、各クラスタ対応するクラスタ情報を用いて、クラスタに含まれる2以上の各要素間の類似度を算出する。なお、要素間の類似度の算出とは、例えば、2つの画像の類似度を算出すること、2つの文書の類似度を算出すること等である。画像の類似度の算出は、例えば、画像から1以上の特徴量を取得し、1以上の特徴量を有する特徴量ベクトルの類似度(例えば、コサイン値)を算出することである。また、文書の類似度の算出は、例えば、文書ベクトルを取得し、文書ベクトルの類似度(例えば、コサイン値)を算出することである。なお、画像の類似度や文書の類似度を算出する処理は公知技術であるので、詳細な説明は省略する。

【0040】
内部類似度算出部123は、2以上の各クラスタごとに、内部類似度を算出する。内部類似度とは、クラスタの内部の類似度である、と言える。内部類似度は、2以上の各要素間の類似度から取得される類似度であり、各クラスタの内部全体の類似度を代表する類似度である。内部類似度は、2以上の各要素間の2以上の類似度から算出される値である。

【0041】
内部類似度算出部123は、例えば、クラスタ内の2以上の各要素間の1以上の類似度を統計処理した結果である内部類似度を算出する。ここで、統計処理とは、例えば、平均値の算出、中央値の取得、最大値の取得、最小値の取得等である。ただし、内部類似度とは、クラスタの内部の類似度を代表する情報であれば、統計処理の内容は問わない。

【0042】
第一評価値算出部124は、最小内部類似度と採用内部類似度とを用いて、最小内部類似度と採用内部類似度との差異に関する情報である第一評価値を算出する。最小内部類似度とは、内部類似度算出部123がクラスタ毎に算出した内部類似度のうちの最小の類似度である。

【0043】
採用内部類似度とは、内部類似度算出部123がクラスタ毎に算出した1以上の内部類似度から取得される情報である。採用内部類似度は、例えば、2番目に小さな内部類似度である。2番目からN(Nは3以上の自然数)番目までに小さな内部類似度の平均値、2番目からN(Nは3以上の自然数)番目までに小さな内部類似度の中央値などでも良い。採用内部類似度は、最小内部類似度とは異なる情報である。採用内部類似度は、最小内部類似度をも用いて算出された情報(例えば、すべての内部類似度の平均値、すべての内部類似度の中央値など)でも良い。

【0044】
第一評価値は、例えば、最小内部類似度と採用内部類似度との差の絶対値である。第一評価値は、例えば、最小内部類似度と採用内部類似度との差の絶対値に係数を乗算した値、最小内部類似度と採用内部類似度との比などでも良い。

【0045】
第一評価値算出部124は、例えば、以下の数式1により、第一評価値を算出する。なお、第一評価値は、例えば、数式1のfdif(K)である。第一評価値は、例えば、最小内部類似度と採用内部類似度(2番目に小さな内部類似度)との差の絶対値である。

【0046】
【数1】
JP2018010438A_000003t.gif

【0047】
第二評価値算出部125は、画像認識部121が認識した要素であり、同一の画像内の2以上の要素が同一のクラスタに属さない度合いに関する情報である第二評価値を算出する。なお、第二評価値は、同一の画像内の2以上の要素が同一のクラスタに属する度合いに関する情報でも良い。同一の画像内の2以上の要素が同一のクラスタに属する度合いに関する情報は、同一の画像内の2以上の要素が同一のクラスタに属さない度合いに関する情報である、と言える。なお、分類の対象が画像に関係しない場合、クラスタ評価装置1は、第二評価値算出部125を有さない。

【0048】
第二評価値算出部125は、画像認識部121が認識した要素であり、同一の画像内の2以上の要素の組み合わせである1以上の要素組を取得し、1以上の各要素組が異なるクラスタに属するか同一のクラスタに属するかを、クラスタ情報格納部112の2以上のクラスタ情報を用いて判断し、1以上の各要素組が異なるクラスタに属する割合が大きいほど、高い評価値となる第二評価値を算出する。

【0049】
第二評価値算出部125は、例えば、以下の数式2により、第二評価値(fcut(K))を算出する。

【0050】
【数2】
JP2018010438A_000004t.gif

【0051】
数式2において、|Pall|は、同じ写真に写った人物の組み合わせの数である。また、|Pcut|は、同じ写真に写った人物の組み合わせのうち、異なるクラスタに属している数である。

【0052】
第二評価値算出部125は、同一の画像内の2以上の要素の組み合わせの数と、1以上の各要素組が異なるクラスタに属する数との比を第二評価値(fcut(K))として算出する。

【0053】
総合評価値算出部126は、第一評価値と第二評価値とを用いて、総合評価値を算出する。総合評価値算出部126は、通常、第一評価値と第二評価値とをパラメータとする増加関数により、総合評価値を算出する。なお、分類の対象が画像に関係しない場合、クラスタ評価装置1は、総合評価値算出部126を有さない。

【0054】
総合評価値は、例えば、「第一評価値×第二評価値」、第一評価値と第二評価値との平均値、第一評価値と第二評価値のうちの最大値、第一評価値と第二評価値のうちの最小値等である。

【0055】
総合評価値算出部126は、例えば、以下の数式3により、総合評価値(f(K))を算出する。

【0056】
【数3】
JP2018010438A_000005t.gif

【0057】
出力部13は、各種の情報を出力する。各種の情報とは、例えば、第一評価値、第二評価値、総合評価値等である。なお、分類の対象が画像に関係しない場合、出力部13は、第一評価値を出力する。

【0058】
ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。

【0059】
評価値出力部131は、第一評価値を出力する。また、評価値出力部131は、総合評価値を出力しても良い。

【0060】
格納部11、画像格納部111、およびクラスタ情報格納部112は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

【0061】
格納部11等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部11等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部11等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部11等で記憶されるようになってもよい。

【0062】
処理部12、画像認識部121、要素間類似度算出部122、内部類似度算出部123、第一評価値算出部124、第二評価値算出部125、および総合評価値算出部126は、通常、MPUやメモリ等から実現され得る。処理部12等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。

【0063】
出力部13、評価値出力部131は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部13等は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

【0064】
次に、クラスタ評価装置1の動作例について、図2のフローチャートを用いて説明する。

【0065】
(ステップS201)処理部12は、カウンタiに1を代入する。

【0066】
(ステップS202)処理部12は、クラスタ情報格納部112に、i番目のクラスタ情報が存在するか否かを判断する。i番目のクラスタ情報が存在すればステップS203に行き、i番目のクラスタ情報が存在しなければステップS205に行く。

【0067】
(ステップS203)内部類似度算出部123は、i番目のクラスタ情報に対応する内部類似度を算出し、図示しないバッファに一時蓄積する。内部類似度算出処理について、図3のフローチャートを用いて説明する。

【0068】
(ステップS204)処理部12は、カウンタiを1、インクリメントする。

【0069】
(ステップS205)第一評価値算出部124は、ステップS203で算出された2以上の内部類似度のうち、最小の類似度を示す最小内部類似度を取得する。

【0070】
(ステップS206)第一評価値算出部124は、ステップS203で算出された2以上の内部類似度のうちで最小内部類似度を除く、1以上の内部類似度を用いて、採用内部類似度を取得する。第一評価値算出部124は、例えば、2番目に小さな内部類似度を取得する。

【0071】
(ステップS207)第一評価値算出部124は、ステップS205で取得した最小内部類似度と、ステップS206で取得した採用内部類似度とを用いて、第一評価値を算出する。

【0072】
(ステップS208)第二評価値算出部125は、第二評価値を算出する。第二評価値算出処理について、図4のフローチャートを用いて説明する。

【0073】
(ステップS209)総合評価値算出部126は、第一評価値と第二評価値とを用いて、総合評価値を算出する。

【0074】
(ステップS210)評価値出力部131は、評価値を出力する。処理を終了する。ここで出力される評価値は、通常、総合評価値である。ただし、第一評価値または/および第二評価値を算出しても良い。なお、評価値出力部131は、総合評価値を出力しなくても良い。かかる場合、ステップS208、S209は存在しなくても良い。

【0075】
次に、ステップS203の内部類似度算出処理の例について、図3のフローチャートを用いて説明する。

【0076】
(ステップS301)要素間類似度算出部122は、カウンタiに1を代入する。

【0077】
(ステップS302)要素間類似度算出部122は、着目しているクラスタ内にi番目の要素が存在するか否かを判断する。i番目の要素が存在する場合はステップS303に行き、i番目の要素が存在しない場合はステップS308に行く。

【0078】
(ステップS303)要素間類似度算出部122は、カウンタjにi+1を代入する。

【0079】
(ステップS304)要素間類似度算出部122は、着目しているクラスタ内にj番目の要素が存在するか否かを判断する。j番目の要素が存在する場合はステップS305に行き、j番目の要素が存在しない場合はステップS307に行く。

【0080】
(ステップS305)要素間類似度算出部122は、i番目の要素とj番目の要素との類似度を取得し、図示しないバッファに一時蓄積する。なお、例えば、要素間類似度算出部122は、i番目の要素の特徴ベクトルとj番目の要素の特徴ベクトルを取得する。そして、要素間類似度算出部122は、取得した2つの特徴ベクトルの類似度を算出する。

【0081】
(ステップS306)要素間類似度算出部122は、カウンタjを1、インクリメントする。ステップS304に戻る。

【0082】
(ステップS307)要素間類似度算出部122は、カウンタiを1、インクリメントする。ステップS302に戻る。

【0083】
(ステップS308)内部類似度算出部123は、ステップS305で取得された1または2以上の類似度を用いて、内部類似度を算出する。上位処理にリターンする。なお、内部類似度算出部123は、例えば、ステップS305で取得された1または2以上の類似度の平均値を内部類似度として取得しても良い。また、内部類似度算出部123は、数式1で示した正規化密度の考え方を用いて、内部類似度を算出しても良い。かかる場合、例えば、「内部類似度=(着目しているクラスタ内の各要素の類似度の平均値)/(着目しているクラスタ内の各要素と全要素との間の類似度の平均値)」である。

【0084】
次に、ステップS208の第二評価値算出処理について、図4のフローチャートを用いて説明する。

【0085】
(ステップS401)処理部12は、初期化を行う。具体的には、処理部12は、カウンタiに1を代入し、変数allに0を代入し、変数cutに0を代入する。

【0086】
(ステップS402)処理部12は、画像格納部111にi番目の画像が存在するか否かを判断する。i番目の画像が存在する場合はステップS403に行き、i番目の画像が存在しない場合はステップS411に行く。

【0087】
(ステップS403)画像認識部121は、i番目の画像に対して、画像認識処理を行い、要素(例えば、顔の画像)を認識する。なお、要素の認識とは、例えば、要素の取得、要素の領域を特定する情報の取得等である。

【0088】
(ステップS404)第二評価値算出部125は、カウンタjに1を代入する。

【0089】
(ステップS405)第二評価値算出部125は、ステップS403で認識された1以上の要素の中に、j番目のペア(要素の対)が存在するか否かを判断する。j番目のペアが存在する場合はステップS406に行き、存在しない場合はステップS410に行く。

【0090】
(ステップS406)第二評価値算出部125は、変数allに1を加算する。

【0091】
(ステップS407)第二評価値算出部125は、j番目のペアを構成する2つの要素が異なるクラスタに属するか否かを、クラスタ情報格納部112のクラスタ情報を参照し、判断する。異なるクラスタに属する場合はステップS408に行き、同じクラスタに属する場合はステップS409に行く。

【0092】
(ステップS408)第二評価値算出部125は、変数cutに1を加算する。

【0093】
(ステップS409)第二評価値算出部125は、jをインクリメントする。ステップS405に戻る。

【0094】
(ステップS410)処理部12は、iをインクリメントする。ステップS402に戻る。

【0095】
(ステップS411)第二評価値算出部125は、第二評価値を算出する。第二評価値算出部125は、変数allと変数cutの値を用いて、第二評価値を算出する。例えば、第二評価値算出部125は、変数allをパラメータとする減少関数であり、変数cutをパラメータとする増加関数を用いて、第二評価値を算出す。第二評価値算出部125は、例えば、関数「第二評価値=cut/all」により、第二評価値を算出する。

【0096】
以上、本実施の形態によれば、クラスタの適切な評価が可能となる。そして、クラスタの適切な評価を用いて、写真等の分類対象を適切に分類することが可能となる。

【0097】
なお、
本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態におけるクラスタ評価装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、記録媒体は、2以上の要素を含むクラスタに関する情報である2以上のクラスタ情報が格納されるクラスタ情報格納部を具備し、コンピュータを、前記2以上の各クラスタごとに、対応するクラスタ情報を用いて、クラスタに含まれる2以上の各要素間の類似度を算出する要素間類似度算出部と、前記2以上の各クラスタごとに、前記2以上の各要素間の類似度から、各クラスタの内部全体の類似度を代表する類似度である内部類似度を算出する内部類似度算出部と、前記内部類似度算出部が算出した内部類似度のうちの最小の類似度である最小内部類似度と、当該最小内部類似度とは異なる情報であり、前記内部類似度算出部が算出した1以上の内部類似度から取得される採用内部類似度との差異に関する情報である第一評価値を算出する第一評価値算出部と、前記第一評価値を出力する評価値出力部として機能させるためのプログラムである。

【0098】
上記プログラムにおいて、前記採用内部類似度は、2番目に小さな内部類似度であるものとして、コンピュータを機能させるプログラムであることは好適である。

【0099】
上記プログラムにおいて、前記第一評価値は、最小内部類似度と採用内部類似度との差であるものとして、コンピュータを機能させるプログラムであることは好適である。

【0100】
上記の記録媒体は、前記要素は、画像内のオブジェクトであり、2以上の画像が格納される画像格納部をさらに具備し、上記プログラムにおいて、前記画像格納部に格納されている2以上の各画像内の1以上の要素を認識する画像認識部と、前記画像認識部が認識した要素であり、同一の画像内の2以上の要素が同一のクラスタに属さない度合いに関する情報である第二評価値を算出する第二評価値算出部と、前記第一評価値と前記第二評価値とをパラメータとする増加関数により、総合評価値を算出する総合評価値算出部として、コンピュータをさらに機能させ、前記評価値出力部は、前記総合評価値を出力するものとして、コンピュータを機能させるプログラムであることは好適である。

【0101】
上記プログラムにおいて、前記第二評価値算出部は、前記画像認識部が認識した要素であり、同一の画像内の2以上の要素の組み合わせである1以上の要素組を取得し、当該1以上の各要素組が異なるクラスタに属するか同一のクラスタに属するかを、前記クラスタ情報格納部の2以上のクラスタ情報を用いて、判断し、前記1以上の各要素組が異なるクラスタに属する割合が大きいほど、高い評価値となる第二評価値を算出するものとして、コンピュータを機能させるプログラムであることは好適である。

【0102】
(実施の形態2)
本実施の形態において、実施の形態1で説明したクラスタ評価装置1を用いたクラスタ数算出装置について説明する。クラスタ数算出装置は、クラスタ評価装置1が出力する評価値を使用して、最も高い評価値に対応するクラスタ数である最良クラスタ数を取得する。

【0103】
図5は、本実施の形態におけるクラスタ数算出装置2と、実施の形態1で説明したクラスタ評価装置1とを具備する情報システムのブロック図である。

【0104】
クラスタ数算出装置2は、格納部21、処理部22、および出力部23を備える。格納部21は、画像格納部111を備える。処理部22は、画像認識部121、クラスタリング部222、制御部223、および最良クラスタ数取得部224を備える。出力部23は、最良クラスタ数出力部231を備える。なお、クラスタ評価装置1は、クラスタ評価装置1を含んでいても良い。また、クラスタリングの対象が画像に関する情報でない場合、クラスタ数算出装置2は、画像格納部111や画像認識部121を有さない。

【0105】
格納部21は、各種の情報が格納される。各種の情報とは、例えば、1または2以上の画像である。

【0106】
処理部22は、各種の処理を行う。各種の処理とは、例えば、画像認識部121、クラスタリング部222、制御部223、最良クラスタ数取得部224等が行う処理である。

【0107】
クラスタリング部222は、3以上の要素を3以上N(Nは4以上の自然数)までのクラスタ数に分類されるようにクラスタリングし、3以上Nまでのクラスタ数ごとに、2以上の各要素を含むクラスタのクラスタ情報の集合である2以上のクラスタ情報群を取得する。なお、Nは、通常、予め決められている。しかし、Nは、動的にユーザから与えられたり、外部の装置から取得したりされても良い。また、クラスタ数が決まっている状況で、情報をクラスタリングする技術は公知技術であるので、詳細な説明を省略する。ここで、情報とは、上述した要素である。また、クラスタリング部222は、通常、クラスタ数iを初期値(通常、2であるがN未満の自然数であれば良い。)からNまで変更しながら、クラスタ数ごとに、3以上の要素を分類し、iのクラスタに分類されたクラスタ情報群を取得する。クラスタ情報は、クラスタを識別するクラスタ識別子と1以上の要素の集合である。また、クラスタ情報は、クラスタを識別するクラスタ識別子と要素の識別子である1以上の要素識別子の集合でも良い。なお、クラスタリング部222が分類する3以上の要素は、例えば、画像認識部121が認識し、取得した3以上の要素である。

【0108】
制御部223は、クラスタ評価装置1を動作させ、クラスタ評価装置1が出力する評価値を取得する。クラスタ評価装置1が出力する評価値は、通常、総合評価値であるが、第一評価値でも良い。

【0109】
また、制御部223は、クラスタ評価装置1に、クラスタリング部222が取得した2以上の各クラスタ情報群を与える。そして、制御部223は、クラスタ評価装置1から、クラスタ情報群ごとに、クラスタ評価装置1から評価値を得る。なお、制御部223がクラスタ評価装置1に与えるクラスタ情報群は、クラスタ評価装置1のクラスタ情報格納部112に、例えば、一時的に格納される。また、制御部223は、クラスタ数、クラスタ情報群、および評価値を、図示しないバッファ等に一時的に蓄積する等しても良い。

【0110】
最良クラスタ数取得部224は、制御部223が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ数である最良クラスタ数を取得する。

【0111】
出力部23は、各種の情報を取得する。各種の情報とは、例えば、最良クラスタ数である。

【0112】
最良クラスタ数出力部231は、最良クラスタ数取得部224が取得した最良クラスタ数を出力する。

【0113】
格納部21は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。格納部21に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部21で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部21で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部21で記憶されるようになってもよい。

【0114】
処理部22、画像認識部121、クラスタリング部222、制御部223、および最良クラスタ数取得部224は、通常、MPUやメモリ等から実現され得る。処理部22等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。

【0115】
出力部23、および最良クラスタ数出力部231は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部23等は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

【0116】
次に、クラスタ数算出装置2の動作例について、図6のフローチャートを用いて説明する。

【0117】
(ステップS601)画像認識部121は、カウンタiに1を代入する。

【0118】
(ステップS602)画像認識部121は、画像格納部111にi番目の画像が存在するか否かを判断する。i番目の画像が存在する場合はステップS603に行き、i番目の画像が存在しない場合はステップS605に行く。

【0119】
(ステップS603)画像認識部121は、画像格納部111のi番目の画像に対して、画像認識処理を行い、要素を認識し、認識結果を格納部21に少なくとも一時蓄積する。なお、認識結果とは、例えば、要素そのもの、要素の領域を特定する情報等である。

【0120】
(ステップS604)画像認識部121は、iをインクリメントする。ステップS602に戻る。

【0121】
(ステップS605)クラスタリング部222は、カウンタjに初期クラスタ数を代入する。初期クラスタ数とは、通常、予め決められている数であり、要素を分類する最低数のクラスタ数である。初期クラスタ数は、例えば、2である。

【0122】
(ステップS606)クラスタリング部222は、jが最大クラスタ数N以下であるか否かを判断する。jが最大クラスタ数N以下である場合はステップS607に行き、jが最大クラスタ数Nより大きい場合はステップS612に行く。なお、最大クラスタ数Nは、通常、予め決められている数であり、要素を分類する最大数のクラスタ数である。Nは、例えば、100である。

【0123】
(ステップS607)クラスタリング部222は、格納部21に格納されている2以上の要素を、jのクラスタに分類する。

【0124】
(ステップS608)制御部223は、ステップS607で分類されたjのクラスタのクラスタ情報群をクラスタ評価装置1に与え、クラスタ評価装置1を動作させる。

【0125】
(ステップS609)制御部223は、jのクラスタの評価値をクラスタ評価装置1から取得する。

【0126】
(ステップS610)制御部223は、クラスタ数jとステップS609で取得した評価値とを対応付けて図示しないバッファに一時蓄積する。なお、ここで、制御部223は、ステップS607で取得されたjのクラスタのクラスタ情報群をも、jに対応付けて図示しないバッファに一時蓄積しても良い。

【0127】
(ステップS611)クラスタリング部222は、jをインクリメントする。ステップS606に戻る。

【0128】
(ステップS612)最良クラスタ数取得部224は、ステップS610で一時蓄積された評価値の中で最良の評価値に対応するクラスタ数jを取得する。

【0129】
(ステップS613)最良クラスタ数出力部231は、ステップS612で取得された最良クラスタ数jを出力する。処理を終了する。

【0130】
なお、図6のフローチャートにおいて、分類対象の要素が予め格納されていても良い。かかる場合、ステップS601からステップS604は不要である。

【0131】
以上、本実施の形態によれば、写真等の分類対象を適切に分類する場合のクラスタ数を自動的に決定できる。

【0132】
なお、本実施の形態におけるクラスタ数算出装置2を実現するソフトウェアは、以下のようなプログラムである。つまり、コンピュータを、3以上の要素を3以上N(Nは4以上の自然数)までのクラスタ数に分類されるようにクラスタリングし、3以上Nまでのクラスタ数ごとに、2以上の各要素を含むクラスタのクラスタ情報の集合である2以上のクラスタ情報群を取得するクラスタリング部と、前記2以上のクラスタ情報群ごとに、クラスタ評価装置を動作させ、当該クラスタ評価装置が出力する第一評価値または総合評価値である評価値を取得する制御部と、前記制御部が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ数である最良クラスタ数を取得する最良クラスタ数取得部と、前記最良クラスタ数を出力する最良クラスタ数出力部とを具備するクラスタ数算出装置として機能させるためのプログラムである。

【0133】
また、コンピュータがアクセス可能な記録媒体は、2以上の画像が格納される画像格納部を具備し、上記のプログラムは、コンピュータを、前記画像格納部に格納されている2以上の各画像内の1以上の要素を認識する画像認識部としてさらに機能させ、前記クラスタリング部が分類する3以上の要素は、前記画像認識部が取得した3以上の要素であるものとして、コンピュータを機能させるプログラムであることは好適である。

【0134】
(実施の形態3)
本実施の形態において、クラスタ評価装置1を用いたクラスタ装置について説明する。クラスタ装置は、クラスタ評価装置1が出力する評価値を使用して、最も高い評価値に対応するクラスタ情報群である最良クラスタ情報群を取得する。

【0135】
図7は、本実施の形態におけるクラスタ装置3のブロック図である。

【0136】
クラスタ装置3は、格納部21、処理部32、および出力部33を備える。処理部32は、画像認識部121、クラスタリング部222、制御部223、および最良クラスタ情報群取得部324を備える。出力部33は、最良クラスタ情報群出力部331を備える。

【0137】
処理部32は、各種の処理を行う。各種の処理とは、例えば、画像認識部121、クラスタリング部222、制御部223、最良クラスタ情報群取得部324等が行う処理である。

【0138】
最良クラスタ情報群取得部324は、制御部223が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ情報群である最良クラスタ情報群を取得する。

【0139】
出力部33は、各種の情報を出力する。各種の情報とは、例えば、最良クラスタ情報群である。

【0140】
最良クラスタ情報群出力部331は、最良クラスタ情報群を出力する。

【0141】
処理部32、および最良クラスタ情報群取得部324は、通常、MPUやメモリ等から実現され得る。処理部32等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。

【0142】
出力部33、および最良クラスタ情報群出力部331は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部33等は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。

【0143】
次に、クラスタ装置3の動作について、図8のフローチャートを用いて説明する。図8のフローチャートにおいて、図6のフローチャートと同一のステップについて説明を省略する。

【0144】
(ステップS801)制御部223は、クラスタ数jと、ステップS607で取得されたjのクラスタのクラスタ情報群と、ステップS609で取得した評価値とを対応付けて図示しないバッファに一時蓄積する。

【0145】
(ステップS802)最良クラスタ情報群取得部324は、制御部223が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ情報群である最良クラスタ情報群を取得する。

【0146】
(ステップS803)最良クラスタ情報群出力部331は、ステップS802で取得された最良クラスタ情報群を出力する。処理を終了する。

【0147】
なお、図8のフローチャートにおいて、分類対象の要素が予め格納されていても良い。かかる場合、ステップS601からステップS604は不要である。

【0148】
以上、本実施の形態によれば、写真等の分類対象を適切に分類できる。

【0149】
なお、本実施の形態におけるクラスタ装置3を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、3以上の要素を3以上N(Nは4以上の自然数)までのクラスタ数に分類されるように、かつ類似度の大きい要素が同一のクラスタに属するようにクラスタリングし、3以上Nまでのクラスタ数ごとに、2以上の各要素を含むクラスタのクラスタ情報の集合である2以上のクラスタ情報群を取得するクラスタリング部と、前記2以上のクラスタ情報群ごとに、クラスタ評価装置を動作させ、当該クラスタ評価装置が出力する第一評価値または総合評価値である評価値を取得する制御部と、前記制御部が取得した2以上の評価値のうちで、最も高い評価値に対応するクラスタ情報群である最良クラスタ情報群を取得する最良クラスタ情報群取得部と、前記最良クラスタ情報群を出力する最良クラスタ情報群出力部として機能させるためのプログラムである。

【0150】
また、コンピュータがアクセス可能な記録媒体は、2以上の画像が格納される画像格納部を具備し、上記のプログラムは、コンピュータを、前記画像格納部に格納されている2以上の各画像内の1以上の要素を認識する画像認識部としてさらに機能させ、前記クラスタリング部が分類する3以上の要素は、前記画像認識部が取得した3以上の要素であるものとして、コンピュータを機能させるプログラムであることは好適である。
[実験について]

【0151】
以下、上記実施の形態におけるクラスタ評価装置1、クラスタ数算出装置2,およびクラスタ装置3の実験結果について説明する。本実験での処理対象は写真であり、分類対象は写真内の人物の顔画像である。

【0152】
本実験では、主要人物の人数が変化しても、上記実施の形態における手法(提案手法)が有用であることを検証するために、写真群に写っている主要人物の人数を変化させた仮想データセットを用いて実験を行った。また、実環境のデータに対しても提案手法が有用であることを検証するために、写真共有サイトから実際に存在する写真群を用いて実験を行った。さらに具体的には、本実験において、Web上から著名人の顔画像を1万枚以上も集めた、写真共有サイト「Labeled Faces in the Wild (URL)http://vis-www.cs.umass.edu/lfw/」のデータセットから無作為に選んだ人物で、主要人物の人数が3,5,10、15人の仮想的な写真群データを作成し、ノイズとなる非顔画像を別途付加して評価用データセットを作成した。仮想データセットの詳細について、図9に示す。図9において、主要人物を3、5、10、15人と変化させて実行を行ったことを示す。また、一人あたりの顔画像は30枚用意した。また、非主要人物の顔画像も30枚用意した。従って、全ての顔画像の枚数は、主要人物が3人の場合は「120枚」、5人の場合は「180枚」、10人の場合は「330枚」、15人の場合は「480枚」となる。また、各人物と同一写真に写る回数を5回、とした。また、同一写真に写った全ての顔の組み合わせは、主要人物が3人の場合は「15」、5人の場合は「50」、10人の場合は「225」、15人の場合は「525」とした。さらに、実験でのデータ数を増加させるために、5セット用意した。

【0153】
また、本実験において、以下の実験方法を採った。上述した写真から、クラスタ装置3の画像認識部121は、顔検出技術によって写真に写っている人物の顔画像を得た。顔画像は,ある人物の顔の領域が矩形で切り出されたものである。本実験では、画像認識部121は、OKAOvision「http://www.omron.co.jp/ecb/products/mobile/.(参照)」の機能の一つである顔検出機能により実現した。

【0154】
また、クラスタリング部222は、以下のように、得られた顔画像の間の類似度を重みとした隣接行列を作成した。つまり、クラスタリング部222は、得られた顔画像から,各顔画像の特徴ベクトルを取得し、当該特徴ベクトルをもとに顔間の類似度を算出した。本実験では、上述したOKAOvisionの機能の一つである顔認識を用いて顔間の類似度を算出した。つまり、クラスタリング部222は、OKAOvisionの顔認識機能を用いて実現した。なお、クラスタリング部222における顔認識による類似度の計算は、顔の目や口の端点を特徴点として定義し、特徴点をノードとすることで顔グラフを表現した。そして、そのグラフの各ノードは、特徴点周辺から抽出されるガボール特徴量を持つ。また、クラスタリング部222は、ガボール特徴量を、画像とガボールフィルタの畳み込み演算を行うガボールウェーブレット変換によって抽出した。そして、クラスタリング部222は、抽出したガボール特徴量と個人の顔グラフとの相関を求めることにより、類似度を算出した。なお、本方法は、他の手法よりも個人識別精度が高い。

【0155】
そして、本実験において、クラスタリング部222は、算出した類似度を用いて、顔画像をクラスタリングした。

【0156】
本実験において、上述したクラスタ評価装置1、クラスタ数算出装置2、およびクラスタ装置3の手法である提案手法と、下記の2つの従来手法(従来手法1、従来手法2)とを比較した。従来手法1は、「T. Uno "An efficient algorithm for enumeraVng pseudo cliques " , Algorithmica 2010」に記載されている手法である。従来手法1は、部分グラフ内に張っているリンクの重み密度がしきい値以上の部分グラフを発見する手法である。従来手法1は、クラスタ内の類似度のみを考慮する手法である。また、従来手法2は、「M.E.Newman, "Modularity and community structure in networks", PNAS 2006」に記載されている手法である。従来手法2は、outlier を考慮しないでクラスタ数自動決定を行い、グラフをクラスタリングする手法である。また、本実験において、提案手法は、クラスタ数が未知の提案手法(未知)と、クラスタ数が既知の提案手法(既知)の2つの場合を適宜用いた。

【0157】
上記の状況において、以下の3つの実験結果について説明する。
(実験1)

【0158】
実験1では、上述した写真において、主要人物の人数を3、5、10、15人と変えながら、主要人物の人数を推定する実験を行った。主要人物の人数を推定する実験は、画像内の顔画像をクラスタリングする際のクラスタ数を決定する実験と言える。本実験は、クラスタ数算出装置2を用いて行った。なお、主要人物の人数がクラスタ数に近いほど高い評価となる。

【0159】
その結果を図10に示す。図10の3つの各手法の結果は、クラスタ数と主要人物の人数との差を示している。主要人物の人数が3人の場合は、提案手法(未知)での誤差は0.0であり、従来手法(1)(2)を上回っている。さらに、主要人物の人数が15人の場合、提案手法(未知)での誤差は2.6であり、従来手法(1)(2)を大きく上回っている。
(実験2)

【0160】
実験2では、上述した写真において、主要人物の人数を3、5、10、15人と変えながら、主要人物(inlier) と非主要人物(outlier) の2クラス分類が有効に働いているか検証するために、outlier として取り除かれた要素群のF値を算出した。かかるF値のグラフを図11に示す。図11において、提案手法(未知)、提案手法(既知)ともに、どの人数のデータに対しても従来手法(1)よりも高いF値を示している。よって、提案手法(未知)、提案手法(既知)ともに、従来手法(1)よりも主要人物(inlier) と非主要人物(outlier) の2クラス分類は有用であると考えられる。
(実験3)

【0161】
実験3では、上述した写真において、主要人物の人数を3、5、10、15人と変えながら、主要人物毎の分類が有効に働いているか検証するために主要人物とみなしたクラスタの再現率を求めた。詳細な実験データを図12に示す。図12において、各人数のデータの再現率の平均を示した。

【0162】
提案手法(未知)は、各人数のデータに対して従来手法(1)(2)より高い再現率を示した。その結果、主要人物の人数が変化しても、理想的なクラスタ数を与えることができれば提案手法も従来手法よりも主要人物毎の分類に関して、よい精度が出ることが確認できた。

【0163】
また、クラスタ数が既知の場合を比較すると、提案手法(既知) は従来手法(既知)よりもすべての人数で高い再現率を示した。これにより、outlier を含むデータに対してはoutlier を一つのクラスタにまとまりやすい性質を利用することが有効であることが確認できた。

【0164】
また、図13は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態のクラスタ評価装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図13は、このコンピュータシステム300の概観図であり、図14は、システム300のブロック図である。

【0165】
図13において、コンピュータシステム300は、CD-ROMドライブを3012含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。

【0166】
図14において、コンピュータ301は、CD-ROMドライブ3012と、MPU3013と、MPU3013と、バス3014と、ROM3015と、RAM3016と、ハードディスク3017とを含む。ROM3015は、ブートアッププログラム等のプログラムを記憶している。RAM3016は、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供する。ハードディスク3017は、通常、アプリケーションプログラム、システムプログラム、及びデータを記憶している。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。

【0167】
コンピュータシステム300に、上述した実施の形態のクラスタ評価装置等の機能を実行させるプログラムは、CD-ROM3101に記憶されて、CD-ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。また、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD-ROM3101またはネットワークから直接、ロードされても良い。

【0168】
プログラムは、コンピュータ301に、上述した実施の形態のクラスタ評価装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切なモジュールを呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。

【0169】
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。

【0170】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。

【0171】
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。

【0172】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0173】
以上のように、本発明にかかるクラスタ評価装置は、写真等の分類対象を適切に分類することを支援できるという効果を有し、クラスタ評価装置等として有用である。
【符号の説明】
【0174】
1 クラスタ評価装置
2 クラスタ数算出装置
3 クラスタ装置
10 受付部
11、21 格納部
12、22、32 処理部
13、23、33 出力部
111 画像格納部
112 クラスタ情報格納部
121 画像認識部
122 要素間類似度算出部
123 内部類似度算出部
124 第一評価値算出部
125 第二評価値算出部
126 総合評価値算出部
131 評価値出力部
222 クラスタリング部
223 制御部
224 最良クラスタ数取得部
231 最良クラスタ数出力部
324 最良クラスタ情報群取得部
331 最良クラスタ情報群出力部
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9
【図11】
10
【図12】
11
【図13】
12
【図14】
13