TOP > 国内特許検索 > 情報処理システム、情報処理方法及びプログラム > 明細書

明細書 :情報処理システム、情報処理方法及びプログラム

発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2019-021285 (P2019-021285A)
公開日 平成31年2月7日(2019.2.7)
発明の名称または考案の名称 情報処理システム、情報処理方法及びプログラム
国際特許分類 G06F  17/28        (2006.01)
G06F  17/22        (2006.01)
G06F  17/27        (2006.01)
FI G06F 17/28 681
G06F 17/22 664
G06F 17/27 685
請求項の数または発明の数 15
出願形態 OL
全頁数 16
出願番号 特願2017-193211 (P2017-193211)
出願日 平成29年10月3日(2017.10.3)
優先権出願番号 2017075572
2017141858
優先日 平成29年3月17日(2017.3.17)
平成29年7月21日(2017.7.21)
優先権主張国 日本国(JP)
日本国(JP)
発明者または考案者 【氏名】坂本 真樹
出願人 【識別番号】504133110
【氏名又は名称】国立大学法人電気通信大学
個別代理人の代理人 【識別番号】100107766、【弁理士】、【氏名又は名称】伊東 忠重
【識別番号】100070150、【弁理士】、【氏名又は名称】伊東 忠彦
審査請求 未請求
テーマコード 5B091
5B109
Fターム 5B091AA15
5B091AB17
5B091CA12
5B091CA21
5B109QB14
5B109VA09
要約 【課題】ユーザのイメージに合った文章等を生成する。
【解決手段】情報処理システムが、画像、色彩又は形容詞対に対してユーザが入力する評価尺度である形容詞対評価尺度を取得する取得部と、前記取得部によって取得される前記画像、前記色彩又は前記形容詞対評価尺度に基づいて、単語リスト及び音象徴語リストの少なくとも一方を生成するリスト生成部と、所定の条件に応じて、前記単語リスト及び前記音象徴語リストの少なくとも一方から複数の単語又は音象徴語を選択し、選択した前記複数の単語又は音象徴語を含む出力テキストを生成するテキスト生成部とを含む。
【選択図】図1
特許請求の範囲 【請求項1】
画像、色彩又は形容詞対に対してユーザにより入力される評価尺度である形容詞対評価尺度を取得する取得部と、
前記取得部によって取得される前記画像、前記色彩又は前記形容詞対評価尺度に基づいて、単語リスト及び音象徴語リストの少なくとも一方を生成するリスト生成部と、
所定の条件に応じて、前記単語リスト及び前記音象徴語リストの少なくとも一方から複数の単語又は音象徴語を選択し、選択した前記複数の単語又は音象徴語を含む出力テキストを生成するテキスト生成部と
を含む情報処理システム。
【請求項2】
前記リスト生成部は、前記取得部により取得される前記形容詞対評価尺度に応じて、色彩が連想される確率を示す第1の色彩ベクトルを算出し、前記第1の色彩ベクトルに基づいて、単語を含む前記単語リスト又は音象徴語を含む前記音象徴語リストを生成する請求項1に記載の情報処理システム。
【請求項3】
前記リスト生成部は、前記取得部により取得される前記形容詞対評価尺度に基づいて算出される前記第1の色彩ベクトルと、前記単語リストにおける単語又は前記音象徴語リストにおける音象徴語に応じて、色彩が連想される確率を示す第2の色彩ベクトルとの類似度を計算して前記単語リスト又は前記音象徴語リストを生成する請求項2に記載の情報処理システム。
【請求項4】
前記取得部は、前記画像又は前記色彩を取得し、
前記リスト生成部は、前記取得部により取得される前記画像又は前記色彩に応じた形容詞対評価尺度に基づいて、音象徴語を含む前記音象徴語リストを生成する請求項1に記載の情報処理システム。
【請求項5】
前記リスト生成部は、前記取得部により取得される前記画像又は前記色彩から算出される第1の形容詞対評価尺度と、前記音象徴語を評価した第2の形容詞対評価尺度との類似度を計算して前記音象徴語リストを生成する請求項4に記載の情報処理システム。
【請求項6】
入力テキストを取得するテキスト取得部を更に含み、
前記テキスト生成部は、前記入力テキストに含まれる単語を、前記単語リストに含まれる単語又は前記音象徴語リストに含まれる音象徴語に変換して前記出力テキストを生成する請求項1乃至5のいずれか1項に記載の情報処理システム。
【請求項7】
前記入力テキストに含まれる単語が変換される割合を示す第1の変換率を入力する第1変換率入力部を更に含む請求項6に記載の情報処理システム。
【請求項8】
前記入力テキストに含まれる単語が音象徴語に変換されるか単語に変換されるかの割合を示す第2の変換率を入力する第2変換率入力部を更に含む請求項6又は7に記載の情報処理システム。
【請求項9】
前記テキスト生成部は、前記入力テキストを形態素解析し、前記入力テキストに含まれる単語の品詞が動詞、形容詞、名詞、副詞又は連体詞である場合、前記入力テキストに含まれる単語を前記入力テキストに含まれる単語と同一の品詞の前記単語又は前記音象徴語に変換する請求項6乃至8のいずれか1項に記載の情報処理システム。
【請求項10】
前記テキスト生成部は、前記入力テキストを形態素解析し、前記入力テキストに含まれる単語の品詞が助詞である場合、前記入力テキストに含まれる単語を変換しない請求項6乃至9のいずれか1項に記載の情報処理システム。
【請求項11】
前記テキスト生成部は、前記出力テキストに含まれる文における各単語の間の意味的関係を解析し、当該意味的関係に応じて、前記単語リストに含まれる単語又は前記音象徴語リストに含まれる音象徴語を選択する請求項6乃至10のいずれか1項に記載の情報処理システム。
【請求項12】
文字数を指定する指定部を更に含み、
前記テキスト生成部は、前記文字数となるように前記単語リストに含まれる単語又は前記音象徴語リストに含まれる音象徴語を選択する請求項1乃至11のいずれか1項に記載の情報処理システム。
【請求項13】
前記出力テキストの色彩ベクトルを計算する計算部を更に含み、
前記テキスト生成部は、前記取得部によって取得される前記画像、前記色彩又は前記形容詞対評価尺度に基づいて計算される色彩ベクトルと、前記出力テキストの色彩ベクトルとの類似度が高くなるように、前記単語リストに含まれる単語又は前記音象徴語リストに含まれる音象徴語を選択して前記出力テキストを生成する請求項1乃至12のいずれか1項に記載の情報処理システム。
【請求項14】
情報処理システムが行う情報処理方法であって、
情報処理システムが、画像、色彩又は形容詞対に対してユーザが入力する評価尺度である形容詞対評価尺度を取得する取得手順と、
情報処理システムが、前記取得手順で取得される前記画像、前記色彩又は前記形容詞対評価尺度に基づいて、単語リスト及び音象徴語リストの少なくとも一方を生成するリスト生成手順と、
情報処理システムが、所定の条件に応じて、前記単語リスト及び前記音象徴語リストの少なくとも一方から複数の単語又は音象徴語を選択し、選択した前記複数の単語又は音象徴語を含む出力テキストを生成するテキスト生成手順と
を含む情報処理方法。
【請求項15】
コンピュータに情報処理方法を実行させるためのプログラムであって、
コンピュータが、画像、色彩又は形容詞対に対してユーザが入力する評価尺度である形容詞対評価尺度を取得する取得手順と、
コンピュータが、前記取得手順で取得される前記画像、前記色彩又は前記形容詞対評価尺度に基づいて、単語リスト及び音象徴語リストの少なくとも一方を生成するリスト生成手順と、
コンピュータが、所定の条件に応じて、前記単語リスト及び前記音象徴語リストの少なくとも一方から複数の単語又は音象徴語を選択し、選択した前記複数の単語又は音象徴語を含む出力テキストを生成するテキスト生成手順と
を実行させるためのプログラム。
発明の詳細な説明 【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
従来、人工知能(AI、Artificial Intelligence)を用いて、文章を生成する技術が知られている(例えば、特許文献1等)。
【0003】
近年、AIが書いた小説が、著名な賞の選考において審査を通過したことにより、小説を書くAIの技術が注目されている。この技術では、例えば、小説の構造及び小説に登場する様々な属性をあらかじめ人手により設定しておき、文章の生成をAIにより自動化する方法が用いられる。例えば、複数のプレーヤによるゲームのログを記録してシナリオを作成し、人間が面白いと思うシナリオを選択して人間が小説として記述する方法が知られている。
【0004】
さらに、連想される色彩の連想確率を示すベクトル(以下「色彩ベクトル」という。)から、複数の単語を集めた単語リストを生成する技術が知られている(例えば、特許文献2及び特許文献3等)。
【先行技術文献】
【0005】

【特許文献1】特開2017‐102328号公報
【特許文献2】特許第5618150号明細書
【特許文献3】特許第5344756号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来の技術では、音源又は商品のコンセプト等を示す画像、色彩又は形容詞対評価尺度等で示す直感的なイメージから文章等を生成できないという問題がある。
【0007】
本発明の1つの側面は、このような問題に鑑みてなされたものであり、音源又は商品のコンセプト等を示す画像、色彩又は形容詞対評価尺度等で示す直感的なイメージから文章等を生成することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するため、情報処理システムは、
画像、色彩又は形容詞対に対してユーザにより入力される評価尺度である形容詞対評価尺度を取得する取得部と、
前記取得部によって取得される前記画像、前記色彩又は前記形容詞対評価尺度に基づいて、単語リスト及び音象徴語リストの少なくとも一方を生成するリスト生成部と、
所定の条件に応じて、前記単語リスト及び前記音象徴語リストの少なくとも一方から複数の単語又は音象徴語を選択し、選択した前記複数の単語又は音象徴語を含む出力テキストを生成するテキスト生成部と
を含む。
【発明の効果】
【0009】
音源又は商品のコンセプト等を示す画像、色彩又は形容詞対評価尺度等で示す直感的なイメージから文章等を生成することができる。
【図面の簡単な説明】
【0010】
【図1】第1実施形態における情報処理システムの全体構成例を示す図である。
【図2】情報処理装置のハードウェア構成例を示すブロック図である。
【図3】第1実施形態における全体処理例を示すフローチャートである。
【図4】入力画面の一例を示す図(その1)である。
【図5】単語リストの生成に用いられるデータの例を示す図である。
【図6】音象徴語リストの生成に用いられるデータの例を示す図である。
【図7】入力画面の一例を示す図(その2)である。
【図8】第2実施形態における情報処理システムの全体構成例を示す図である。
【図9】第2実施形態における全体処理例を示すフローチャートである。
【図10】第3実施形態における全体処理例を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本発明の好適な実施形態の具体例を示して説明する。

【0012】
<第1実施形態>
<全体構成例>
図1は、第1実施形態における情報処理システムの全体構成例を示す図である。図示するように、情報処理システム1は、1以上の情報処理装置を有する。具体的には、情報処理システム1は、情報処理装置の例であるサーバ2と、情報処理装置の例であるPC(Personal Computer)3とを有する。

【0013】
図示するように、サーバ2と、PC3とは、ネットワーク等によって接続され、相互にデータを送受信することができる。

【0014】
なお、サーバ2と、PC3とは、一体となる構成、すなわち、情報処理システム1は、1つの情報処理装置で構成されてもよい。一方で、情報処理システム1は、3以上の情報処理装置を有してもよい。以下、図示する全体構成を例に説明する。

【0015】
<ハードウェア構成例>
図2は、情報処理装置のハードウェア構成例を示すブロック図である。例えば、サーバ2及びPC3は、同一のハードウェア構成である。以下、サーバ2を例に説明し、PC3の説明を省略する。

【0016】
サーバ2は、CPU(Central Processing Unit)2H01と、記憶装置2H02と、入力装置2H03と、出力装置2H04と、インタフェース(interface)2H05とを有する。各ハードウェア資源は、バス(bus)で接続され、相互にデータを送受信する。

【0017】
CPU2H01は、演算装置及び制御装置の例である。記憶装置2H02は、主記憶装置等である。また、記憶装置2H02は、SSD(Solid State Drive)又はハードディスク等の補助記憶装置があってもよい。入力装置2H03は、ユーザURから操作を入力する装置である。例えば、入力装置2H03は、キーボード、マウス又はこれらの組み合わせ等である。出力装置2H04は、ユーザURに処理結果等を表示する装置である。例えば、出力装置2H04は、ディスプレイ等である。インタフェース2H05は、外部装置とデータを入出力する装置である。例えば、インタフェース2H05は、コネクタ又は通信装置等である。

【0018】
なお、ハードウェア構成は、図示する構成に限られない。例えば、ハードウェア構成は、演算装置又は制御装置等が内部又は外部に更にある構成等でもよい。

【0019】
<全体処理例>
図3は、第1実施形態における全体処理例を示すフローチャートである。

【0020】
<形容詞対評価尺度の取得例>
ステップS01では、情報処理システム1は、入力画面上からのユーザURの操作によって形容詞対評価尺度ADJを取得する。例えば、情報処理システム1は、まず、PC3上の画面に、以下のような入力画面を表示する。

【0021】
図4は、入力画面の一例を示す図(その1)である。

【0022】
例えば、入力画面PNL1を用いると、ユーザURは、所定の形容詞対PADに対して評価尺度をスクロールバー等のUI(User Interface)によって入力できる。具体的には、図示する形容詞対PADは、「明るい」及び「暗い」という明るさを示す対極の意味を示す形容詞が対となる例である。例えば、特許第5678836号明細書に記載されているように、あらかじめ、形容詞対PADに対して、数段階の整数値が設定され、ユーザURがUIによって整数値を入力すると、情報処理システム1は、各形容詞対について形容詞対評価尺度ADJを取得できる。

【0023】
なお、入力画面PNL1に示す形容詞対以外の形容詞対が用いられてもよい。また、用いられる形容詞対は、入力画面PNL1が示すチェックボックス等のUIによって選択されてもよい。さらに、形容詞対評価尺度ADJは、整数値に限られず、小数点以下のある値が用いられてもよい。

【0024】
<第1の色彩ベクトルの算出例>
ステップS02では、情報処理システム1は、取得された形容詞対評価尺度ADJから連想される各色の連想確率を示すベクトル(以下「第1の色彩ベクトル」という。)を算出する。なお、色彩とは、単色でもよいし、複数の色が混じった色でもよい。

【0025】
具体的には、被験者が合計で120名の実験において、「赤」の色を20名の人が連想する場合には、「赤」の連想確率は、「20名÷120名≒0.17」となる。そして、色彩ベクトルは、「色彩ベクトル=(黒の連想確率、茶の連想確率、赤の連想確率、・・・・、青の連想確率、緑の連想確率、白の連想確率)」のように示す。

【0026】
したがって、形容詞対評価尺度に応じた色彩ベクトルを算出する場合には、形容詞対に対して被験者に連想する色彩を回答してもらう実験によって、形容詞対評価尺度と、色彩ベクトルとを対応させるデータがあらかじめ用意される。このようなデータがあると、情報処理システム1は、形容詞対評価尺度ADJから第1の色彩ベクトルを算出できる。

【0027】
<単語リスト等の生成例>
ステップS03では、情報処理システム1は、算出される第1の色彩ベクトルに基づいて、あらかじめデータベースDBSに記憶される単語W1を選び、単語リストLI1を生成する。

【0028】
また、データベースDBSには、あらかじめ実験等によって、単語W1と、単語W1に対応する色彩ベクトル(以下「第2の色彩ベクトル」という。)とが紐付けられて記憶される。

【0029】
図5は、単語リストの生成に用いられるデータの例を示す図である。例えば、データベースDBSには、図示するような色彩テーブルT1及び連想確率テーブルT2が記憶される。

【0030】
色彩テーブルT1には、候補色Ci(を示すデータ)と、候補色Ciを一意に識別できる色IDが対応付けられる。なお、添え字iは、例えば、値が「0」から「C-1」までの整数等が採用される。

【0031】
連想確率テーブルT2には、候補色Ciと、単語wjとの組み合わせに対して、連想確率p(ci|wj)が対応付けられる。なお、連想確率p(ci|wj)は、単語wjが与えられた場合に、被験者によって連想される候補色Ciの連想確率である。したがって、第2の色彩ベクトルは、あらかじめ実験で所定の単語を見せた場合に被験者が連想する色彩の回答数を全回答数で除算して算出される値である。

【0032】
以上のようにして、情報処理システム1は、形容詞対評価尺度ADJに応じて算出される第1の色彩ベクトルと、単語W1に対応する第2の色彩ベクトルとの類似度を計算して単語リストLI1を生成するのが望ましい。また、類似度は、例えば、コサイン尺度等によって計算される。

【0033】
なお、情報処理システム1は、同様にして音象徴語リストを生成してもよい。この場合には、データベースDBSには、あらかじめ行われる実験によって、音象徴語と、音象徴語に対応する第2の色彩ベクトルとが紐付けられて記憶される。

【0034】
図6は、音象徴語リストの生成に用いられるデータの例を示す図である。例えば、データベースDBSには、図示するような連想確率テーブルT3が記憶される。連想確率テーブルT2と同様に、音象徴語と、候補色Ciの組み合わせに対して、連想確率p(ci|wj)が対応付けられる。

【0035】
<単語リスト又は音象徴語リストから所定の条件に応じて複数の単語又は音象徴語を選択して出力テキストを生成する例>
ステップS04では、情報処理システム1は、ステップS03によって生成される単語リストLI1等に基づいて、出力テキストDOUTを生成する。

【0036】
所定の条件は、例えば、類似度等に基づく単語の選択方法であって、あらかじめ情報処理システム1に設定される。具体的には、情報処理システム1には、類似度が高い単語を高い確率で選択するようにする等のように所定の条件が設定される。ほかにも、所定の条件は、例えば、所定値以上の類似度となる単語のみを選択するようにする等でもよい。

【0037】
なお、出力テキストDOUTは、例えば、以下のように、情報処理システム1が入力テキストDINを取得し、入力テキストDINに含まれる単語を変換して生成されるのが望ましい。

【0038】
図7は、入力画面の一例を示す図(その2)である。この例では、入力画面PNL2には、まず、情報処理システム1によって取得される入力テキストDINが表示されるとする。例えば、入力テキストDINは、テキストデータ形式等で入力される。なお、入力テキストDINは、図示するような画面に、ユーザURが文字等を直接入力する操作によって入力されてもよい。

【0039】
また、この例では、画像入力ボタンBIMGが押されると、情報処理システム1は、画像IMG等を取得できる。なお、画像IMGは、画像入力ボタンBIMG等の操作で情報処理システム1に取得されるに限られず、例えば、ドラック・アンド・ドロップ等の操作で情報処理システム1に取得されてもよい。このようにして取得される画像IMGは、出力テキストDOUTとして生成される文章のイメージを示すデータである。

【0040】
具体的には、商品開発等において、開発する商品のイメージを示す文章を考える場合では、ユーザURは、商品コンセプト又は商品を使用する場面等を示す画像IMGを情報処理システム1に入力する。

【0041】
次に、情報処理システム1は、取得した画像IMGを解析する。例えば、情報処理システム1は、画像IMGに使用される色を抽出したり、画像IMGに使用される色の面積等を算出してランク付けしたりする。このようにすると、情報処理システム1は、取得した画像IMGから色彩ベクトルを計算することができる。なお、画像IMGは、背景色を除く等の処理が行われてもよい。ほかにも、情報処理システム1は、画像IMGに写る被写体を画像認識等によって認識し、被写体の種類等を特定してもよい。

【0042】
また、図示するように、情報処理システム1は、入力テキストDINが取得される場合には、入力テキストDINに含まれる単語が変換される割合(以下「第1の変換率P1」という。)を入力するのが望ましい。図示する例では、変換率入力バーSRB1によって、第1の変換率P1が入力される例である。第1の変換率P1が高く設定されると、入力テキストDINは、変換される割合が高くなる。つまり、第1の変換率P1が高い場合には、情報処理システム1は、入力テキストDINに含まれる単語のうち、変換対象とする単語の割合を高くする。図示する例では、変換率入力バーSRB1によって、第1の変換率P1が「100パーセント」と入力されるため、情報処理システム1は、入力テキストDINに含まれる単語をすべて変換する設定になる。このように、第1の変換率P1が情報処理システム1に入力されると、ユーザURは、入力テキストDINをどの程度変換するかの割合を設定することができる。

【0043】
さらに、図示するように、情報処理システム1は、入力テキストDINに含まれる単語をオノマトペ等の音象徴語に変換するか、単語W1に変換するかの割合(以下「第2の変換率P2」という。)を入力するのが望ましい。図示する例では、第1の変換率P1と同様に、第2の変換率P2は、オノマトペ率入力バーSRB2によって入力される例である。図示する例では、オノマトペ率入力バーSRB2によって、第2の変換率P2の例であるオノマトペ率が「35パーセント」と入力されるため、変換対象となる単語のうち、「35パーセント」の単語は、オノマトペに変換される。

【0044】
さらに、選択用インタフェースSEL等で、文字数CNM及び変換において同一の単語を使用できる回数等が指定されてもよい。主に、入力テキストDINが存在しない場合において、文字数CNMが指定されると、情報処理システム1は、文字数CNMにより出力テキストDOUT全体の文字数を指定する構成としてもよい。また、同様に入力テキストDINが存在しない場合において、情報処理システム1は、指定された文字数CNMと同じ文字数の単語もしくは音象徴語又は指定された文字数CNM以上の単語もしくは音象徴語を選択し、組み合わせて出力テキストDOUTを生成してもよい。

【0045】
なお、入力テキストDINに同一の単語が複数含まれる場合には、各単語は、すべて同一の単語に変換されてもよいし、異なる単語に変換されてもよい。具体的には、入力テキストDINに、「A」という単語が2個以上含まれる場合には、1個目の「A」は、「B」、2個目の「A」は、「C」というように、異なる単語に変換されてもよいし、1個目の「A」も2個目の「A」も、どちらも「B」に変換されてもよい。なお、異なる単語に変換する場合には、例えば、情報処理システム1は、単語リストLI1にある単語のうち、類似度が上位となった複数の単語をランダムに選択して変換する。

【0046】
また、情報処理システム1は、入力テキストDINを形態素解析してもよい。そして、情報処理システム1は、入力テキストDINを形態素解析すると、入力テキストDINに含まれる各単語の品詞を特定できる。

【0047】
次に、情報処理システム1は、形態素解析の解析結果から、入力テキストDINに含まれる単語の品詞が動詞、形容詞、名詞、副詞又は連体詞である場合には、変換対象とするのが望ましい。なお、変換対象とする品詞は、例えば、選択用インタフェースSEL等でユーザURが選択できるとする。具体的には、情報処理システム1は、選択用インタフェースSELにおいてチェックボックスのUI等でユーザURに選択された品詞を変換対象となるように設定する。なお、変換対象とする品詞の設定方法は、図示するような方法に限られない。

【0048】
一方で、助詞は、変換対象から外されるのが望ましい。具体的には、図示する例のように第1の変換率P1が「100パーセント」であっても、「を」という格助詞は、変換されず、出力テキストDOUTでも維持される。これに対して、図示するような設定であると、副詞である「また」、形容詞である「大きな」、名詞である「パソコン」及び動詞である「買った」という単語は、選択用インタフェースSELによって選ばれた品詞であるため、変換対象となる。そして、情報処理システム1は、変換対象となった単語を同一の品詞である別の単語に変換して出力テキストDOUTを生成する。このように、情報処理システム1は、入力テキストDINに含まれる単語の品詞を解析して変換するのが望ましい。

【0049】
また、情報処理システム1は、シソーラス(Thesaurus)を利用して出力テキストDOUTに含まれる各単語の間の意味的関係を解析してもよい。そして、情報処理システム1は、意味的関係において、関係が成り立つように単語リストから単語を選択してもよい。例えば、述語となる単語を選択する場合において、情報処理システム1は、主語の種類等に対応して、出力テキストDOUTが文章として成り立つ述語を選択する。具体的には、主語が植物を指す単語である場合には、情報処理システム1は、動物等に用いられる述語でなく、植物に用いられる述語を指す単語を単語リストから選択するようにする。このようにして、情報処理システム1は、主語及び述語の意味的関係等が適切となるように、単語リストから単語又は音象徴語リストから音象徴語を選択してもよい。

【0050】
さらに、情報処理システム1は、出力テキストDOUTの色彩ベクトルVCTを計算してもよい。例えば、出力テキストDOUTに複数の単語が含まれる場合には、情報処理システム1は、各単語の色彩ベクトルと、各単語が出現する頻度と、各単語の影響度とを乗算した結果を正規化して出力テキストDOUTの色彩ベクトルVCTを計算する。

【0051】
頻度は、出力テキストDOUTに含まれる全単語数に対して、対象とする単語が出現する数の割合である。

【0052】
影響度は、単語から色彩を連想するのに与える影響の大きさである。また、影響度は、色彩との結びつきの強さを示す。したがって、影響度は、ある単語から色彩を被験者が連想しやすいと回答した割合である。具体的には、あらかじめ合計20名の被験者で行われる実験において、「雨」を含むテキストから、「雨」を連想したと回答した被験者が10名であると、「雨」の影響度は、「10÷20=0.5」となる。

【0053】
出力テキストDOUTに、「海」、「太陽」及び「夏」の3つの単語が含まれる例では、情報処理システム1は、まず、「海」、「太陽」及び「夏」のそれぞれの「色彩ベクトル×頻度×影響度」を計算する。次に、情報処理システム1は、「海」の計算結果、「太陽」の計算結果及び「夏」の計算結果を加算し、全単語数である「3」で除算して正規化することで、出力テキストDOUTの色彩ベクトルVCTを計算する。

【0054】
そして、情報処理システム1は、形容詞対評価尺度等から算出される第1の色彩ベクトルと、出力テキストDOUTの色彩ベクトルVCTとの類似度を計算する。このようにして計算される類似度が高くなるように、情報処理システム1は、単語リストに含まれる単語又は音象徴語リストに含まれる音象徴語を選択して出力テキストDOUTを生成してもよい。

【0055】
<機能構成例>
図1に図示するように、情報処理システム1は、取得部F1と、リスト生成部F2と、テキスト生成部F3とを含む機能構成である。また、情報処理システム1は、図示するように、テキスト取得部F4と、指定部F5と、第1変換率入力部F6と、第2変換率入力部F7と、計算部F8とを更に含む機能構成であるのが望ましい。すなわち、情報処理システム1は、図1に示す機能構成では、テキスト取得部F4、指定部F5、第1変換率入力部F6、第2変換率入力部F7及び計算部F8を必須の機能構成としない。以下、図示する機能構成を例に説明する。

【0056】
取得部F1は、形容詞対評価尺度ADJ、色彩CLR又は画像IMG等から形容詞対評価尺度ADJを取得する取得手順を行う。例えば、取得部F1は、入力装置2H03等によって実現される。

【0057】
リスト生成部F2は、取得部F1が取得する形容詞対評価尺度ADJに基づいて、単語リストLI1を生成するリスト生成手順を行う。なお、リスト生成部F2は、音象徴語リストを生成してもよい。例えば、リスト生成部F2は、CPU2H01等によって実現される。

【0058】
テキスト生成部F3は、リスト生成部F2が生成する単語リストLI1から、所定の条件を満たす複数の単語を選択する。そして、テキスト生成部F3は、選択した複数の単語を用いて出力テキストDOUTを生成するテキスト生成手順を行う。例えば、テキスト生成部F3は、CPU2H01等によって実現される。

【0059】
テキスト取得部F4は、入力テキストDINを取得するテキスト取得手順を行う。このように、テキスト取得部F4が入力テキストDINを取得する場合には、テキスト生成部F3は、入力テキストDINに含まれる単語をリスト生成部F2が生成する単語リストが示す単語に変換して出力テキストDOUTを生成する。例えば、テキスト取得部F4は、入力装置2H03等によって実現される。

【0060】
指定部F5は、文字数CNMを指定する指定手順を行う。このように、指定部F5によって文字数CNMが指定される場合には、テキスト生成部F3は、入力テキストDINに含まれる単語を文字数CNMとなるように変換して出力テキストDOUTを生成する。例えば、指定部F5は、入力装置2H03等によって実現される。

【0061】
第1変換率入力部F6は、第1の変換率P1を入力する第1変換率入力手順を行う。このように、第1変換率入力部F6によって第1の変換率P1が入力される場合には、テキスト生成部F3は、入力テキストDINに含まれる単語のうち、第1の変換率P1が示す割合の単語が変換されるようにして出力テキストDOUTを生成する。例えば、第1変換率入力部F6は、入力装置2H03等によって実現される。

【0062】
第2変換率入力部F7は、第2の変換率P2を入力する第2変換率入力手順を行う。このように、第2変換率入力部F7によって第2の変換率P2が入力される場合には、テキスト生成部F3は、変換対象となる単語のうち、第2の変換率P2が示す割合となるように音象徴語及び単語に変換して出力テキストDOUTを生成する。例えば、第2変換率入力部F7は、入力装置2H03等によって実現される。

【0063】
計算部F8は、出力テキストDOUTの色彩ベクトルVCTを計算する。そして、テキスト生成部F3は、計算部F8が計算する出力テキストDOUTの色彩ベクトルVCTと、取得部F1が取得する形容詞対評価尺度ADJに基づいて計算される色彩ベクトルとの類似度が高くなるように出力テキストDOUTを生成する。例えば、計算部F8は、CPU2H01等によって実現される。

【0064】
<第2実施形態>
第2実施形態では、情報処理システム1は、音象徴語が含まれる出力テキストDOUTを生成する。

【0065】
<全体構成例>
図8は、第2実施形態における情報処理システムの全体構成例を示す図である。第1実施形態と比較すると、リスト生成部F2は、取得部F1で取得される色彩CLR又は画像IMGから形容詞対評価尺度を計算するのが異なる。そして、リスト生成部F2は、計算される形容詞対評価尺度に基づいて、音象徴語W2を選択して音象徴語リストLI2を生成する。以下、異なる構成を中心に説明し、重複する説明を省略する。

【0066】
また、色彩CLRがあらかじめ実験で形容詞対評価尺度と結び付けされていると、取得部F1で取得される色彩CLR又は画像IMGから形容詞対評価尺度(以下「第1の形容詞対評価尺度」という。)が算出できる。

【0067】
音象徴語W2は、例えば、特許第5354425号明細書等に記載されている方法等によって形容詞対評価尺度が算出できる。具体的には、まず、音韻形態データベースが利用できると、音象徴語W2を解析して音素表記情報が生成できる。次に、音素表記情報が示す各音韻形態は、定量イメージテーブルがあらかじめ用意されていると、それぞれの形容詞対評価尺度(以下「第2の形容詞対評価尺度」という。)が特定できる。このようにして特定される各音韻形態のそれぞれの形容詞対評価尺度に基づいて、音象徴語W2に対応する第2の形容詞対評価尺度は、あらかじめ計算することができる。したがって、音象徴語W2は、データベースDBSにおいて、第2の形容詞対評価尺度と紐付けできる。

【0068】
そして、リスト生成部F2は、第1の形容詞対評価尺度と、第2の形容詞対評価尺度との類似度を計算するのが望ましい。類似度の計算は、例えば、コサイン尺度等によって計算される。

【0069】
<全体処理例>
図9は、第2実施形態における全体処理例を示すフローチャートである。

【0070】
<画像又は色彩の取得例>
ステップS11では、情報処理システム1は、入力画面上からのユーザURの操作によって画像IMG又は色彩CLRを取得する。例えば、画像IMGは、第1実施形態と同様に、入力画面PNL2等によって取得される。また、色彩CLRは、色を指定できる操作画面又はRGB値等を入力する操作等によって取得される。

【0071】
<画像又は色彩に応じる形容詞対評価尺度の算出例>
ステップS12では、情報処理システム1は、取得された画像IMG又は色彩CLRに応じた第1の形容詞対評価尺度を算出する。

【0072】
<音象徴語リストの生成例>
ステップS13では、情報処理システム1は、算出された第1の形容詞対評価尺度に基づいて、音象徴語W2を複数選択して音象徴語リストLI2を生成する。

【0073】
<音象徴語リストから所定の条件に応じて複数のデータを選択して出力テキストを生成する例>
ステップS14では、情報処理システム1は、あらかじめ設定される所定の条件に応じて音象徴語を音象徴語リストから選択して出力テキストを生成する。なお、所定の条件は、例えば、第1実施形態と同様である。

【0074】
<変形例>
未知語がある場合には、未知語の影響度及び色彩ベクトル等が推定されてもよい。例えば、未知語の影響度は、プリミティブワードの影響度と、類似度とを乗算して計算される値である。一方で、未知語の色彩ベクトルは、プリミティブワードの色彩ベクトルと、類似度とを乗算して計算される値である。

【0075】
プリミティブワードは、色彩と結びつきのある単語である。

【0076】
未知語は、コーパスに出現するプリミティブワード以外の言葉である。

【0077】
具体的には、まず、「水泳」という言葉が未知語であって、プリミティブワードが「海」及び「夏」であるとする。そして、「水泳」と、「海」との類似度が「0.7」であるとし、「水泳」と、「夏」との類似度が「0.9」であるとする。なお、プリミティブワードと、未知語との類似度は、潜在的意味分析(Latent Semantic Analysis、LSA)に基づくコサイン類似度等である。

【0078】
この例では、「水泳」の影響度は、「海」の影響度に類似度である「0.7」を乗じた値と、「夏」の影響度に類似度である「0.9」を乗じた値とを加算し、「水泳」に関するプリミティブワードの総数である「2」で除算した値となる。

【0079】
また、「水泳」の色彩ベクトルは、「海」の色彩ベクトルに類似度である「0.7」を乗じた値と、「夏」の色彩ベクトルに類似度である「0.9」を乗じた値とを加算し、「2」で除算した値となる。

【0080】
<第3実施形態>
第3実施形態では、情報処理システム1は、再帰型ニューラルネットワーク(Recurrent Neural Network(以下「RNN」という。))に基づいて出力テキストDOUTを生成する。以下、図9に示す全体処理にRNNによる処理を適用する例で説明する。

【0081】
<全体処理例>
図10は、第3実施形態における全体処理例を示すフローチャートである。図9と比較すると、図示する処理は、ステップS14がステップS21となる点が異なる。以下、第2実施形態と異なる点を中心に説明する。

【0082】
<RNNによる出力テキストの生成例>
ステップS21では、情報処理システム1は、音象徴語リスト等からRNNによって複数のデータを選択して出力テキストを生成する。

【0083】
具体的には、まず、ステップS13で、「赤い」、「りんご」及び「クリスマス」という単語が抽出され、リスト化されたとする。この場合には、情報処理システム1は、RNNによって、「赤いりんごをクリスマスに食べる。」という出力テキストを生成する。

【0084】
RNNを用いると、情報処理システム1は、学習データにおける特有の単語の使い方を学習できる。したがって、例えば、歌詞を生成する場合には、情報処理システム1は、歌詞ならではの単語の使い方を学習し、歌詞を生成する場合において、連続した単語の中で、ある単語の次に来る単語の出現確率を予測できる。

【0085】
また、RNNを用いると、情報処理システム1は、過去の状態を加味して学習が可能となる。そのため、フィードフォワード(Feed Forward)に処理を行う、いわゆる通常のニューラルネットワークを用いる場合と比較して、RNNを用いると、情報処理システム1は、時系列の流れにおいて、言葉の意味を予測したり、分類したりすることができる。特に、文脈上、次に来る言葉が異なる場合において、情報処理システム1は、精度良く言葉を予測できる。

【0086】
ほかにも、RNNを用いると、入力及び出力を可変長とすることができる。

【0087】
なお、全体処理には、RNNが適用されるに限られない。すなわち、全体処理には、RNN以外の文章作成に利用可能な種々の公知の機械学習方法が適用できる。

【0088】
<まとめ>
以上のように、例えば、画像IMG、色彩CLR又は形容詞対評価尺度ADJが取得できると、情報処理システム1は、画像IMG、色彩CLR又は形容詞対評価尺度ADJが示すイメージに合う単語W1又は音象徴語W2を特定できる。このようにして、特定された単語W1又は音象徴語W2を利用して、情報処理システム1は、出力テキストDOUTを生成する。

【0089】
また、出力テキストDOUTは、歌詞等でもよい。このような場合には、作曲する歌のイメージを示す画像IMG等が情報処理システム1に入力される。

【0090】
このように、画像IMG、色彩CLR又は形容詞対評価尺度ADJによって、商品の使用場面又は商品コンセプト等の抽象的なイメージから、情報処理システム1は、広告コピー等を示す出力テキストDOUTを生成できる。

【0091】
情報処理システム1は、小説又は漫画等の文章を生成し、出力してもよい。また、情報処理システム1は、チャットbot等の対話システムに応用されてもよい。

【0092】
<他の実施形態>
なお、全体処理は、図示する順序に限られない。例えば、各処理の一部又は全部は、並列又は図示する順序とは異なる順序で行われてもよい。また、各処理は、複数の情報処理装置によって、冗長、分散、並列、仮想化又はこれらを組み合わせて実行されてもよい。

【0093】
なお、本発明に係る情報処理方法は、プログラムによって実現されてもよい。すなわち、プログラムは、1以上の情報処理装置を含む情報処理システム等であるコンピュータに各処理を実行させるためのコンピュータプログラムである。

【0094】
したがって、プログラムに基づいて情報処理方法が実行されると、コンピュータが有する演算装置及び制御装置は、各処理を実行するため、プログラムに基づいて演算及び制御を行う。また、コンピュータが有する記憶装置は、各処理を実行するため、プログラムに基づいて、処理に用いられるデータを記憶する。

【0095】
また、プログラムは、コンピュータが読み取り可能な記録媒体に記録されて頒布することができる。なお、記録媒体は、磁気テープ、フラッシュメモリ、光ディスク、光磁気ディスク又は磁気ディスク等のメディアである。また、記録媒体は、補助記憶装置等でもよい。さらに、プログラムは、電気通信回線を通じて頒布することができる。

【0096】
以上、本発明の好ましい実施形態の具体例について詳述したが、本発明は、図面に記載された実施形態等に限定されない。すなわち、特許請求の範囲に記載された本発明の広範な要旨の範囲内において、種々の変形又は変更が可能である。
【符号の説明】
【0097】
1 情報処理システム
DIN 入力テキスト
DOUT 出力テキスト
UR ユーザ
IMG 画像
CLR 色彩
ADJ 形容詞対評価尺度
W1 単語
W2 音象徴語
LI1 単語リスト
LI2 音象徴語リスト
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9