Top > Search of Japanese Patents > UTILITY VALUE ESTIMATION DEVICE, ISSUE SET IMPORTANCE CALCULATION DEVICE, AND PROGRAM > Specification

Specification :(In Japanese)効用値推定装置、論点集合重要度算出装置、及びプログラム

Country (In Japanese)日本国特許庁(JP)
Gazette (In Japanese)公開特許公報(A)
Publication number P2019-012444A
Date of publication of application Jan 24, 2019
Title of the invention, or title of the device (In Japanese)効用値推定装置、論点集合重要度算出装置、及びプログラム
IPC (International Patent Classification) G06F  16/00        (2019.01)
G06F  16/30        (2019.01)
G06F  17/27        (2006.01)
FI (File Index) G06F 17/30 340A
G06F 17/30 170A
G06F 17/27 665
Number of claims or invention 8
Filing form OL
Total pages 21
Application Number P2017-129141
Date of filing Jun 30, 2017
Exceptions to lack of novelty of invention (In Japanese)特許法第30条第2項適用申請有り 平成29年5月9日 https://www.ai-gakkai.or.jp/jsai2017/にて公開 平成29年5月24日人工知能学会 全国大会 第31回にて公開
Inventor, or creator of device (In Japanese)【氏名】藤田 桂英
Applicant (In Japanese)【識別番号】504132881
【氏名又は名称】国立大学法人東京農工大学
Representative (In Japanese)【識別番号】100079049、【弁理士】、【氏名又は名称】中島 淳
【識別番号】100084995、【弁理士】、【氏名又は名称】加藤 和詳
【識別番号】100099025、【弁理士】、【氏名又は名称】福田 浩志
Request for examination (In Japanese)未請求
Theme code 5B091
F-term 5B091AA15
5B091CA02
Abstract (In Japanese)【課題】ユーザにとっての効用値を精度良く推定することができる。
【解決手段】論点抽出部36が、評価対象の発話テキストから、予め定められた条件を満たす名詞を、論点として抽出する。効用値算出部40が、抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、分類された論点集合毎に定められた、対象ユーザにとっての論点集合の重要度と極性とに基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定する。
【選択図】図1
Scope of claims (In Japanese)【請求項1】
評価対象の発話テキストについて、対象ユーザにとっての選好度合いを示す効用値を推定する効用値推定装置であって、
評価対象の発話テキストから、予め定められた条件を満たす名詞を、論点として抽出する論点抽出部と、
前記論点抽出部によって抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度とに基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定する効用値推定部と、
を含む効用値推定装置。
【請求項2】
前記効用値推定部は、前記論点抽出部によって抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度、及び前記対象ユーザにとっての前記論点集合を有する発話テキストの極性と、に基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定する請求項1記載の効用値推定装置。
【請求項3】
前記対象ユーザは、複数の対象ユーザであって、
前記評価対象の発話テキストは、複数の評価対象の発話テキストであって、
前記効用値推定部は、前記複数の対象ユーザの各々及び前記複数の評価対象の発話テキストの各々に対し、前記分類された論点集合毎及び前記対象ユーザ毎に定められた、前記対象ユーザにとっての前記論点集合の重要度を用いて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定し、
前記複数の対象ユーザの各々及び前記複数の評価対象の発話テキストの各々に対して推定された前記効用値に基づいて、2以上の対象ユーザの間で合意する発話テキスト候補を抽出し、抽出された発話テキスト候補と、発話テキスト候補に合意する2以上の対象ユーザの各々との間を結んだグラフ構造を生成して出力部により提示する可視化部を更に含む請求項1又は2記載の効用値推定装置。
【請求項4】
前記対象ユーザは、複数の仮想ユーザであって、
前記効用値推定部は、前記複数の仮想ユーザの各々に対し、前記分類された論点集合毎及び前記仮想ユーザ毎に定められた、前記仮想ユーザにとっての前記論点集合の重要度を用いて、前記評価対象の発話テキストについての前記仮想ユーザの効用値を推定し、
前記複数の仮想ユーザの各々に対して推定された前記効用値に基づいて、前記評価対象の発話テキストについて総合評価値を算出する総合評価部を更に含む請求項1又は2記載の効用値推定装置。
【請求項5】
複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する論点抽出部と、
前記論点抽出部によって抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合に分類する論点集合分類部と、
前記ユーザの各々について、前記ユーザによる発話テキストから抽出された論点の各々が、前記分類された論点集合の何れに属するかに基づいて、前記分類された論点集合毎に、前記ユーザにとっての前記論点集合の重要度を算出する重要度算出部と、
を含む論点集合重要度算出装置。
【請求項6】
前記ユーザの各々について、前記ユーザによる発話テキストの係り受け解析結果と、極性が予め付与された単語とに基づいて、前記分類された論点集合毎に、前記ユーザにとっての前記論点集合を有する発話テキストの極性を判定する極性判定部を更に含む請求項5記載の論点集合重要度算出装置。
【請求項7】
コンピュータを、請求項1~請求項4の何れか1項記載の効用値推定装置を構成する各部として機能させるためのプログラム。
【請求項8】
コンピュータを、請求項5又は6記載の論点集合重要度算出装置を構成する各部として機能させるためのプログラム。
Detailed description of the invention (In Japanese)【技術分野】
【0001】
本発明は、効用値推定装置、論点集合重要度算出装置、及びプログラムに係り、特に、発話テキスト(例えば、投稿テキスト)についてユーザにとっての効用値を推定するための効用値推定装置、論点集合重要度算出装置、及びプログラムに関する。
【背景技術】
【0002】
従来技術として、非特許文献1では、以下の手順で投稿意見から効用情報の抽出を行っている。
【0003】
まず、名詞と名詞句(名詞が連続する句)を論点ととらえ、形態素解析エンジンのMeCabを用いて、論点を抽出する。次に、抽出した論点をクラスタリングするために、word2vecに Wikipedia(R)の日本語コーパスから単語ベクトルを学習させ、論点に対する単語ベクトルを得て、k-meansを用いてクラスタリングを実施し、論点集合を抽出する。ユーザごとの論点集合に対する重要度を算出する。論点集合に対する重要度の抽出手法は、論点の共起ネットワークを作成し、ページランクアルゴリズムにより各論点の重要度を算出する。その後、論点集合に属する論点の重要度の合計を計算し、算出した効用値は 0.0~1.0に正規化する。
【先行技術文献】
【0004】

【非特許文献1】佐藤元紀, 仙石晃久, 伊美裕麻, 白松俊, 藤田桂英, 伊藤孝行. “オンライン議論におけるテキスト意見分析によるパレートフロントの算出”. 人工知能学会全国大会論文集 vol.29, pp.1-4, 2015.
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記非特許文献1に記載の技術では、論点集合の抽出とユーザの効用値推定に対して以下の問題点がある。
【0006】
第一に、論点集合を自動抽出する際に、論点を単語ベクトルで表現し、k-meansクラスタリングを用いているため、得られた論点集合は、類似したベクトルを持つ論点の集合となる。そのため、同じ話題を指す単語でも、異なる論点群に分類されてしまう可能性が高い。
【0007】
第二に、ユーザの効用値を投稿意見から推定する際に、ユーザの感情を考慮していない。そのため、ユーザにとって否定的である内容を持つ意見が高い効用値になってしまうことがある。
【0008】
本発明では、上記問題点を解決するために成されたものであり、ユーザにとっての効用値を精度良く推定することができる効用値推定装置及びプログラムを提供することを目的とする。
【0009】
また、ユーザにとっての効用値を精度良く推定するための論点集合の重要度を算出することができる論点集合重要度算出装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
上記目的を達成するために、本発明の効用値推定装置は、評価対象の発話テキストについて、対象ユーザにとっての選好度合いを示す効用値を推定する効用値推定装置であって、評価対象の発話テキストから、予め定められた条件を満たす名詞を、論点として抽出する論点抽出部と、前記論点抽出部によって抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度とに基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定する効用値推定部と、を含んで構成されている。
【0011】
本発明の論点集合重要度算出装置は、複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する論点抽出部と、前記論点抽出部によって抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合に分類する論点集合分類部と、前記ユーザの各々について、前記ユーザによる発話テキストから抽出された論点の各々が、前記分類された論点集合の何れに属するかに基づいて、前記分類された論点集合毎に、前記ユーザにとっての前記論点集合の重要度を算出する重要度算出部と、を含んで構成されている。
【0012】
また、本発明のプログラムは、コンピュータを、上記の効用値推定装置、又は論点集合重要度算出装置を構成する各部として機能させるためのプログラムである。
【発明の効果】
【0013】
以上説明したように、本発明の効用値推定装置、及びプログラムによれば、評価対象の発話テキストから抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、前記分類された論点集合毎に定められた、前記対象ユーザにとっての前記論点集合の重要度とに基づいて、前記評価対象の発話テキストについての前記対象ユーザの効用値を推定することにより、ユーザにとっての効用値を精度良く推定することができる。
【0014】
また、本発明の論点集合重要度算出装置、及びプログラムによれば、複数のユーザによる複数の発話テキストから抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合に分類し、前記ユーザの各々について、前記ユーザによる発話テキストから抽出された論点の各々が、前記分類された論点集合の何れに属するかに基づいて、前記分類された論点集合毎に、前記ユーザにとっての前記論点集合の重要度を算出することにより、ユーザにとっての効用値を精度良く推定するための論点集合の重要度を算出することができる。
【図面の簡単な説明】
【0015】
【図1】第1の実施形態に係る効用値推定装置における機能的構成を示すブロック図である。
【図2】共起ネットワークの例を示す図である。
【図3】各論点の重要度を算出する方法を説明するための図である。
【図4】第1の実施形態に係る効用値推定装置における論点集合重要度算出処理ルーチンを示すフローチャート図である。
【図5】第1の実施形態に係る効用値推定装置における効用値推定処理ルーチンを示すフローチャート図である。
【図6】第2の実施形態に係る効用値推定装置における機能的構成を示すブロック図である。
【図7】係り受け関係と木構造の一例を示す図である。
【図8】子文節が極性語の場合の極性判定の方法を説明するための図である。
【図9】第2の実施形態に係る効用値推定装置における論点集合重要度算出処理ルーチンを示すフローチャート図である。
【図10】第3の実施形態に係る効用値推定装置における機能的構成を示すブロック図である。
【図11】パレート最適な発話テキストを抽出する方法を説明するための図である。
【図12】合意案候補の可視化の例を示す図である。
【図13】第3の実施形態に係る効用値推定装置における合意案可視化処理ルーチンを示すフローチャート図である。
【図14】第4の実施形態に係る効用値推定装置における機能的構成を示すブロック図である。
【図15】第4の実施形態に係る効用値推定装置における効用値推定処理ルーチンを示すフローチャート図である。
【発明を実施するための形態】
【0016】
以下、図面を参照して本発明の実施形態を詳細に説明する。

【0017】
[第1の実施の形態]
<第1の実施形態に係る効用値推定装置の構成>
次に、第1の実施形態に係る効用値推定装置の構成について説明する。図1に示すように、本実施形態に係る効用値推定装置100は、CPUと、RAMと、後述する論点集合重要度算出処理ルーチン及び効用値推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この効用値推定装置100は、機能的には図1に示すように、入力部10、演算部20、及び出力部50を含んで構成されている。

【0018】
入力部10は、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付け、後述する意見データベース22に格納する。

【0019】
また、入力部10は、効用値の算出対象となる意見を表す発話テキストを受け付ける。

【0020】
演算部20は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、効用値パラメータ記憶部34と、論点抽出部36と、論点分類部38と、効用値算出部40とを含んで構成される。

【0021】
意見データベース22は、複数のユーザの各々についての意見を表す複数の発話テキストを記憶している。

【0022】
論点抽出部24は、意見データベース22に記憶されている複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する。

【0023】
具体的には、発話テキストを形態素解析により、予め定められた条件を満たす名詞を論点として抽出する。形態素解析とは、テキストを単語(形態素)ごとに区切り品詞を特定する自然言語処理の技術の1つである。例えば、MeCab(非特許文献2)を用いて実現すればよい。本実施の形態では、以下の条件(1)~(4)を満たす名詞を論点として抽出する。

【0024】
(1)数詞は抽出しない。
(2)平仮名のみの名詞は抽出しない。
(3)接頭詞は名詞として扱う。
(4)1文字のみの名詞は抽出しない。

【0025】
上記の処理をユーザごとに行い、各ユーザの論点としてまとめる。

【0026】
[非特許文献2] 工藤拓, 山本薫, 松本裕治. “Conditional Random Fields を用いた日本語形態素解析.” 情報処理学会研究報告自然言語処理(NL), 2004.

【0027】
論点集合分類部26は、論点抽出部36によって抽出された複数の論点と、トピックモデル記憶部28に記憶されているトピックモデルと、に基づいて、潜在トピックモデルに応じた複数の論点集合を、論点の分類として生成し、分類結果記憶部30に格納する。

【0028】
具体的には、抽出した複数の論点をトピックモデルにより各トピックに分類し、各トピックについて当該トピックに分類された論点からなる論点集合を抽出する。トピックモデルとは、複数の文書から、文書中の単語のトピックを統計的に推定するモデルである。文書中の単語は独立して出現するものではなく、潜在的にトピックを持ち、同じトピックは同じ文書中に出現しやすいという仮定のもと提案されている。トピックモデルの手法としては、例えば、LDA(Latent Dirichlet Allocation)(非特許文献3)を用いればよい。

【0029】
[非特許文献3] David M. Blei, Andrew Y. Ng, Michael I. Jordan. “Latent Dirichlet Allocation”. Journal of Machine Learning Research 3 (2003) 993-1022.

【0030】
重要度算出部32は、ユーザの各々について、当該ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合の重要度を算出し、効用値パラメータ記憶部34に格納する。

【0031】
具体的には、ユーザの、各論点集合に対する重要度を以下の方法で算出する。

【0032】
(ア)図2に示すように、論点の共起ネットワークを作成する。共起ネットワークとは、同じ発話テキストに2つの論点が同時に出現しているかを示す無向グラフである。2つのノードが繋がっているとき、そのノードの論点語は同じ文中に出現していることを示す。

【0033】
(イ)共起ネットワークの各ノードの重要度を求める。各ノード(論点語)の重要度を、例えば、ページランクアルゴリズム(非特許文献4)によって求める(図3参照)。

【0034】
[非特許文献4] Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd. “The PageRank Citation Ranking: Bringing Order to the Web”. Stanford Digital Libraries Working Paper, 1998.

【0035】
(ウ)論点集合に含まれる論点の重要度の平均値を求める。例えば、ページランクアルゴリズムによって算出したユーザiの各ノードnに対する重要度Vi,n を用いて、以下の式でユーザiの論点集合Nに対する重要度Ii,Nを求める。

【0036】
【数1】
JP2019012444A_000003t.gif

【0037】
論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、論点抽出部24と同様に、予め定められた条件を満たす名詞の各々を、論点として抽出する。

【0038】
論点分類部38は、論点抽出部36によって抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。

【0039】
効用値算出部40は、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部34に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度に基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定する。

【0040】
具体的には、対象ユーザiの、評価対象の発話テキストoに対する効用値Ui,oを算出する。ユーザiの論点集合N に対する重要度Ii,Nを用いて、効用値Ui,oは、以下の式で計算される。

【0041】
【数2】
JP2019012444A_000004t.gif

【0042】
ただし、issuesは、評価対象の発話テキストから抽出された論点の集合を表わし、f(n)は、論点nが属する論点集合を表わす。

【0043】
そして、以下の式を用いて、推定した効用値を、0.0~1.0 の間に正規化する。

【0044】
【数3】
JP2019012444A_000005t.gif

【0045】
ただし、Uoは、正規化対象とする効用値であり、Umin、Umaxは、予め定められた効用値の最小値及び最大値である。ここでは、重要度が高い論点集合に言及する意見ほど、当該ユーザから見て効用値(満足の度合い)が高いと仮定している。

【0046】
最終的に算出した値を意見oに対する、ユーザiの推定した効用値とし、出力部50により出力する。

【0047】
<第1の実施形態に係る効用値推定装置の作用>
次に、第1の実施形態に係る効用値推定装置100の作用について説明する。まず、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付けると、効用値推定装置100は、意見データベース22に格納する。そして、効用値推定装置100によって図4に示す論点集合重要度算出処理ルーチンを実行する。

【0048】
まず、ステップS100で、論点抽出部24は、意見データベース22に記憶されている複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する。

【0049】
次に、ステップS102で、論点集合分類部26は、上記ステップS100で抽出された複数の論点と、トピックモデル記憶部28に記憶されているトピックモデルに基づいて、複数の論点集合を、論点の分類として生成し、分類結果記憶部30に格納する。

【0050】
次に、ステップS104で、重要度算出部32は、ユーザの各々について、当該ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合の重要度を算出し、効用値パラメータ記憶部34に格納し、論点集合重要度算出処理ルーチンを終了する。

【0051】
また、効用値の算出対象となる意見を表す発話テキストを受け付けると、効用値推定装置100によって図5に示す効用値推定処理ルーチンを実行する。

【0052】
まず、ステップS110で、論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、予め定められた条件を満たす名詞の各々を、論点として抽出する。

【0053】
次に、ステップS112で、論点分類部38は、上記ステップS110で抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。

【0054】
ステップS114では、効用値算出部40は、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部34に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度とに基づいて、算出対象の発話テキストについての対象ユーザの効用値を推定し、出力部50により出力して、効用値推定処理ルーチンを終了する。

【0055】
以上説明したように、第1の実施形態に係る効用値推定装置によれば、評価対象の発話テキストから抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、分類された論点集合毎に定められた、対象ユーザにとっての論点集合の重要度とに基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定することにより、ユーザにとっての効用値を精度良く推定することができる。

【0056】
また、複数のユーザによる複数の発話テキストから抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合を、論点の分類として生成し、ユーザの各々について、ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、ユーザにとっての論点集合の重要度を算出することにより、ユーザにとっての効用値を精度良く推定するための論点集合の重要度を算出することができる。

【0057】
また、議論掲示板などの意見をWeb上に表明するソーシャルメディアにおいて、投稿意見に対する各ユーザの重要性や好みを数値化した効用値を自動的に推定することができる。

【0058】
また、従来技術の問題点である同じ話題を指す単語でも異なる論点群に分類されてしまう点を、すべてのユーザの意見から論点を抽出し、トピック推定により論点集合(関連した名詞の集合)に自動分類することで解決した。

【0059】
[第2の実施の形態]
次に、第2の実施の形態に係る効用値推定装置について説明する。なお、第1の実施の形態と同様の処理については、同一符号を付して説明を省略する。

【0060】
第2の実施の形態では、論点集合を有する発話テキストの極性を考慮して効用値を推定している点が、第1の実施の形態と異なっている。

【0061】
<第2の実施形態に係る効用値推定装置の構成>
次に、第2の実施形態に係る効用値推定装置の構成について説明する。図6に示すように、第2の実施形態に係る効用値推定装置200は、機能的には入力部10と、演算部220と、出力部50を含んで構成されている。

【0062】
演算部220は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、極性判定部232と、効用値パラメータ記憶部234と、論点抽出部36と、論点分類部38と、効用値算出部240とを含んで構成される。

【0063】
極性判定部232は、ユーザの各々について、当該ユーザによる発話テキストの係り受け解析結果と、極性が予め付与された単語とに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合を有する発話テキストの極性を判定し、効用値パラメータ記憶部234に格納する。

【0064】
具体的には、ユーザの論点集合に対する極性が陽性 (positive) のとき、ユーザはその論点集合に対して肯定的であり、陰性(negative) のとき否定的であるとする。

【0065】
論点集合に対する極性を判定するには、まず係り受け解析により論点に対する極性を求める。係り受け解析とは、テキスト中の2つの文節同士の修飾・被修飾関係を解析する技術である。例えば、係り受け解析エンジンとして、CaboCha(非特許文献5)を用いればよい。

【0066】
[非特許文献5] 工藤拓, 松本裕治. “Support Vector Machine による日本語係り受け解析”. 電子情報通信学会技術研究報告, 2000.

【0067】
そして、名詞に係る語に極性語がある場合、その極性が名詞に対する極性であると仮定し、論点に対する極性を求める手順を次に示す。

【0068】
(ア)文を係り受け解析し、木構造を作成する。
(イ)ツリーを幅優先探索により各文節へ移動する。
(ウ)文節に論点が含まれる場合、その論点の極性を求める。
(エ)文節に否定要素が含まれる場合は、極性を反転させる。また、二重否定が検出された場合は、テンプレートマッチングにより極性を決定する。

【0069】
図7に示す例文「私の飼っている猫は,愛想が悪いときもあるけれど基本的には可愛い。」に含まれる名詞「猫」に対する極性を求める場合について説明する。まず、この文章を係り受け解析により木構造を作成する。次に、親文節「可愛い」から幅優先探索により各文節へ移動し、文節に論点(名詞)が含まれているかどうかを調べる。文節「猫は、」には名詞「猫」が含まれているため、この文節の親文節をさかのぼる。さかのぼった先に極性が予め定められた極性語「可愛い」が含まれる文節「可愛い。」を発見し、この極性語「可愛い」の極性を「猫」に対する極性とする。極性判定には日本語アプレザイル評価表現辞書を用いる(非特許文献6)。

【0070】
[非特許文献6] 佐野大樹. “日本語アプレザイル評価表現辞書—態度評価編— JAppraisal 辞書ver1.0“ 言語資源協会発行, 2011.

【0071】
positiveの場合1とし、negativeの場合-1とするため、「可愛い」の極性はpositiveであることから、ユーザiの論点「猫」の極性値pi,nは+1とする。また、「可愛い猫」のように名詞の子文節が極性語である場合も探索対象とする (図8参照)。

【0072】
そして、ユーザiの論点集合Nに対する極性Pi,N を次の式で求める。

【0073】
【数4】
JP2019012444A_000006t.gif

【0074】
ただし、論点集合Nに含まれる論点nの極性値を、pi,nとする。上記の式により、論点集合Nに含まれる論点nの極性値pi,nの合計が0以上のとき、ユーザiの論点集合Nに対する極性Pi,Nを+1とし、負のとき-1とする。

【0075】
また、論点nを含む文節に否定要素が含まれる場合は、極性値を反転させる。ここで、文中において否定を表す表現のことを否定要素と呼ぶ。否定表現を判定する方法として、本発明の実施の形態では、以下の(1)~(3)に示す3種類を否定要素と定め、あらかじめ、リストに登録しておき、各文節とマッチングさせることで判定する。

【0076】
(1)否定辞を否定要素とする。例えば、助動詞「ない」と「ず」、接尾辞「ない」、接頭辞「非」、「不」、「無」、「未」、「反」、「異」が、否定辞である。

【0077】
(2)非存在の内容語を否定要素とする。例えば、形容詞「ない」、名詞「なし」が、非存在の内容語である。

【0078】
(3)否定を表す複合辞を否定要素とする。例えば、「のではない」、「わけではない」、「わけにはいかない」などが、否定を表す複合辞である。

【0079】
また、二重否定に関しては以下の表のようなテンプレートを作成し、それらと適合した場合に対応する基盤的な意味に応じて、極性値を反転あるいは反転させない。

【0080】
【表1】
JP2019012444A_000007t.gif

【0081】
効用値算出部240は、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度と、対象ユーザにとっての論点集合を有する発話テキストの極性と、に基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定する。

【0082】
具体的には、対象ユーザiの、評価対象の発話テキストoに対する効用値Ui,oを算出する。ユーザiの論点集合f(n)に対する重要度 Ii,f(n)と、ユーザiの論点集合f(n)に対する極性Pi,f(n)を用いて、効用値Ui,oは、以下の式で計算される。

【0083】
【数5】
JP2019012444A_000008t.gif

【0084】
ただし、issuesは、評価対象の発話テキストから抽出された論点の集合を表わし、f(n)は、論点nが属する論点集合を表わす。

【0085】
また、評価対象の発話テキストoにおいて、論点nを含む文節に否定要素が含まれる場合は、極性Pi,f(n)を反転させて、上記式を計算する。また、評価対象の発話テキストoにおいて、論点nを含む文節に二重否定を含む場合には、当該二重否定に対応する基盤的な意味に応じて、極性Pi,f(n)を反転あるいは反転させないで、上記式を計算する。

【0086】
そして、推定した効用値を、0.0~1.0 の間に以下の式で正規化する。

【0087】
【数6】
JP2019012444A_000009t.gif

【0088】
ここで、重要度が高く、かつ、肯定的な論点集合に言及する意見ほど、当該ユーザから見て効用値(満足度合い)が高いと仮定している。

【0089】
最終的に算出した値を意見oに対する、ユーザiの推定した効用値とし、出力部50により出力する。

【0090】
<第2の実施形態に係る効用値推定装置の作用>
次に、第2の実施形態に係る効用値推定装置200の作用について説明する。なお、第1の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。

【0091】
第2の実施形態における論点集合重要度算出処理ルーチンを、図9を用いて説明する。

【0092】
まず、ステップS100で、論点抽出部24は、意見データベース22に記憶されている複数のユーザによる複数の発話テキストから、予め定められた条件を満たす名詞を、論点として複数抽出する。

【0093】
次に、ステップS102で、論点集合分類部26は、上記ステップS100で抽出された複数の論点と、トピックモデル記憶部28に記憶されているトピックモデルと、に基づいて、潜在トピックモデルに応じた複数の論点集合を、論点の分類として生成し、分類結果記憶部30に格納する。

【0094】
ステップS200で、極性判定部232は、ユーザの各々について、当該ユーザによる発話テキストの係り受け解析結果と、極性が予め付与された単語とに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合を有する発話テキストの極性を判定し、効用値パラメータ記憶部234に格納する。

【0095】
次に、ステップS104で、重要度算出部32は、ユーザの各々について、当該ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかに基づいて、分類された論点集合毎に、当該ユーザにとっての論点集合の重要度を算出し、効用値パラメータ記憶部234に格納し、論点集合重要度算出処理ルーチンを終了する。

【0096】
また、効用値の算出対象となる意見を表す発話テキストを受け付けると、効用値推定装置200によって、上記図5に示す効用値推定処理ルーチンと同様の処理ルーチンを実行する。

【0097】
このとき、ステップS114では、効用値算出部240は、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、対象ユーザにとっての論点集合の重要度、及び対象ユーザにとっての論点集合を有する発話テキストの極性とに基づいて、算出対象の発話テキストについての対象ユーザの効用値を推定する。

【0098】
以上説明したように、第2の実施形態に係る効用値推定装置によれば、評価対象の発話テキストから抽出された論点が、潜在トピックモデルに応じて分類された論点集合の何れに属するかと、分類された論点集合毎に定められた、対象ユーザにとっての論点集合の重要度及び論点集合を有する発話テキストの極性とに基づいて、評価対象の発話テキストについての対象ユーザの効用値を推定することにより、ユーザにとっての効用値を精度良く推定することができる。

【0099】
また、複数のユーザによる複数の発話テキストから抽出された複数の論点に基づいて、潜在トピックモデルに応じた複数の論点集合に分類し、ユーザの各々について、ユーザによる発話テキストから抽出された論点の各々が、分類された論点集合の何れに属するかと、ユーザによる発話テキストの係り受け解析結果と、極性が予め付与された単語とに基づいて、分類された論点集合毎に、ユーザにとっての論点集合を有する発話テキストの極性を判定することにより、ユーザにとっての効用値を精度良く推定するための論点集合を有する発話テキストの極性を判定することができる。

【0100】
また、従来技術の問題点であるユーザにとって否定的である内容を持つ意見が高い効用値になってしまう点を、各単語が肯定的か否定的かを表す極性が予め定められた極性語を用いて、論点集合を有する発話テキストの極性を判定し、ユーザの投稿意見に対する極性を、効用値推定の際に導入することで解決した。

【0101】
[第3の実施の形態]
次に、第3の実施の形態に係る効用値推定装置について説明する。なお、第1の実施の形態、第2の実施の形態と同様の処理については、同一符号を付して説明を省略する。

【0102】
第3の実施の形態では、複数のユーザにおける合意案候補を、複数のユーザの意見を表す複数の発話テキストから抽出し、可視化している点が、第2の実施の形態と異なっている。

【0103】
<第3の実施形態に係る効用値推定装置の構成>
次に、第3の実施形態に係る効用値推定装置の構成について説明する。図10に示すように、第3の実施形態に係る効用値推定装置300は、機能的には入力部10と、演算部320と、出力部50を含んで構成されている。

【0104】
演算部320は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、極性判定部232と、効用値パラメータ記憶部234と、論点抽出部36と、論点分類部38と、効用値算出部240と、合意案抽出部342と、可視化部344とを含んで構成される。

【0105】
入力部10は、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付け、後述する意見データベース22に格納する。

【0106】
また、入力部10は、効用値の算出対象となる、複数のユーザの各々についての意見を表す複数の発話テキストを受け付ける。

【0107】
論点抽出部36は、効用値の算出対象となる意見を表す複数の発話テキストの各々から、予め定められた条件を満たす名詞の各々を、論点として抽出する。

【0108】
論点分類部38は、効用値の算出対象となる意見を表す複数の発話テキストの各々について、論点抽出部36によって抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。

【0109】
効用値算出部240は、効用値の算出対象となる意見を表す複数の発話テキストの各々について、ユーザ毎に、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該ユーザにとっての論点集合の重要度及び当該ユーザにとっての論点集合を有する発話テキストの極性と、に基づいて、当該算出対象の発話テキストについての当該ユーザの効用値を推定する。

【0110】
合意案抽出部342は、複数のユーザの各々及び効用値の算出対象の複数の発話テキストの各々に対して推定された効用値に基づいて、効用値の算出対象となる意見を表す複数の発話テキストから、複数のユーザの間での合意案としての発話テキスト候補を抽出する。

【0111】
具体的には、複数のユーザから主要なユーザを選出し、2人1組のペアを作成し、ユーザのペア毎に、当該ユーザのペア間の合意案候補を抽出する。交渉問題において、一方の交渉者の効用値を小さくしなければ、もう一方の効用値を上げることができない状態がパレート最適と言われており、パレート最適となる発話テキストが、交渉における重要な合意案候補となる。

【0112】
そこで、ユーザのペアにおいて互いが合意できる意見を表す発話テキスト(合意案候補)として、ユーザのペアについて求められた効用値から得られる、パレート最適な発話テキストを求める(図11参照)。

【0113】
可視化部344は、合意案として抽出された発話テキストと、当該発話テキストが表す意見に合意する2以上のユーザの各々との間を結んだグラフ構造を生成して出力部50により提示する。

【0114】
具体的には、ユーザのペアについて抽出されたパレート最適な意見を表す発話テキストを、以下に説明するように、複数のユーザにおける議論の合意案候補として可視化する(図12参照)。

【0115】
まず、各ペアの合意案候補を同一画面に表示する。そして、合意案候補の各々について、当該合意案候補と、当該合意案候補に合意する2以上のユーザの各々との間をエッジで結んだグラフ構造を生成して提示する。このとき、ユーザを外部ノード、意見を表す発話テキストを内部ノードとし、各ユーザが合意案候補に合意したかをエッジとしてグラフ描画を行う。

【0116】
また、多くのユーザのペアが合意案候補に選んだ意見を表す発話テキストは大きく表示する。また、意見を表す発話テキストは冒頭の数文字のみ表記し、クリックすることで、全文とユーザ名(投稿者名)を表示するようにする。

【0117】
また、できるだけ多くのユーザが合意する合意案候補を提示するようにしてもよい。この場合には、例えば、投稿数の多い上位10名を主要ユーザとして選出し、2人1組のペアを作成する。すなわち、10C2=45ペアを作成する。そして、各ペアのパレート最適な意見を表す発話テキストを合意案候補として求める。そして、合意案候補ごとに、合意したペア数を0~1の値となるように正規化し、正規化されたペア数が0.1以上となる合意案候補を、多くのペアが合意案候補に選んだ意見を表す発話テキストとして求め、議論全体の合意案候補としてグラフ描画を行う。

【0118】
<第3の実施形態に係る効用値推定装置の作用>
次に、第3の実施形態に係る効用値推定装置300の作用について説明する。なお、第1の実施の形態及び第2の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。

【0119】
まず、効用値推定装置300は、上記図9に示す論点集合重要度算出処理ルーチンと同様の処理ルーチンを実行する。

【0120】
また、効用値の算出対象となる意見を表す複数の発話テキストを受け付けると、効用値推定装置300によって、複数の発話テキストの各々に対し、上記図5に示す効用値推定処理ルーチンと同様の処理ルーチンを繰り返し実行する。

【0121】
このとき、ステップS114では、効用値算出部240は、複数のユーザ毎に、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該ユーザにとっての論点集合の重要度、及び当該ユーザにとっての論点集合を有する発話テキストの極性とに基づいて、効用値の算出対象の発話テキストについての当該ユーザの効用値を推定する。

【0122】
そして、効用値推定装置300によって、図13に示す合意案可視化処理ルーチンを実行する。

【0123】
まず、ステップS300において、当該ユーザのペアについて発話テキストの各々について求められた効用値に基づいて、パレート最適な発話テキストを、合意案候補として抽出する。

【0124】
ステップS302では、ユーザの全てのペアについて、上記ステップS300の処理が終了したか否かを判定し、上記ステップS300の処理が終了していないペアが存在する場合には、上記ステップS300へ戻り、当該ペアについて合意案候補を抽出する。一方、ユーザの全てのペアについて、上記ステップS300の処理が終了した場合には、ステップS304へ移行する。

【0125】
ステップS304では、ユーザの全てのペアについて抽出された合意案候補に基づいて、合意案候補として抽出された発話テキストと、当該発話テキストが表す意見に合意する2以上のユーザの各々との間をエッジで結んだグラフ構造を生成して出力部50により提示し、合意案可視化処理ルーチンを終了する。

【0126】
以上説明したように、第3の実施形態に係る効用値推定装置によれば、ユーザのペア毎に、発話テキストの各々について求められた効用値に基づいて、パレート最適な発話テキストを、合意案候補として抽出し、合意案候補を可視化することで、複数のユーザでの適切な合意案に導くことができる。

【0127】
[第4の実施の形態]
次に、第4の実施の形態に係る効用値推定装置について説明する。なお、第1の実施の形態、第2の実施の形態と同様の処理については、同一符号を付して説明を省略する。

【0128】
第4の実施の形態では、複数の仮想ユーザにおける効用値を推定して、総合評価値を算出している点が、第2の実施の形態と異なっている。

【0129】
<第4の実施形態に係る効用値推定装置の構成>
次に、第4の実施形態に係る効用値推定装置の構成について説明する。図14に示すように、第4の実施形態に係る効用値推定装置400は、機能的には入力部10と、演算部420と、出力部50を含んで構成されている。

【0130】
演算部420は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、極性判定部232と、効用値パラメータ記憶部234と、論点抽出部36と、論点分類部38と、効用値算出部240と、総合評価部442とを含んで構成される。

【0131】
入力部10は、複数のユーザの各々についての意見を表す複数の発話テキスト(例えば、投稿テキスト)を受け付け、後述する意見データベース22に格納する。

【0132】
また、入力部10は、効用値の算出対象となる意見を表す発話テキストを受け付ける。

【0133】
効用値パラメータ記憶部234には、ユーザの各々について、分類された論点集合毎に、当該ユーザにとっての重要度、及び当該ユーザにとっての論点集合を有する発話テキストの極性が記憶されている。ここでのユーザの各々を、仮想ユーザとして用いることにより、以降において、効用値の算出対象となる意見を表す発話テキストを評価する。

【0134】
論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、予め定められた条件を満たす名詞の各々を、論点として抽出する。

【0135】
論点分類部38は、効用値の算出対象となる意見を表す発話テキストについて、論点抽出部36によって抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。

【0136】
効用値算出部240は、効用値の算出対象となる意見を表す発話テキストについて、仮想ユーザ毎に、論点抽出部36によって抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該仮想ユーザにとっての論点集合の重要度、及び当該仮想ユーザにとっての論点集合を有する発話テキストの極性と、に基づいて、算出対象の発話テキストについての当該仮想ユーザの効用値を推定する。

【0137】
総合評価部442は、算出対象の発話テキストについて仮想ユーザ毎に推定された効用値に基づいて、発話テキストについて総合評価値を算出する。例えば、仮想ユーザ毎に推定された効用値の合計値又は平均値を、総合評価値として算出し、出力部50により出力する。

【0138】
<第4の実施形態に係る効用値推定装置の作用>
次に、第4の実施形態に係る効用値推定装置400の作用について説明する。なお、第1の実施の形態及び第2の実施の形態と同様の処理については、同一符号を付して詳細な説明を省略する。

【0139】
まず、効用値推定装置400は、上記図9に示す論点集合重要度算出処理ルーチンと同様の処理ルーチンを実行する。

【0140】
また、効用値の算出対象となる意見を表す発話テキストを受け付けると、効用値推定装置400によって、図15に示す効用値推定処理ルーチンを実行する。

【0141】
まず、ステップS110で、論点抽出部36は、効用値の算出対象となる意見を表す発話テキストから、予め定められた条件を満たす名詞の各々を、論点として抽出する。

【0142】
次に、ステップS112で、論点分類部38は、上記ステップS110で抽出された論点の各々が、分類結果記憶部30に格納されている論点集合の何れに属するかを判断し、抽出された論点の各々を、論点集合のいずれかに分類する。

【0143】
ステップS400では、効用値算出部240は、複数の仮想ユーザ毎に、上記ステップS110で抽出された論点が、論点集合の何れに属するかと、効用値パラメータ記憶部234に記憶された、論点集合毎に定められた、当該仮想ユーザにとっての論点集合の重要度、及び当該仮想ユーザにとっての論点集合を有する発話テキストの極性とに基づいて、効用値の算出対象の発話テキストについての当該仮想ユーザの効用値を推定する。

【0144】
そして、ステップS402では、総合評価部442は、算出対象の発話テキストについて仮想ユーザ毎に推定された効用値に基づいて、発話テキストについて総合評価値を算出し、出力部50により出力し、効用値推定処理ルーチンを終了する。

【0145】
以上説明したように、第4の実施形態に係る効用値推定装置によれば、複数の仮想ユーザについて推定した効用値から自動的に投稿意見などに対して評価を行うことができる。また、重要な意見を自動的に抽出することも可能である。

【0146】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

【0147】
例えば、上記の実施形態においては、論点集合の重要度の算出や極性の判定と共に、効用値の算出を、効用値推定装置で実現する場合を例に説明したが、これに限定されるものではなく、論点集合の重要度の算出や極性の判定と、効用値の算出とを、論点集合重要度算出装置と効用値推定装置という別々の装置で実現するようにしてもよい。この場合には、論点集合重要度算出装置は、意見データベース22と、論点抽出部24と、論点集合分類部26と、トピックモデル記憶部28と、分類結果記憶部30と、重要度算出部32と、効用値パラメータ記憶部34又は234と、を備えていればよい。また、効用値推定装置は、効用値パラメータ記憶部34又は234と、論点抽出部36と、論点分類部38と、効用値算出部40又は240とを備えていればよい。

【0148】
また、論点集合分類部26による処理が、外部装置によって行われ、潜在トピックモデルに応じた複数の論点集合が、当該外部装置より効用値推定装置に入力されてもよい。

【0149】
また、上記第3の実施の形態、第4の実施の形態において、上記第1の実施の形態のように、極性を考慮せずに、効用値を推定するようにしてもよい。

【0150】
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
【符号の説明】
【0151】
10 入力部
20、220、320、420 演算部
22 意見データベース
24、36 論点抽出部
26 論点集合分類部
28 トピックモデル記憶部
30 分類結果記憶部
32 重要度算出部
34、234 効用値パラメータ記憶部
38 論点分類部
40、240 効用値算出部
50 出力部
100、200、300、400 効用値推定装置
232 極性判定部
342 合意案抽出部
344 可視化部
442 総合評価部
Drawing
(In Japanese)【図1】
0
(In Japanese)【図2】
1
(In Japanese)【図3】
2
(In Japanese)【図4】
3
(In Japanese)【図5】
4
(In Japanese)【図6】
5
(In Japanese)【図7】
6
(In Japanese)【図8】
7
(In Japanese)【図9】
8
(In Japanese)【図10】
9
(In Japanese)【図11】
10
(In Japanese)【図12】
11
(In Japanese)【図13】
12
(In Japanese)【図14】
13
(In Japanese)【図15】
14