TOP > 国内特許検索 > 質問応答装置、質問応答方法、及びプログラム

質問応答装置、質問応答方法、及びプログラム コモンズ

国内特許コード P140010626
整理番号 07-92
掲載日 2014年6月9日
出願番号 特願2007-289613
公開番号 特開2009-116662
登録番号 特許第5229782号
出願日 平成19年11月7日(2007.11.7)
公開日 平成21年5月28日(2009.5.28)
登録日 平成25年3月29日(2013.3.29)
発明者
  • 村田 真樹
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 質問応答装置、質問応答方法、及びプログラム コモンズ
発明の概要 【課題】非ファクトイド(Non-Factoid)型の質問情報に対応する回答情報を出力できる質問応答装置を提供する。
【解決手段】非ファクトイド型の質問情報を受け付ける質問情報受付部11と、質問情報に、分類を示す分類情報のいずれかを付与する分類部12と、質問情報から用語を抽出する用語抽出部13と、分類情報と追加用語とを対応付ける対応情報が記憶される対応情報記憶部14と、分類部12が付与した分類情報に対応情報で対応付けられる追加用語と、用語抽出部13が抽出した用語と、コーパス記憶部15で記憶されているコーパスと、分類部12による分類結果に応じた式を用いることによって、質問情報に対応する回答を示す回答情報をコーパスから取得する回答情報取得部16と、回答情報取得部16が取得した回答情報を出力する回答情報出力部17と、を備える。
【選択図】図1
従来技術、競合技術の概要


従来、質問文を受け付け、その質問文に対する回答を出力する質問応答システムが開発されていた(例えば、特許文献1参照)。
【特許文献1】
特許第3861105号公報

産業上の利用分野



本発明は、非ファクトイド型の質問を受け付け、それに対する回答情報を出力する質問応答装置等に関する。

特許請求の範囲 【請求項1】
非ファクトイド(Non-Factoid)型の質問を示す情報である質問情報を受け付ける質問情報受付部と、
前記質問情報受付部が受け付けた質問情報に対して、当該質問情報の分類を示す情報であり、理由を尋ねる質問である理由質問が少なくとも一の分類として含まれる情報である複数の分類情報のいずれかを付与する分類部と、
前記質問情報受付部が受け付けた質問情報から、用語を抽出する用語抽出部と、
分類を示す情報である分類情報と、前記用語抽出部が抽出した用語に追加する追加用語とを対応付けて有する情報である対応情報が記憶される対応情報記憶部と、
前記分類部が付与した分類情報に前記対応情報で対応付けられている追加用語と、前記用語抽出部が抽出した用語と、アクセス可能なコーパス記憶部で記憶されているコーパスと、前記分類部によって付与された分類情報に応じた式とを用いることによって、前記質問情報に対応する回答を示す情報である回答情報を前記コーパスから取得する回答情報取得部と、
前記回答情報取得部が取得した回答情報を出力する回答情報出力部と、を備え
前記回答情報取得部が用いる式である第1の式は、前記コーパスに含まれる文書において、2個の用語が近い位置にあるほど高い値となる式であり、
前記回答情報取得部は、前記コーパスに含まれる文書について、前記分類部によって付与された分類情報に前記対応情報で対応付けられている追加用語と、前記用語抽出部が抽出した用語とを含む用語セットから選択された2個を用いて前記式の値を算出し、当該式の値が他に比べて大きい情報である回答情報を取得し、
前記回答情報取得部は、
ある用語がある文書を特徴付けている程度を示す式である第2の式を用いて、前記用語抽出部が抽出した用語によって特徴付けられている程度の高い複数の文書を前記コーパスから取得する文書取得手段と、
前記分類部によって付与された分類情報に対応する追加用語を、前記対応情報から取得する追加用語取得手段と、
前記用語抽出部が抽出した用語と、前記追加用語取得手段が取得した追加用語とを用いて、前記文書取得手段が取得した各文書に含まれる回答情報の候補となる情報である回答候補情報について、前記分類部によって付与された分類情報に応じた前記第1の式の値を算出する算出手段と、
前記複数の回答候補情報から、前記算出手段が算出した値が他に比べて大きい値である回答情報を選択する回答情報選択手段と、を備え、
前記算出手段は、回答候補情報dについて、次式
【数1】


のScore(d)を算出し、当該算出値を分類情報に応じて変更した値である第1の式の値を算出する(ただし、dは回答候補情報であり、Tは、前記用語セットであり、dist(t1,t2)は、用語t1,t2の間隔であり、Nは、文書の総数であり、df(t)は、用語tの出現する文書数であり、wdr2(t2)は、実験によって定められる用語t2の関数である)、質問応答装置。

【請求項2】
前記分類部は、前記質問情報受付部が受け付けた質問情報を、少なくとも、定義を尋ねる質問である定義質問、理由を尋ねる質問である理由質問、方法を尋ねる質問である方法質問に分類する、請求項記載の質問応答装置。

【請求項3】
前記用語抽出部は、前記分類部によって定義質問であると分類された質問情報から、定義を尋ねている対象となる表現であるフォーカス表現の抽出も行うものであり、
前記第1の式は、
前記文書取得手段が取得した文書に前記フォーカス表現が含まれる場合には、前記フォーカス表現が含まれない場合よりも値が大きくなる式であり、
前記文書取得手段が取得した文書に含まれる前記フォーカス表現が、連体修飾節で修飾されている場合には、そうでない場合よりも値が大きくなる式であり、
前記回答情報選択手段は、前記文書取得手段が取得した文書に含まれる前記フォーカス表現が連体修飾節で修飾されている場合に、前記回答候補情報から、当該連体修飾節を回答情報として選択する、請求項記載の質問応答装置。

【請求項4】
前記回答情報選択手段は、
前記算出手段が算出した値が他に比べて大きい値である回答候補情報を選択し、
あらかじめ用意された、質問情報と、当該質問情報の示す質問への回答を示す情報である回答情報と、当該回答情報の適否を示す情報とを少なくとも教師データとして用いて機械学習を行い、
当該機械学習の結果を用いて、前記選択した回答候補情報から回答情報を抽出する、請求項から請求項のいずれか記載の質問応答装置。

【請求項5】
前記分類部は、
分類を示す情報である分類情報と、語句を示す情報である語句情報とを対応付けて有する情報である分類対応情報を記録媒体で保持しており、
前記質問情報に、語句情報が示す語句が含まれる場合に、当該質問情報に対して、当該語句情報に対応する分類情報を付与する、請求項1から請求項のいずれか記載の質問応答装置。

【請求項6】
前記分類部は、
あらかじめ用意された、質問情報と、当該質問情報の分類を示す情報である分類情報とを教師データとして機械学習を行い、
当該機械学習の結果を用いて、前記質問情報受付部が受け付けた質問情報に対して分類情報を付与する、請求項1から請求項のいずれか記載の質問応答装置。

【請求項7】
前記用語抽出部は、前記質問情報を形態素解析し、当該質問情報から、(1)自立語、(2)名詞、(3)名詞と動詞、(4)名詞と形容詞、(5)名詞と動詞と形容詞、から選択される(1)~(5)のいずれかに含まれる品詞の用語を抽出する、請求項1から請求項のいずれか記載の質問応答装置。

【請求項8】
質問情報受付部と、分類部と、用語抽出部と、分類を示す情報である分類情報と、前記用語抽出部が抽出した用語に追加する追加用語とを対応付けて有する情報である対応情報が記憶される対応情報記憶部と、文書取得手段、追加用語取得手段、算出手段、及び回答情報選択手段を有する回答情報取得部と、回答情報出力部とを用いて処理される質問応答方法であって、
前記質問情報受付部が、非ファクトイド(Non-Factoid)型の質問を示す情報である質問情報を受け付ける質問情報受付ステップと、
前記分類部が、前記質問情報受付ステップで受け付けた質問情報に対して、当該質問情報の分類を示す情報であり、理由を尋ねる質問である理由質問が少なくとも一の分類として含まれる情報である複数の分類情報のいずれかを付与する分類ステップと、
前記用語抽出部が、前記質問情報受付ステップで受け付けた質問情報から、用語を抽出する用語抽出ステップと、
前記回答情報取得部が、前記分類ステップで付与した分類情報に前記対応情報で対応付けられている追加用語と、前記用語抽出ステップで抽出した用語と、アクセス可能なコーパス記憶部で記憶されているコーパスと、前記分類ステップで付与された分類情報に応じた式とを用いることによって、前記質問情報に対応する回答を示す情報である回答情報を前記コーパスから取得する回答情報取得ステップと、
前記回答情報出力部が、前記回答情報取得ステップで取得した回答情報を出力する回答情報出力ステップと、を備え
前記回答情報取得ステップで用いる式である第1の式は、前記コーパスに含まれる文書において、2個の用語が近い位置にあるほど高い値となる式であり、
前記回答情報取得ステップでは、前記コーパスに含まれる文書について、前記分類ステップにおいて付与された分類情報に前記対応情報で対応付けられている追加用語と、前記用語抽出ステップで抽出した用語とを含む用語セットから選択された2個を用いて前記式の値を算出し、当該式の値が他に比べて大きい情報である回答情報を取得し、
前記回答情報取得ステップは、
前記文書取得手段が、ある用語がある文書を特徴付けている程度を示す式である第2の式を用いて、前記用語抽出ステップで抽出した用語によって特徴付けられている程度の高い複数の文書を前記コーパスから取得する文書取得ステップと、
前記追加用語取得手段が、前記分類ステップにおいて付与された分類情報に対応する追加用語を、前記対応情報から取得する追加用語取得ステップと、
前記算出手段が、前記用語抽出ステップで抽出した用語と、前記追加用語取得ステップで取得した追加用語とを用いて、前記文書取得ステップで取得した各文書に含まれる回答情報の候補となる情報である回答候補情報について、前記分類ステップにおいて付与された分類情報に応じた前記第1の式の値を算出する算出ステップと、
前記回答情報選択手段が、前記複数の回答候補情報から、前記算出ステップで算出した値が他に比べて大きい値である回答情報を選択する回答情報選択ステップと、を備え、
前記算出ステップでは、回答候補情報dについて、次式
【数2】


のScore(d)を算出し、当該算出値を分類情報に応じて変更した値である第1の式の値を算出する(ただし、dは回答候補情報であり、Tは、前記用語セットであり、dist(t1,t2)は、用語t1,t2の間隔であり、Nは、文書の総数であり、df(t)は、用語tの出現する文書数であり、wdr2(t2)は、実験によって定められる用語t2の関数である)、質問応答方法。

【請求項9】
コンピュータを、
非ファクトイド(Non-Factoid)型の質問を示す情報である質問情報を受け付ける質問情報受付部と、
前記質問情報受付部が受け付けた質問情報に対して、当該質問情報の分類を示す情報であり、理由を尋ねる質問である理由質問が少なくとも一の分類として含まれる情報である複数の分類情報のいずれかを付与する分類部と、
前記質問情報受付部が受け付けた質問情報から、用語を抽出する用語抽出部と、
前記分類部が付与した分類情報に、対応情報記憶部で記憶される、分類を示す情報である分類情報と、前記用語抽出部が抽出した用語に追加する追加用語とを対応付けて有する情報である対応情報で対応付けられている追加用語と、前記用語抽出部が抽出した用語と、アクセス可能なコーパス記憶部で記憶されているコーパスと、前記分類部によって付与された分類情報に応じた式とを用いることによって、前記質問情報に対応する回答を示す情報である回答情報を前記コーパスから取得する回答情報取得部と、
前記回答情報取得部が取得した回答情報を出力する回答情報出力部として機能させ、
前記回答情報取得部が用いる式である第1の式は、前記コーパスに含まれる文書において、2個の用語が近い位置にあるほど高い値となる式であり、
前記回答情報取得部は、前記コーパスに含まれる文書について、前記分類部によって付与された分類情報に前記対応情報で対応付けられている追加用語と、前記用語抽出部が抽出した用語とを含む用語セットから選択された2個を用いて前記式の値を算出し、当該式の値が他に比べて大きい情報である回答情報を取得し、
前記回答情報取得部は、
ある用語がある文書を特徴付けている程度を示す式である第2の式を用いて、前記用語抽出部が抽出した用語によって特徴付けられている程度の高い複数の文書を前記コーパスから取得する文書取得手段と、
前記分類部によって付与された分類情報に対応する追加用語を、前記対応情報から取得する追加用語取得手段と、
前記用語抽出部が抽出した用語と、前記追加用語取得手段が取得した追加用語とを用いて、前記文書取得手段が取得した各文書に含まれる回答情報の候補となる情報である回答候補情報について、前記分類部によって付与された分類情報に応じた前記第1の式の値を算出する算出手段と、
前記複数の回答候補情報から、前記算出手段が算出した値が他に比べて大きい値である回答情報を選択する回答情報選択手段と、を備え、
前記算出手段は、回答候補情報dについて、次式
【数3】


のScore(d)を算出し、当該算出値を分類情報に応じて変更した値である第1の式の値を算出する(ただし、dは回答候補情報であり、Tは、前記用語セットであり、dist(t1,t2)は、用語t1,t2の間隔であり、Nは、文書の総数であり、df(t)は、用語tの出現する文書数であり、wdr2(t2)は、実験によって定められる用語t2の関数である)、プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2007289613thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close