TOP > 国内特許検索 > 質問応答システム

質問応答システム コモンズ

国内特許コード P06P004673
整理番号 T57
掲載日 2006年9月22日
出願番号 特願2005-058390
公開番号 特開2006-244102
登録番号 特許第4512826号
出願日 平成17年3月3日(2005.3.3)
公開日 平成18年9月14日(2006.9.14)
登録日 平成22年5月21日(2010.5.21)
発明者
  • 藤井 敦
  • 石川 徹也
  • 三原 英理
出願人
  • 学校法人筑波大学
発明の名称 質問応答システム コモンズ
発明の概要

【課題】 行動を問う質問に対して、領域を限定することなく回答することができる質問応答システムを提供する。
【解決手段】 よくある質問とそれに対する回答を事前に記憶するFAQデータベース部12と、ウェブ13に接続され、ウェブ13上に頻出する質問を抽出する質問抽出部14と、この質問抽出部14に接続され、前記よくある質問であるか否かの判別部15と、前記判別部15に接続されるとともに、ウェブ13に接続され、前記判別部15でよくある質問でないと判定された場合、検索エンジンを用いて質問に関連するページを網羅的に検索する検索部16と、この検索部16に接続され、検索されたページから行動表現を含む段落を抽出する回答抽出部17と、この回答抽出部17に接続され、含まれる行動表現によって段落を分類する回答組織化部18とを備え、前記回答組織化部18で分類された回答と質問を対にして、前記FAQデータベース部11に蓄積する回答部19とを具備する。
【選択図】図1

従来技術、競合技術の概要


インターネットの普及により、Web(ウェブ)〔World Wide Webの略〕上には多種多様かつ膨大な情報が存在する。そのため、日常的な疑問に対し、検索エンジンを用いてウェブ上の情報から回答を探す機会が増えている。しかし、既存の検索エンジンを使うためには、質問の内容をキーワードで的確に表現する必要がある。さらに、検索された膨大なページから回答となる語句や文章をユーザ自身が探さなければならない。



ところで、自然言語による質問文に対して回答するために、質問応答システムが研究されている。既存の研究は、限定された領域に関する知識や規則によって推論を行うもの(推論型システム)と、組織化されていない文書集合から回答を抽出するもの(抽出型システム)との2種類に大別される。近年は後者の抽出型システムが主に研究されている。
以下、上記した従来技術について詳細に説明する。



人工知能分野における質問応答の研究は1960年代に遡る。具体的には、エキスパート・システムや対話システムであり、推論によって回答する「推論型システム」である。これらは、システムとユーザとの対話を通して質問・回答を洗練させたり、推論によって複数の事実から回答を導き出したりするという特長がある。しかし、領域知識や推論規則を人手で構築する必要があるため、回答できる分野が限定され、拡張性に乏しいといった問題があった。



一方、自然言語処理や情報検索分野では、1990年代後半からTREC(Text REtrieval Conference:http://trec.nist.gov/)やNTCIR(情報検索システム評価用テストコレクション構築プロジェクト)で質問応答の研究が盛んになった。人工知能分野における推論型システムと異なり、ここでは、「抽出型システム」が主な研究対象である。組織化されていない文書集合を情報源として用いるため、領域知識や推論規則の構築が不要な点で推論型システムとは異なる。



このようなTRECやNTCIRにおける質問応答システムの回答対象は客観的事実(factoid)である。ユーザが入力した、who、when、where、whatを中心とするWH疑問文に対し、名詞で回答する。客観的事実を回答とするシステムとしては、gooラボ日本語自然文検索(http://labs.nttrd.com/)やMURAX(下記非特許文献1参照)がある。MURAXは入力された質問文を解析することで、何についての質問で、回答はどのようなものかという仮説を立てる。その仮説に基づいてクエリ構築や検索を行い、文書集合から該当箇所を探して回答する。



また、下記非特許文献2では、行動を問う「how型質問」への回答を目的とし、知識獲得手法が提案されている。linuxユーザのメーリングリストに投稿された質問メール・回答メールの本文から、重要文を抽出することで、方法や対処法を問う質問に回答するための知識を得ている。しかし、本手法では対象となる領域が限定されている。

【非特許文献1】Julian Kupiec.MURAX:Finding and Organizing Answers from Text Search. In T.Strzalkowsky,editor,Natural Language Information Retrieval,pp.311-332.Kluwer Avademic Publishers,1999.

【非特許文献2】渡辺靖彦,園和也,岡田至弘.「メーリングリストを利用した質問応答システムのための知識獲得」,情報処理学会研究報告,2004-NL-162,pp.131-138,2004.

【非特許文献3】徳永健伸,岩山真,乾健太郎,田中穂積.「日本語語順の推定モデルとその応用」,情報処理学会研究報告,91-NL-81,pp.9-16,1991.

産業上の利用分野


本発明は、何らかの困った状況にあるユーザからの質問に対して、解決手段となる行動を回答する質問応答システムに関するものである。

特許請求の範囲 【請求項1】
)ウェブに接続され、ウェブページを検索し頻出する質問表現をよくある質問として抽出する質問抽出部と、
)該質問抽出部に接続されるとともに、ウェブに接続され、検索エンジンを用いて前記質問抽出部で抽出されたよくある質問に関連するページを網羅的に検索する検索部と、
)該検索部に接続され、前記検索されたページから前記よくある質問に対する回答となる行動を表す表現と、該行動を表す表現を含む複数の段落を抽出する回答抽出部と、
)該回答抽出部に接続され、前記回答抽出部で抽出された複数の段落を、同じ行動を表す表現を含むグループごとに分類する回答組織化部と、
前記質問抽出部で抽出されたよくある質問と前記回答組織化部で分類された回答とを対にして予め記憶しておくFAQデータベース部と、
)質問を入力し、回答が出力されるユーザインタフェース装置と、
前記FAQデータベース部及び前記ユーザインタフェース装置に接続され、前記FAQデータベース部に記憶されたよくある質問に、前記ユーザインタフェース装置に入力された質問と同じ質問があるかを判別する判別部とを具備し、
(h)前記判別部で同じ質問があると判定された場合、前記ユーザインタフェース装置に入力された質問に対応する回答を、前記行動を表す表現又は該行動を表す表現を含む段落を回答の単位として前記FAQデータベース部から提示し、前記判別部で同じ質問がないと判定された場合、前記ユーザインタフェース装置に入力された質問に対して前記検索・回答抽出・回答組織化を行って回答を生成し提示することを特徴とする質問応答システム。

【請求項2】
請求項記載の質問応答システムにおいて、前記段落の抽出には文字数に関する閾値を併用し、120文字以上200文字以下を段落として抽出することを特徴とする質問応答システム。

【請求項3】
請求項1記載の質問応答システムにおいて、前記回答抽出部は、前記抽出された複数の段落に含まれる前記行動を表す表現にスコアを付け、各段落に含まれる前記行動を表す表現のスコアを総和することで、前記各段階のスコア付けを行うことを特徴とする質問応答システム。

【請求項4】
請求項記載の質問応答システムにおいて、前記行動を表す表現のスコアは、回答として適切な行動を表す表現を選択するため、
(a)係り受けの距離が近い
(b)推奨表現と禁止表現を伴っている
(c)抽出元ページの検索における順位が高い
(d)質問に含まれる行動を表す表現との距離が近い
(e)質問者(ユーザ)がすべき行動である
上記5つの基準を用いてスコア付けすることを特徴とする質問応答システム。
産業区分
  • 計算機応用
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2005058390thum.jpg
出願権利状態 権利存続中
この特許について質問等ある場合は、電子メールによりご連絡ください。


PAGE TOP

close
close
close
close
close
close
close