Top > Search of Japanese Patents > QUESTION ANSWERING SYSTEM

QUESTION ANSWERING SYSTEM

Patent code P06P004673
File No. T57
Posted date Sep 22, 2006
Application number P2005-058390
Publication number P2006-244102A
Patent number P4512826
Date of filing Mar 3, 2005
Date of publication of application Sep 14, 2006
Date of registration May 21, 2010
Inventor
  • (In Japanese)藤井 敦
  • (In Japanese)石川 徹也
  • (In Japanese)三原 英理
Applicant
  • (In Japanese)国立大学法人筑波大学
Title QUESTION ANSWERING SYSTEM
Abstract PROBLEM TO BE SOLVED: To provide a question answering system for answering questions to ask actions without limiting any area.
SOLUTION: This question answering system is provided with an FAQ database part 12 for preliminarily storing familiar questions and answers to those questions, a question extracting part 14 connected to a Web 13 for extracting questions frequently appearing on the Web 13, a judgement part 15 connected to the question extracting part 14 for judging whether or not those questions are the familiar questions, a retrieval part 16 connected to the Web 13 for comprehensively retrieving pages relevant to the questions by using a retrieval engine when it is decided that those questions are not the familiar questions by the judgement part 15, an answer extracting part 17 connected to the retrieval part 16 for extracting paragraphs including action expressions from the retrieved pages, an answer organizing part 18 connected to the answer extracting part 17 for classifying the paragraphs based on the included action expressions and an answering part 19 for making the answers and questions classified by the answer organizing part 18 as a pair, and for storing them in an FAQ database part 11.
Outline of related art and contending technology (In Japanese)

インターネットの普及により、Web(ウェブ)〔World Wide Webの略〕上には多種多様かつ膨大な情報が存在する。そのため、日常的な疑問に対し、検索エンジンを用いてウェブ上の情報から回答を探す機会が増えている。しかし、既存の検索エンジンを使うためには、質問の内容をキーワードで的確に表現する必要がある。さらに、検索された膨大なページから回答となる語句や文章をユーザ自身が探さなければならない。

ところで、自然言語による質問文に対して回答するために、質問応答システムが研究されている。既存の研究は、限定された領域に関する知識や規則によって推論を行うもの(推論型システム)と、組織化されていない文書集合から回答を抽出するもの(抽出型システム)との2種類に大別される。近年は後者の抽出型システムが主に研究されている。
以下、上記した従来技術について詳細に説明する。

人工知能分野における質問応答の研究は1960年代に遡る。具体的には、エキスパート・システムや対話システムであり、推論によって回答する「推論型システム」である。これらは、システムとユーザとの対話を通して質問・回答を洗練させたり、推論によって複数の事実から回答を導き出したりするという特長がある。しかし、領域知識や推論規則を人手で構築する必要があるため、回答できる分野が限定され、拡張性に乏しいといった問題があった。

一方、自然言語処理や情報検索分野では、1990年代後半からTREC(Text REtrieval Conference:http://trec.nist.gov/)やNTCIR(情報検索システム評価用テストコレクション構築プロジェクト)で質問応答の研究が盛んになった。人工知能分野における推論型システムと異なり、ここでは、「抽出型システム」が主な研究対象である。組織化されていない文書集合を情報源として用いるため、領域知識や推論規則の構築が不要な点で推論型システムとは異なる。

このようなTRECやNTCIRにおける質問応答システムの回答対象は客観的事実(factoid)である。ユーザが入力した、who、when、where、whatを中心とするWH疑問文に対し、名詞で回答する。客観的事実を回答とするシステムとしては、gooラボ日本語自然文検索(http://labs.nttrd.com/)やMURAX(下記非特許文献1参照)がある。MURAXは入力された質問文を解析することで、何についての質問で、回答はどのようなものかという仮説を立てる。その仮説に基づいてクエリ構築や検索を行い、文書集合から該当箇所を探して回答する。

また、下記非特許文献2では、行動を問う「how型質問」への回答を目的とし、知識獲得手法が提案されている。linuxユーザのメーリングリストに投稿された質問メール・回答メールの本文から、重要文を抽出することで、方法や対処法を問う質問に回答するための知識を得ている。しかし、本手法では対象となる領域が限定されている。
【非特許文献1】
Julian Kupiec.MURAX:Finding and Organizing Answers from Text Search. In T.Strzalkowsky,editor,Natural Language Information Retrieval,pp.311-332.Kluwer Avademic Publishers,1999.
【非特許文献2】
渡辺靖彦,園和也,岡田至弘.「メーリングリストを利用した質問応答システムのための知識獲得」,情報処理学会研究報告,2004-NL-162,pp.131-138,2004.
【非特許文献3】
徳永健伸,岩山真,乾健太郎,田中穂積.「日本語語順の推定モデルとその応用」,情報処理学会研究報告,91-NL-81,pp.9-16,1991.

Field of industrial application (In Japanese)

本発明は、何らかの困った状況にあるユーザからの質問に対して、解決手段となる行動を回答する質問応答システムに関するものである。

Scope of claims (In Japanese)
【請求項1】
 
a)ウェブに接続され、ウェブページを検索し頻出する質問表現をよくある質問として抽出する質問抽出部と、
b)該質問抽出部に接続されるとともに、ウェブに接続され、検索エンジンを用いて前記質問抽出部で抽出されたよくある質問に関連するページを網羅的に検索する検索部と、
c)該検索部に接続され、前記検索されたページから前記よくある質問に対する回答となる行動を表す表現と、該行動を表す表現を含む複数の段落を抽出する回答抽出部と、
d)該回答抽出部に接続され、前記回答抽出部で抽出された複数の段落を、同じ行動を表す表現を含むグループごとに分類する回答組織化部と、
e前記質問抽出部で抽出されたよくある質問と前記回答組織化部で分類された回答とを対にして予め記憶しておくFAQデータベース部と、
f)質問を入力し、回答が出力されるユーザインタフェース装置と、
g前記FAQデータベース部及び前記ユーザインタフェース装置に接続され、前記FAQデータベース部に記憶されたよくある質問に、前記ユーザインタフェース装置に入力された質問と同じ質問があるかを判別する判別部とを具備し、
(h)前記判別部で同じ質問があると判定された場合、前記ユーザインタフェース装置に入力された質問に対応する回答を、前記行動を表す表現又は該行動を表す表現を含む段落を回答の単位として前記FAQデータベース部から提示し、前記判別部で同じ質問がないと判定された場合、前記ユーザインタフェース装置に入力された質問に対して前記検索・回答抽出・回答組織化を行って回答を生成し提示することを特徴とする質問応答システム。

【請求項2】
 
請求項1記載の質問応答システムにおいて、前記段落の抽出には文字数に関する閾値を併用し、120文字以上200文字以下を段落として抽出することを特徴とする質問応答システム。

【請求項3】
 
請求項1記載の質問応答システムにおいて、前記回答抽出部は、前記抽出された複数の段落に含まれる前記行動を表す表現にスコアを付け、各段落に含まれる前記行動を表す表現のスコアを総和することで、前記各段階のスコア付けを行うことを特徴とする質問応答システム。

【請求項4】
 
請求項3記載の質問応答システムにおいて、前記行動を表す表現のスコアは、回答として適切な行動を表す表現を選択するため、
(a)係り受けの距離が近い
(b)推奨表現と禁止表現を伴っている
(c)抽出元ページの検索における順位が高い
(d)質問に含まれる行動を表す表現との距離が近い
(e)質問者(ユーザ)がすべき行動である
上記5つの基準を用いてスコア付けすることを特徴とする質問応答システム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2005058390thum.jpg
State of application right Registered
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close