INTERACTIVE MULTIPLE DOCUMENT SUMMARIZATION DEVICE
Patent code | P110004972 |
---|---|
Posted date | Aug 18, 2011 |
Application number | P2006-256759 |
Publication number | P2008-077459A |
Patent number | P4806773 |
Date of filing | Sep 22, 2006 |
Date of publication of application | Apr 3, 2008 |
Date of registration | Aug 26, 2011 |
Inventor |
|
Applicant |
|
Title | INTERACTIVE MULTIPLE DOCUMENT SUMMARIZATION DEVICE |
Abstract |
PROBLEM TO BE SOLVED: To provide a technique for regenerating, based on a high-attention part selected from a summary document by an operator, the summary document containing information related to the high-attention part in an interactive multiple document summarization device for summarizing a plurality of documents retrieved with a retrieval condition. SOLUTION: A summary document generation part 510 extracts an important sentence from summarization object documents in a summarization object document storage part 205. A summary document presentation part 504 specifies a high-attention document that is the source of a high-attention sentence selected by the operator in a summary document screen displaying the summary document of a summary document storage part 502, and a summarization object document narrowing part 506 narrows the summarization object documents of the summarization object document storage part 205 to the high-attention document. The summary documents are repeatedly generated and displayed. |
Outline of related art and contending technology |
(In Japanese) 通常の要約生成装置では、複数の文書から重要文を抽出し、それらを整列させて要約文書を生成する。しかし、一回の要約で操作者が欲する情報を提供できるとは限らない。 |
Field of industrial application |
(In Japanese) 本発明は、検索条件により検索した複数の文書を要約する対話型複数文書要約装置に係り、要約文書から操作者が選択する注目部位に基づいて、注目部位に関連する情報を含む要約文書を再生成する技術に関する。 |
Scope of claims |
(In Japanese) 【請求項1】 複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置であって、以下の要素を有することを特徴とする対話型複数文書要約装置 (1)検索条件文を入力する検索条件入力部 (2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択部 (3)要約対象文書の識別情報を記憶する要約対象文書記憶部 (4)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成部 (5)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示部 (6)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込部。 【請求項2】 要約文書提示部は、要約文書画面が操作者に対して要約文書から注目文字列を選択するように促すように生成し、要約文書画面で選択された注目文字列に含まれる注目文字列内単語を特定し、更に要約文書に含まれるが注目文字列に含まれない注目文字列外単語を特定し、 対話型複数文書要約装置は、注目文字列内単語に1より大きい文字列注目係数を設定し、注目文字列外単語に1より小さい文字列注目係数を設定する文字列注目係数算出部を有し、 要約文書生成部は、単語の重要度に文字列注目係数を乗じ、その積を単語の重要度として用いることを特徴とする請求項1記載の対話型複数文書要約装置。 【請求項3】 要約文書提示部は、更に重要文の出所のうち注目文書以外の非注目文書の識別情報を特定し、 対話型複数文書要約装置は、更に、注目文書に含まれる注目文書内単語に1より大きい文書注目係数を設定し、非注目文書に含まれる単語であって注目文書内単語以外の注目文書外単語に1より小さい文書注目係数を設定する文書注目係数算出部を有し、 要約対象要約文書生成部は、単語の重要度に文書注目係数を乗じ、その積を単語の重要度として用いることを特徴とする請求項1記載の対話型複数文書要約装置。 【請求項4】 対話型複数文書要約装置は、更に、 検索条件文に含まれる単語の頻度に基づいて初期の検索質問ベクトルを算出し、検索質問ベクトル記憶部に記憶させる初期検索質問ベクトル算出部と、 検索質問ベクトルを記憶する検索質問ベクトル記憶部と、 文書検索エンジンに検索質問ベクトルを転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを推薦要約対象文書の識別情報とする推薦要約対象文書抽出部と、 推薦要約対象文書の識別情報により特定される推薦要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる推薦要約文書を生成する推薦要約文書生成部と、 注目文書の識別情報により特定される文書ベクトルに基づいて加算修正ベクトルを算出し、非注目文書の識別情報により特定される文書ベクトルに基づいて減算修正ベクトルを算出し、検索質問ベクトル記憶部に記憶している検索質問ベクトルに加算修正ベクトルを加算し、減算修正ベクトルを減算し、検索質問ベクトルを更新する検索質問ベクトル更新部を有し、 要約文書提示部は、推薦要約文書を表示し、操作者に対して推薦要約文書に含まれる重要文から注目文を選択するように促す推薦要約文書画面を生成し、推薦要約文書画面で選択された注目文の出所である注目文書の識別情報を特定し、前記要約文書及び当該推薦要約文書について、重要文の出所のうち注目文書以外の非注目文書の識別情報を特定することを特徴とする請求項1記載の対話型複数文書要約装置。 【請求項5】 要約対象文書の識別情報を記憶する要約対象文書記憶部を有し、複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置となるコンピュータに、以下の手順を実行させるためのプログラム (1)検索条件文を入力する検索条件入力手順 (2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択手順 (3)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成手順 (4)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示手順 (5)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込手順。 |
IPC(International Patent Classification) | |
F-term |
|
Drawing
※Click image to enlarge. |
|
State of application right | Registered |
※
Please contact us by E-mail or facsimile if you have any interests on this patent.
Contact Information for " INTERACTIVE MULTIPLE DOCUMENT SUMMARIZATION DEVICE"
- Yokohama National University Department of Intellectual Property Management
- URL: https://www.ripo.ynu.ac.jp/
-
E-mail:
- Address: 79-5 Tokiwadai, Hodogaya-ku, Yokohama, Kagagawa, Japan , 240-8501
- Fax: 81-45-339-4387