TOP > 国内特許検索 > 対話型複数文書要約装置

対話型複数文書要約装置 コモンズ

国内特許コード P110004972
掲載日 2011年8月18日
出願番号 特願2006-256759
公開番号 特開2008-077459
登録番号 特許第4806773号
出願日 平成18年9月22日(2006.9.22)
公開日 平成20年4月3日(2008.4.3)
登録日 平成23年8月26日(2011.8.26)
発明者
  • 森 辰則
  • 谷岡 洵
出願人
  • 国立大学法人横浜国立大学
発明の名称 対話型複数文書要約装置 コモンズ
発明の概要

【課題】検索条件により検索した複数の文書を要約する対話型複数文書要約装置に係り、要約文書から操作者が選択した注目部位に基づいて、注目部位に関連する情報を含む要約文書を再生成する技術を提供する。
【解決手段】要約文書生成部501は、要約対象文書記憶部205の要約対象文書から重要文を抽出して要約文書を生成する。そして、要約文書提示部504は、要約文書記憶部502の要約文書を表示する要約文書画面で、操作者が選択した注目文の出所である注目文書を特定し、要約対象文書絞込部506は、要約対象文書記憶部205の要約対象文書を注目文書に絞り込む。そして、繰り返し要約文書を生成し、表示する。
【選択図】図5

従来技術、競合技術の概要


通常の要約生成装置では、複数の文書から重要文を抽出し、それらを整列させて要約文書を生成する。しかし、一回の要約で操作者が欲する情報を提供できるとは限らない。

【特許文献1】特開2006-59082号公報

産業上の利用分野


本発明は、検索条件により検索した複数の文書を要約する対話型複数文書要約装置に係り、要約文書から操作者が選択する注目部位に基づいて、注目部位に関連する情報を含む要約文書を再生成する技術に関する。

特許請求の範囲 【請求項1】
複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置であって、以下の要素を有することを特徴とする対話型複数文書要約装置
(1)検索条件文を入力する検索条件入力部
(2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択部
(3)要約対象文書の識別情報を記憶する要約対象文書記憶部
(4)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成部
(5)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示部
(6)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込部。

【請求項2】
要約文書提示部は、要約文書画面が操作者に対して要約文書から注目文字列を選択するように促すように生成し、要約文書画面で選択された注目文字列に含まれる注目文字列内単語を特定し、更に要約文書に含まれるが注目文字列に含まれない注目文字列外単語を特定し、
対話型複数文書要約装置は、注目文字列内単語に1より大きい文字列注目係数を設定し、注目文字列外単語に1より小さい文字列注目係数を設定する文字列注目係数算出部を有し、
要約文書生成部は、単語の重要度に文字列注目係数を乗じ、その積を単語の重要度として用いることを特徴とする請求項1記載の対話型複数文書要約装置。

【請求項3】
要約文書提示部は、更に重要文の出所のうち注目文書以外の非注目文書の識別情報を特定し、
対話型複数文書要約装置は、更に、注目文書に含まれる注目文書内単語に1より大きい文書注目係数を設定し、非注目文書に含まれる単語であって注目文書内単語以外の注目文書外単語に1より小さい文書注目係数を設定する文書注目係数算出部を有し、
要約対象要約文書生成部は、単語の重要度に文書注目係数を乗じ、その積を単語の重要度として用いることを特徴とする請求項1記載の対話型複数文書要約装置。

【請求項4】
対話型複数文書要約装置は、更に、
検索条件文に含まれる単語の頻度に基づいて初期の検索質問ベクトルを算出し、検索質問ベクトル記憶部に記憶させる初期検索質問ベクトル算出部と、
検索質問ベクトルを記憶する検索質問ベクトル記憶部と、
文書検索エンジンに検索質問ベクトルを転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを推薦要約対象文書の識別情報とする推薦要約対象文書抽出部と、
推薦要約対象文書の識別情報により特定される推薦要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる推薦要約文書を生成する推薦要約文書生成部と、
注目文書の識別情報により特定される文書ベクトルに基づいて加算修正ベクトルを算出し、非注目文書の識別情報により特定される文書ベクトルに基づいて減算修正ベクトルを算出し、検索質問ベクトル記憶部に記憶している検索質問ベクトルに加算修正ベクトルを加算し、減算修正ベクトルを減算し、検索質問ベクトルを更新する検索質問ベクトル更新部を有し、
要約文書提示部は、推薦要約文書を表示し、操作者に対して推薦要約文書に含まれる重要文から注目文を選択するように促す推薦要約文書画面を生成し、推薦要約文書画面で選択された注目文の出所である注目文書の識別情報を特定し、前記要約文書及び当該推薦要約文書について、重要文の出所のうち注目文書以外の非注目文書の識別情報を特定することを特徴とする請求項1記載の対話型複数文書要約装置。

【請求項5】
要約対象文書の識別情報を記憶する要約対象文書記憶部を有し、複数の文書を記憶する文書データベースから文書を検索する文書検索エンジンと接続する対話型複数文書要約装置となるコンピュータに、以下の手順を実行させるためのプログラム
(1)検索条件文を入力する検索条件入力手順
(2)入力した検索条件文から検索条件式を生成し、文書検索エンジンに検索条件式を転送し、文書検索エンジンから検索結果文書の識別情報を取得し、それらを要約対象文書の識別情報とする要約対象文書選択手順
(3)要約対象文書の識別情報により特定される要約対象文書に含まれる文データに含まれる単語の重要度を算出し、当該単語の重要度に基づいて文の重要度を算出し、文の重要度に基づいて重要文を特定し、重要文からなる要約文書を生成する要約文書生成手順
(4)要約文書を表示し、操作者に対して要約文書に含まれる重要文から注目文を選択するように促す要約文書画面を生成し、要約文書画面で選択された注目文の出所である注目文書の識別情報を特定する要約文書提示手順
(5)要約対象文書記憶部に記憶している要約対象文書の識別情報群を注目文書の識別情報に更新する要約対象文書絞込手順。
産業区分
  • 計算機応用
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2006256759thum.jpg
出願権利状態 権利存続中
※ 掲載特許について詳しくお知りになりたい方はHPの「お問い合わせ」ページにてお問い合わせください。


PAGE TOP

close
close
close
close
close
close
close