TOP > 国内特許検索 > 自動要約処理装置および自動要約処理方法

自動要約処理装置および自動要約処理方法 コモンズ 外国出願あり

国内特許コード P140010534
整理番号 04-16
掲載日 2014年5月13日
出願番号 特願2004-168944
公開番号 特開2004-253011
登録番号 特許第4187213号
出願日 平成16年6月7日(2004.6.7)
公開日 平成16年9月9日(2004.9.9)
登録日 平成20年9月19日(2008.9.19)
発明者
  • 村田 真樹
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 自動要約処理装置および自動要約処理方法 コモンズ 外国出願あり
発明の概要 【課題】 ユーザが評価した要約を解データとして用いた機械学習法による要約処理を行ってユーザに特化した要約処理を実現する。
【解決手段】 評価カスタマイズ手段110 は表示した要約にユーザ入力の評価を付与し、テキストと要約と評価(解)とを事例として解データ記憶部120 に記憶する。解-素性対抽出部121 は事例から解と素性の集合との組を抽出し、機械学習部122 はどのような素性のときにどのような解となりやすいかを学習して結果を学習結果データ記憶部123 に記憶する。要約候補生成部124 はテキスト2 から要約候補を生成し、素性抽出部125 はテキストと要約候補から素性の集合を抽出し、要約候補-推定解対生成部126 は学習結果データを参照して素性の集合から推定して要約候補-推定解対を生成し、要約選択部128 はその対の要約候補を要約とする。
【選択図】 図1
従来技術、競合技術の概要


近年、情報技術の発展に伴ってコンピュータを用いた文章の自動要約処理が盛んになってきている。しかし、個人的な嗜好や要約結果の用途などにより、所望する要約結果の傾向に相違があると考えられる。



例えば、以下の非特許文献1では、複数の者がそれぞれ重要文抽出による要約を行なった結果に対する相互評価の尺度として再現率と適合率とを求めて表4に示している。非特許文献1の表4から明らかなように、20文を抽出する処理の場合に、人-人(評価者相互)の評価(再現率および適合率)は、各評価者A、B、Cの一致度は50~70%であってあまり高い値とはいえず、要約結果に対する評価に個人差が存在することが推定できる。



また、以下の非特許文献2では、サポート・ベクトル・マシン(Support Vector Machine)による重要文抽出処理において、処理セットA、B、Cについて交差検定の精度が最もよいことを表4により示している。非特許文献2の表4に示された交差検定は、同一評価者による処理と同一視でき、セットA、B、Cを作成した者が同一かどうかは不明であるが、少なくとも同一時期もしくは同一人物により学習データを作成したほうが精度が良いということがわかる。
【非特許文献1】
伊藤山彦他、「講演文を対象にした重要文抽出」、言語処理学会第7回年次大会発表論文集、言語処理学会、2001年、pp.305-308
【非特許文献2】
平尾勉他、「Support Vector Machineによる重要文抽出」、情報学会基礎論文63-16 、情報学会、2001年、pp.121-127

産業上の利用分野



本発明は、機械学習法により文章を自動要約する処理において、編集可能な解データを用いる機械学習法を用いた自動要約処理に関する。

特許請求の範囲 【請求項1】
文書データであるテキストを機械学習法を用いて自動要約する自動要約処理装置であって、
テキストおよび前記テキストの要約を記憶するテキスト記憶手段と、
前記要約を表示装置に表示する要約表示処理手段と、
予め用意された評価であって少なくとも良い評価を含む複数の評価から、前記要約に対するユーザの評価として入力された評価を受け付けて前記要約のユーザ評価とする評価設定処理手段と、
前記テキストおよび前記要約を問題とし、当該問題に対する前記評価を解とする解データを生成し、解データ記憶手段に記憶する評価カスタマイズ処理手段と、
前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれか1つの機械学習アルゴリズムを用いて、前記問題から抽出された複数の素性で構成される素性の集合と前記解との組について、どのような素性の集合の場合にどのような解になりやすいかということを機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する機械学習処理手段と、
要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する要約候補生成処理手段と、
前記入力テキストと前記要約候補各々との組を生成し、当該各組から素性を抽出し、前記用意された評価の各々を解とし、当該組から抽出された複数の素性で構成される素性の集合の場合になりやすい解および当該解へのなりやすの確信度を前記学習結果データにもとづいて推定し、当該組の要約候補に当該推定した解および確信度を推定解として付与して要約候補-推定解対を生成する要約候補-推定解対生成処理手段と、
前記要約候補-推定解対から、前記推定解が前記良い評価かつ前記確信度が最高の要約候補-推定解対を選択し、当該選択した要約候補-推定解対の要約候補を要約とする要約選択処理手段とを備える
ことを特徴とする自動要約処理装置。

【請求項2】
文書データであるテキストを機械学習法を用いて自動要約する自動要約処理装置であって、
テキストを記憶するテキスト記憶手段と、
前記テキストを表示装置に表示するテキスト表示処理手段と、
前記テキストからユーザによって指定された範囲の文データを抽出して前記テキストのユーザ指定要約とする要約編集処理手段と、
前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し、さらに、前記テキストおよび前記ユーザ指定要約を問題とし前記ユーザによって良い要約として指定された要約であることを示すユーザ設定良評価を解とする解データを生成し、前記テキストおよび前記要約候補のうち前記ユーザ指定要約以外の部分からなる要約候補を問題とし前記ユーザ指定要約ではないことを示すユーザ設定悪評価を解とする解データを生成し、前記ユーザ設定良評価を解とする解データと前記ユーザ設定悪評価を解とする解データとを解データ記憶手段に記憶する評価カスタマイズ処理手段と、
前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれかの1つの機械学習アルゴリズムを用いて、当該解データの問題から抽出された複数の素性で構成される素性の集合と前記解との組について、どのような素性の集合の場合に前記ユーザ設定良評価およびユーザ設定悪評価の解になりやすいかということを機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する機械学習処理手段と、
要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する要約候補生成処理手段と、
前記入力テキストと前記要約候補各々との組を生成し、当該各組から素性を抽出し、前記ユーザ設定良評価および前記ユーザ設定悪評価を解とし、当該組から抽出された複数の素性で構成される素性の集合の場合になりやすい解および当該解へのなりやすの確信度を前記学習結果データにもとづいて推定し、当該組の要約候補に当該推定した解および確信度を推定解として付与して要約候補-推定解対を生成する要約候補-推定解対生成処理手段と、
前記要約候補-推定解対から、前記推定解が前記ユーザ設定良評価かつ前記確信度が最高の要約候補-推定解対を選択し、当該要約候補-推定解対の要約候補を要約とする要約選択処理手段とを備える
ことを特徴とする自動要約処理装置。

【請求項3】
文書データであるテキストを機械学習法を用いて自動要約する自動要約処理装置であって、
テキストおよび前記テキストの要約を記憶するテキスト記憶手段と、
前記要約を表示装置に表示する要約表示処理手段と、
予め用意された評価であって少なくとも良い評価を含む複数の評価から、前記要約に対する評価としてユーザによって入力された評価を受け付けて前記要約のユーザ評価とする評価設定処理手段と、
前記テキストおよび前記要約を問題とし前記ユーザ評価を解とする解データを生成し解データ記憶手段に記憶する評価カスタマイズ処理手段と、
前記用意された複数の評価のうち前記ユーザ評価以外の評価を解候補とし、前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、前記問題から抽出された複数の素性で構成される素性の集合と前記解との組を素性-解対とし、前記問題の素性の集合と前記解候補各々との組を素性-解候補対とし、前記素性-解対を正例とし、前記素性-解候補対を負例とする素性-解対・素性-解候補対抽出処理手段と、
決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれか1つの機械学習アルゴリズムを用いて、前記素性-解対および素性-解候補対の各々について、前記素性の集合と解もしくは解候補との組の場合に前記正例になる確率および前記負例になる確率を機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する機械学習処理手段と、
要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する要約候補生成処理手段と、
前記入力テキストと前記要約候補各々との組を生成し、当該各組から素性を抽出し、前記組から抽出された複数の素性で構成される素性の集合に前記複数の評価各々を評価解候補として付与した組を生成し、当該組の素性の集合と評価解候補との組の場合に前記正例になる確率および前記負例になる確率を前記学習結果データにもとづいて推定し、当該組の素性の集合と評価解候補との組に前記推定した正例になる確率および負例になる確率を推定解として付与して要約候補-推定解対を生成する要約候補-推定解対生成処理手段と、
前記要約候補-推定解対から、前記評価解候補が前記良い評価かつ前記推定解の前記正例になる確率が最高の要約候補-推定解対を選択し、当該要約候補-推定解対の要約候補を要約とする要約選択処理手段とを備える
ことを特徴とする自動要約処理装置。

【請求項4】
文書データであるテキストを機械学習法を用いて自動要約する自動要約処理装置であって、
テキストを記憶するテキスト記憶手段と、
前記テキストを表示装置に表示するテキスト表示処理手段と、
前記テキストからユーザによって指定された範囲の文データを抽出して前記テキストのユーザ指定要約とする要約編集処理手段と、
前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し、さらに、前記テキストおよび前記ユーザ指定要約を問題とし前記ユーザによって良い要約として指定された要約であることを示すユーザ設定良評価を解とする解データを生成し、前記テキストおよび前記要約候補のうち前記ユーザ指定要約以外の部分からなる要約候補を問題とし前記ユーザ指定要約ではないことを示すユーザ設定悪評価を解とする解データを生成し、前記ユーザ設定良評価を解とする解データと前記ユーザ設定悪評価を解とする解データとを解データ記憶手段に記憶する評価カスタマイズ処理手段と、
予め用意された評価であって少なくとも前記ユーザ設定良評価および前記ユーザ設定悪評価を含む複数の評価から、前記解となった評価以外の評価を解候補とし、前記解データの問題から素性を抽出し、前記問題から抽出された複数の素性で構成される素性の集合と前記解との組を素性-解対とし、前記素性の集合と前記解候補各々との組を素性-解候補対とし、前記素性-解対を正例とし、前記素性-解候補対を負例とする素性-解対・素性-解候補対抽出処理手段と、
決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれかの1つの機械学習アルゴリズムを用いて、前記素性-解対および前記素性-解候補対の各々について、前記素性の集合と解もしくは解候補との組の場合に前記正例になる確率および前記負例になる確率を機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する機械学習処理手段と、
要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する要約候補生成処理手段と、
前記入力テキストと前記要約候補各々との組を生成し、前記各組から素性を抽出し、前記組から抽出された複数の素性で構成される素性の集合に前記複数の評価各々を評価解候補として付与した組を生成し、当該組の場合に前記正例になる確率および前記負例になる確率を前記学習結果データにもとづいて推定し、当該組の素性の集合と評価解候補との組に前記推定した正例になる確率および負例になる確率を推定解として付与して要約候補-推定解対を生成する要約候補-推定解対生成処理手段と、
前記要約候補-推定解対から、前記評価解候補が前記ユーザ設定良評価かつ前記推定解の前記正例になる確率が最高の要約候補-推定解対を選択し、当該選択された要約候補-推定解対の要約候補を要約とする要約選択処理手段とを備える
ことを特徴とする自動要約処理装置。

【請求項5】
文書データであるテキストを機械学習法を用いて自動要約する自動要約処理装置であって、
テキストを記憶するテキスト記憶手段と、
前記テキストを表示装置に表示するテキスト表示処理手段と、
前記テキストからユーザによって指定された範囲の文データを抽出して前記テキストのユーザ指定要約とする要約編集処理手段と、
前記テキストを問題とし前記ユーザ指定要約を解とする解データを生成し、前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し、前記要約候補のうち前記ユーザ指定要約以外の部分からなる要約候補を解候補とし、前記テキストを問題とし前記解候補を解とする解データを作成し、前記ユーザ指定要約を解とする解データと前記解候補を解とする解データとを解データ記憶手段に記憶する評価カスタマイズ処理手段と、
前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、当該問題から抽出された複数の素性で構成される素性の集合と前記解とを素性-解対とし、当該問題の素性の集合と前記解候補との組を素性-解候補対とし、前記素性-解対を正例とし、前記素性-解候補対を負例とする素性-解対・素性-解候補対抽出処理手段と、
決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれか1つの機械学習アルゴリズムを用いて、前記素性-解対および前記素性-解候補対について、前記素性の集合と解もしくは解候補との組の場合に前記正例になる確率および前記負例になる確率を機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する機械学習処理手段と、
要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する要約候補生成処理手段と、
前記入力テキストから生成された要約候補を要約解候補とし、前記入力テキストから素性を抽出し、当該入力テキストから抽出された複数の素性で構成される素性の集合と前記要約候補各々との組を生成し、当該素性の集合と前記要約解候補との組の場合に前記正例になる確率および前記負例になる確率を前記学習結果データにもとづいて推定し、当該素性の集合と要約候補の組に前記推定した正例になる確率および負例になる確率を推定解として付与して要約候補-推定解対を生成する要約候補-推定解対生成処理手段と、
前記要約候補-推定解対から、前記推定解の前記正例になる確率が最高の要約候補-推定解対を選択し、当該要約候補-推定解対の要約候補を要約とする要約選択処理手段とを備える
ことを特徴とする自動要約処理装置。

【請求項6】
請求項2または請求項4または請求項5のいずれか一項に記載の自動要約処理装置において、
前記要約編集処理手段は、さらに、前記テキスト内で前記ユーザによって指定された範囲の文字列の変更を受け付け、前記変更された文字列を含む前記範囲の文データを前記ユーザ指定要約とする
ことを特徴とする自動要約処理装置。

【請求項7】
テキスト記憶手段と要約表示処理手段と評価設定処理手段と評価カスタマイズ処理手段と解データ記憶手段と機械学習処理手段と学習結果データ記憶手段と要約候補生成処理手段と要約候補-推定解対生成処理手段と要約選択処理手段とを備えるコンピュータが、文書データであるテキストを機械学習法を用いて自動要約する自動要約処理方法であって、
前記要約表示処理手段が、テキストおよび前記テキストの要約を記憶する前記テキスト記憶手段にアクセスしてテキストおよび要約を取得し、前記要約を表示装置に表示する処理過程と、
前記評価設定処理手段が、予め容易された評価であって少なくとも良い評価を含む複数の評価から、前記要約に対するユーザの評価の入力を受け付けて前記要約のユーザ評価とする処理過程と、
前記評価カスタマイズ処理手段が、前記テキストおよび前記要約を問題とし、当該問題に対する前記評価を解とする解データを生成し、前記解データ記憶手段に記憶する処理過程と、
前記機械学習処理手段が、前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれか1つの機械学習アルゴリズムを用いて、前記問題から抽出された複数の素性で構成される素性の集合と前記解との組について、どのような素性の集合の場合にどのような解になりやすいかということを機械学習処理し、当該機械学習処理の処理結果を前記学習結果データとして学習結果データ記憶手段に記憶する処理過程と、
前記要約候補生成処理手段が、要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する処理過程と、
前記要約候補-推定解対生成処理手段が、前記入力テキストと前記要約候補各々との組を生成し、当該各組から素性を抽出し、前記用意された評価の各々を解とし、当該組から抽出された複数の素性で構成される素性の集合の場合になりやすい解および当該へのなりやすの確信度を前記学習結果データにもとづいて推定し、当該組の要約候補に当該推定した解および確信度を推定解として付与して要約候補-推定解対を生成する処理過程と、
前記要約選択処理手段が、前記要約候補-推定解対から、前記推定解が前記良い評価かつ前記確信度が最高の要約候補-推定解対を選択し、当該選択した要約候補-推定解対の要約候補を要約とする処理過程とを備える
ことを特徴とする自動要約処理方法。

【請求項8】
テキスト記憶手段とテキスト表示処理手段と要約編集処理手段と評価カスタマイズ処理手段と解データ記憶手段と機械学習処理手段と学習結果データ記憶手段と要約候補生成処理手段と要約候補-推定解対生成処理手段と要約選択処理手段とを備えるコンピュータが、文書データであるテキストを機械学習法を用いて自動要約する自動要約処理方法であって、
前記テキスト表示処理手段が、テキストを記憶する前記テキスト記憶手段にアクセスしてテキストを取得し、前記テキストを表示装置に表示する処理過程と、
前記要約編集処理手段が、前記テキストからユーザによって指定された範囲の文データを抽出し、前記テキストのユーザ指定要約とする処理過程と、
前記評価カスタマイズ処理手段が、前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し、さらに、前記テキストおよび前記ユーザ指定要約を問題とし前記ユーザによって良い要約として指定された要約であることを示すユーザ設定良評価を解とする解データを生成し、前記テキストおよび前記要約候補のうち前記ユーザ指定要約以外の部分からなる要約候補を問題とし前記ユーザ指定要約ではないことを示すユーザ設定悪評価を解とする解データを生成し、前記ユーザ設定良評価を解とする解データと前記ユーザ設定悪評価を解とする解データとを解データ記憶手段に記憶する処理過程と、
前記機械学習処理手段が、前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれかの1つの機械学習アルゴリズムを用いて、当該解データの問題から抽出された複数の素性で構成される素性の集合と解との組について、どのような素性の集合の場合に前記ユーザ設定良評価およびユーザ設定悪評価の解になりやすいかということを機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する処理過程と、
前記要約候補生成処理手段が、要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する処理過程と、
要約候補-推定解対生成処理手段が、前記入力テキストと前記要約候補各々との組を生成し、当該各組から素性を抽出し、前記ユーザ設定良評価および前記ユーザ設定悪評価を解とし、当該組から抽出された複数の素性で構成される素性の集合の場合になりやすい解および当該へのなりやすの確信度を前記学習結果データにもとづいて推定し、当該組の要約候補に前記推定した解および確信度を推定解として付与して要約候補-推定解対を生成する処理過程と、
前記要約選択処理手段が、前記要約候補-推定解対から、前記推定解が前記ユーザ設定良評価かつ前記確信度が最高の要約候補-推定解対を選択し、当該要約候補-推定解対の要約候補を要約とする処理過程とを備える
ことを特徴とする自動要約処理方法。

【請求項9】
テキスト記憶手段と要約表示処理手段と評価設定処理手段と評価カスタマイズ処理手段と解データ記憶手段と素性-解対・素性-解候補対抽出処理手段と機械学習処理手段と学習結果データ記憶手段と要約候補生成処理手段と要約候補-推定解対生成処理手段と要約選択処理手段とを備えるコンピュータが、文書データであるテキストを機械学習法を用いて自動要約する自動要約処理方法であって、
前記要約表示処理手段が、テキストおよび前記テキストの要約を記憶する前記テキスト記憶手段にアクセスしてテキストおよび要約を取得し、前記要約を表示装置に表示する処理過程と、
前記評価設定処理手段が、予め用意された評価であって少なくとも良い評価を含む複数の評価から、前記要約に対する評価としてユーザによって入力された評価を受け付けて前記要約のユーザ評価とする処理過程と、
前記評価カスタマイズ処理手段が、前記テキストおよび前記要約を問題とし前記ユーザ評価を解とする解データを生成し解データ記憶手段に記憶する処理過程と、
前記素性-解対・素性-解候補対抽出処理手段が、前記用意された複数の評価のうち前記ユーザ評価以外の評価を解候補とし、前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、前記問題から抽出された複数の素性で構成される素性の集合と前記解との組を素性-解対とし、前記問題から抽出された複数の素性で構成される素性の集合と前記解候補各々との組を素性-解候補対とし、前記素性-解対を正例とし、前記素性-解候補対を負例とする処理過程と、
前記機械学習処理手段が、決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれか1つの機械学習アルゴリズムを用いて、前記素性-解対および素性-解候補対各々について、前記素性の集合と解もしくは解候補との組の場合に前記正例になる確率および前記負例になる確率を機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する処理過程と、
前記要約候補生成処理手段が、要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する処理過程と、
前記要約候補-推定解対生成処理手段が、前記入力テキストと前記要約候補各々との組を生成し、当該各組から素性を抽出し、前記組から抽出された複数の素性で構成される素性の集合に前記複数の評価各々を評価解候補として付与した組を生成し、当該組の素性の集合と評価解候補との組の場合に前記正例になる確率および前記負例になる確率を前記学習結果データにもとづいて推定し、当該組の素性の集合と評価解候補との組に前記推定した正例になる確率および負例になる確率を推定解として付与して要約候補-推定解対を生成する処理過程と、
前記要約選択処理手段が、前記要約候補-推定解対から、前記評価解候補が前記良い評価かつ前記推定解の前記正例になる確率が最高の要約候補-推定解対を選択し、当該要約候補-推定解対の要約候補を要約とする処理過程とを備える
ことを特徴とする自動要約処理方法。

【請求項10】
テキスト記憶手段とテキスト表示処理手段と要約編集処理手段と評価カスタマイズ処理手段と解データ記憶手段と素性-解対・素性-解候補対抽出処理手段と機械学習処理手段と学習結果データ記憶手段と要約候補生成処理手段と要約候補-推定解対生成処理手段と要約選択処理手段とを備えるコンピュータが、文書データであるテキストを機械学習法を用いて自動要約する自動要約処理方法であって、
前記テキスト表示処理手段が、テキストを記憶する前記テキスト記憶手段にアクセスしてテキストを取得し、前記テキストを表示装置に表示する処理過程と、
前記要約編集処理手段が、前記テキストからユーザによって指定された範囲の文データを抽出し、前記テキストのユーザ指定要約とする処理過程と、
前記評価カスタマイズ処理手段が、前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し、さらに、前記テキストおよび前記ユーザ指定要約を問題とし前記ユーザによって良い要約として指定された要約であることを示すユーザ設定良評価を解とする解データを生成し、前記テキストおよび前記要約候補のうち前記ユーザ指定要約以外の部分からなる要約候補を問題とし前記ユーザ指定要約ではないことを示すユーザ設定悪評価を解とする解データを生成し、前記ユーザ設定良評価を解とする解データと前記ユーザ設定悪評価を解とする解データとを解データ記憶手段に記憶する処理過程と、
前記素性-解対・素性-解候補対抽出処理手段が、予め用意された評価であって少なくとも前記ユーザ設定良評価および前記ユーザ設定悪評価を含む複数の評価から、前記解となった評価以外の評価を解候補とし、前記解データの問題から素性を抽出し、前記問題から抽出された複数の素性で構成される素性の集合と前記解との組を素性-解対とし、前記素性の集合と前記解候補各々との組を素性-解候補対とし、前記素性-解対を正例とし、前記素性-解候補対を負例とする処理過程と、
前記機械学習処理手段が、決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれかの1つの機械学習アルゴリズムを用いて、前記素性-解対および前記素性-解候補対各々について、前記素性の集合と解もしくは解候補との組の場合に前記正例になる確率および前記負例になる確率を機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する処理過程と、
前記要約候補生成処理手段が、要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する処理過程と、
前記要約候補-推定解対生成処理手段が、前記入力テキストと前記要約候補各々との組を生成し、前記各組から素性を抽出し、前記組から抽出された複数の素性で構成される素性の集合に前記複数の評価各々を評価解候補として付与した組を生成し、当該組の場合に前記正例になる確率および前記負例になる確率を前記学習結果データにもとづいて推定し、当該組の集合と評価解候補との組に前記推定した正例になる確率および負例になる確率を推定解として付与して要約候補-推定解対を生成する処理過程と、
前記要約選択処理手段が、前記要約候補-推定解対から、前記評価解候補が前記ユーザ設定良評価かつ前記推定解の前記正例になる確率が最高の要約候補-推定解対を選択し、当該選択された要約候補-推定解対の要約候補を要約とする処理過程とを備える
ことを特徴とする自動要約処理方法。

【請求項11】
テキスト記憶手段とテキスト表示処理手段と要約編集処理手段と評価カスタマイズ処理手段と解データ記憶手段と素性-解対・素性-解候補対抽出処理手段と機械学習処理手段と学習結果データ記憶手段と要約候補生成処理手段と要約候補-推定解対生成処理手段と要約選択処理手段とを備えるコンピュータが、文書データであるテキストを機械学習法を用いて自動要約する自動要約処理方法であって、
前記テキスト表示処理手段が、テキストを記憶する前記テキスト記憶手段にアクセスしてテキストを取得し、前記テキストを表示装置に表示する処理過程と、
前記要約編集処理手段が、前記テキストからユーザによって指定された範囲の文データを抽出して前記テキストのユーザ指定要約とする処理過程と、
前記評価カスタマイズ処理手段が、前記テキストを問題とし前記ユーザ指定要約を解とする解データを生成し、前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し、前記要約候補のうち前記ユーザ指定要約以外の部分からなる要約候補を解候補とし、前記テキストを問題とし前記解候補を解とする解データを作成し、前記ユーザ指定要約を解とする解データと前記解候補を解とする解データとを解データ記憶手段に記憶する処理過程と、
前記素性-解対・素性-解候補対抽出処理手段が、前記解データ記憶手段から前記解データを取り出し、前記解データの問題から素性を抽出し、当該問題から抽出された複数の素性で構成される素性の集合と前記解とを素性-解対とし、当該問題の素性の集合と前記解候補との組を素性-解候補対とし、前記素性-解対を正例とし、前記素性-解候補対を負例とする処理過程と、
前記機械学習処理手段が、決定リスト法、シンプルベイズ法、最大エントロピー法、またはサポートベクトルマシン法のいずれか1つの機械学習アルゴリズムを用いて、前記素性-解対および前記素性-解候補対各々について、前記素性の集合と解もしくは解候補との組の場合に前記正例になる確率および前記負例になる確率を機械学習処理し、当該機械学習処理の処理結果を学習結果データとして学習結果データ記憶手段に記憶する処理過程と、
前記要約候補生成処理手段が、要約対象のテキストを入力し、前記入力テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理、前記入力テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理、または前記入力テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記入力テキストの要約候補を生成する処理過程と、
前記要約候補-推定解対生成処理手段が、前記入力テキストから生成された要約候補を要約解候補とし、前記入力テキストから素性を抽出し、当該入力テキストから抽出された複数の素性で構成される素性の集合と前記要約候補各々との組を生成し、当該素性の集合と前記要約解候補との組の場合に前記正例になる確率および前記負例になる確率を前記学習結果データにもとづいて推定し、当該素性の集合と要約候補の組に前記推定した正例になる確率および負例になる確率を推定解として付与して要約候補-推定解対を生成する処理過程と、
前記要約選択処理手段が、前記要約候補-推定解対から、前記推定解の前記正例になる確率が最高の要約候補-推定解対を選択し、当該要約候補-推定解対の要約候補を要約とする処理過程とを備える
ことを特徴とする自動要約処理方法。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2004168944thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close