TOP > 国内特許検索 > 解データ編集処理装置および処理方法

解データ編集処理装置および処理方法 コモンズ 外国出願あり

国内特許コード P140010558
整理番号 06-30
掲載日 2014年5月21日
出願番号 特願2006-222723
公開番号 特開2006-318509
登録番号 特許第4106470号
出願日 平成18年8月17日(2006.8.17)
公開日 平成18年11月24日(2006.11.24)
登録日 平成20年4月11日(2008.4.11)
発明者
  • 村田 真樹
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 解データ編集処理装置および処理方法 コモンズ 外国出願あり
発明の概要 【課題】 機械学習法による要約処理で用いる解データをユーザが自由に編集できる編集処理と前記解データを用いてユーザに特化した要約処理とを実現する。
【解決手段】 評価カスタマイズ手段110は,テキスト・要約4からユーザが指定した範囲の文データを抽出してユーザ指定要約とし,複数の要約性質ごとの評価の入力項目を表示し,ユーザ指定要約についてユーザの評価入力を受け付け,所定規則または機械学習法による自動要約生成処理によりテキストの要約を生成する。そして,テキストとユーザ指定要約で構成される問題に対してユーザ入力評価である解を付与したデータと,テキストとユーザ指定要約以外の部分で構成される問題に対してユーザ指定要約ではないことを示す悪い評価である解を付与したデータとを含む解データを生成して解データ記憶部120に出力する。
【選択図】 図1
従来技術、競合技術の概要


近年,情報技術の発展に伴ってコンピュータを用いた文章の自動要約処理が盛んになってきている。しかし,個人的な嗜好や要約結果の用途などにより,所望する要約結果の傾向に相違があると考えられる。



例えば,以下の非特許文献1では,複数の者がそれぞれ重要文抽出による要約を行なった結果に対する相互評価の尺度として再現率と適合率とを求めて表4に示している。非特許文献1の表4から明らかなように,20文を抽出する処理の場合に,人-人(評価者相互)の評価(再現率および適合率)は,各評価者A,B,Cの一致度は50~70%であってあまり高い値とはいえず,要約結果に対する評価に個人差が存在することが推定できる。



また,以下の非特許文献2では,サポート・ベクトル・マシン(Support Vector Machine)による重要文抽出処理において,処理セットA,B,Cについて交差検定の精度が最もよいことを表4により示している。非特許文献2の表4に示された交差検定は,同一評価者による処理と同一視でき,セットA,B,Cを作成した者が同一かどうかは不明であるが,少なくとも同一時期もしくは同一人物により学習データを作成したほうが精度が良いということがわかる。
【非特許文献1】
伊藤山彦他,「講演文を対象にした重要文抽出」,言語処理学会第7回年次大会発表論文集,言語処理学会,2001年,pp.305-308
【非特許文献2】
平尾勉他,「Support Vector Machineによる重要文抽出」,情報学会基礎論文63-16 ,情報学会,2001年,pp.121-127

産業上の利用分野



本発明は,機械学習法により文章を自動要約する処理において,編集可能な解データの編集処理および解データを用いる機械学習法を用いた自動要約処理に関する。

特許請求の範囲 【請求項1】
文書データであるテキストを機械学習法により自動要約する処理で用いる解データを編集する解データ編集処理装置であって,
文書データであるテキストを記憶するテキスト記憶手段と,
前記テキスト記憶手段から取得したテキストを表示装置に表示し,前記テキストからユーザによって指定された範囲の文データを抽出して前記テキストのユーザ指定要約として表示する要約表示手段と,
要約の評価として使用される要約の特徴を示す情報であって,要約として短い文を重視しているかどうかを示す短文重視の性質,数量についての表現が要約に含まれていることを重視しているかどうかを示す数量表現重視の性質,要約に手法についての表現が含まれていることを重視しているかどうかを示す手法重視の性質,要約の文体を重視しているかどうかを示す文体重視の性質,または要約が読みやすいかどうかを重視していることを示す読みやすさ重視の性質のいずれか2つ以上の性質を含む複数の性質について,当該性質各々に対する評価値を入力する項目を表示し,前記ユーザ指定要約に対する前記性質各々のユーザの評価値の入力を受け付ける評価付与手段と,
問題および解で構成される解データを記憶する解データ記憶手段と,
前記テキストおよび前記ユーザ指定要約を問題とし,当該問題に前記ユーザが入力した評価値を解として付与して解データを生成し,前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理,前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理,または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し,前記テキストおよび前記要約候補であって前記ユーザ指定要約以外の部分からなる要約候補を問題とし,当該問題に当該要約候補が前記ユーザ指定要約ではないことを示す悪評価を解として付与して解データを生成し,前記ユーザによって入力された評価値を解とする解データおよび前記悪評価を解とする解データを前記解データ記憶手段に出力する評価カスタマイズ手段とを備える
ことを特徴とする解データ編集処理装置。

【請求項2】
請求項1に記載の解データ編集処理装置において,
前記評価カスタマイズ手段は,前記ユーザによって指定された前記テキストの部分の語句の変更の入力を受け付け,当該変更された部分を前記ユーザ指定要約とする要約編集手段を備える
ことを特徴とする解データ編集処理装置。

【請求項3】
請求項1に記載の解データ編集処理装置において,
前記評価カスタマイズ手段は,前記要約生成処理によって生成された要約候補であって前記ユーザ指定要約以外の部分からなる要約候補に対する前記性質各々の評価値を入力する項目を表示し,前記項目各々のユーザの評価値の入力を受け付け,前記テキストおよび前記表示された要約候補である問題に当該入力された評価値の組合せを解として付与して前記解データを生成する
ことを特徴とする解データ編集処理装置。

【請求項4】
テキスト記憶手段,要約表示手段,評価付与手段,評価カスタマイズ手段,および解データ記憶手段を備えるコンピュータが,文書データであるテキストを機械学習法により自動要約する処理で用いる解データを編集する解データ編集処理方法であって,
前記要約表示手段が,文書データであるテキストを記憶する前記テキスト記憶手段にアクセスしてテキストを取得し,前記テキストを表示装置に表示し,前記テキストからユーザによって指定された範囲の文データを抽出して前記テキストのユーザ指定要約として表示する処理過程と,
前記評価付与手段が,要約の評価として使用される要約の特徴を示す情報であって,要約として短い文を重視しているかどうかを示す短文重視の性質,数量についての表現が要約に含まれていることを重視しているかどうかを示す数量表現重視の性質,要約に手法についての表現が含まれていることを重視しているかどうかを示す手法重視の性質,要約の文体を重視しているかどうかを示す文体重視の性質,または要約が読みやすいかどうかを重視していることを示す読みやすさ重視の性質のいずれか2つ以上の性質を含む複数の性質について,当該性質各々に対する評価値を入力する項目を表示し,前記ユーザ指定要約に対する前記性質各々のユーザの評価値の入力を受け付ける処理過程と,
前記評価カスタマイズ手段が,前記テキストおよび前記ユーザ指定要約を問題とし,当該問題に前記ユーザが入力した評価値を解として付与して解データを生成し,前記テキストから文を取り出しあらゆる文の選択の状態を要約候補とする重要文選択処理,前記テキストから文節を取り出しあらゆる文節の選択の状態を要約候補とする重要箇所選択処理,または前記テキストの文を予め定めた変形規則に従って変形し当該変形した状態を要約候補とする変形処理のいずれか1つの処理を行って前記テキストの要約候補を生成し,前記テキストおよび前記要約候補であって前記ユーザ指定要約以外の部分からなる要約候補を問題とし,当該問題に当該要約候補が前記ユーザ指定要約ではないことを示す悪評価を解として付与して解データを生成し,前記ユーザによって入力された評価値を解とする解データおよび前記悪評価を解とする解データを前記解データ記憶手段に出力する処理過程とを備える
ことを特徴とする解データ編集処理方法。

【請求項5】
請求項4に記載の解データ編集処理方法において,
前記コンピュータは,要約編集手段を備え,
前記評価カスタマイズ手段が実行する処理過程では,前記要約編集手段が,前記ユーザによって指定された前記テキストの部分の語句の変更の入力を受け付け,当該変更された部分を前記ユーザ指定要約とする処理を行う
ことを特徴とする解データ編集処理方法。

【請求項6】
請求項4に記載の解データ編集処理方法において,
前記評価カスタマイズ手段が実行する処理過程では,前記要約生成処理によって生成された要約候補であって前記ユーザ指定要約以外の部分からなる要約候補に対する前記性質各々の評価値を入力する項目を表示し,前記項目各々のユーザの評価値の入力を受け付け,前記テキストおよび前記表示された要約候補である問題に当該入力された評価値の組合せを解として付与して前記解データを生成する処理を行う
ことを特徴とする解データ編集処理方法。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2006222723thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close