Top > Search of Japanese Patents > DOCUMENT CREATION SUPPORT PROCESSING PROGRAM UTILIZING PARAPHRASE, RECORDING MEDIUM FOR THIS PROGRAM, AND DOCUMENT CREATION SUPPORT PROCESSING METHOD

DOCUMENT CREATION SUPPORT PROCESSING PROGRAM UTILIZING PARAPHRASE, RECORDING MEDIUM FOR THIS PROGRAM, AND DOCUMENT CREATION SUPPORT PROCESSING METHOD commons

Patent code P140010736
File No. 03-26
Posted date Jul 7, 2014
Application number P2003-186859
Publication number P2005-025257A
Patent number P3855058
Date of filing Jun 30, 2003
Date of publication of application Jan 27, 2005
Date of registration Sep 22, 2006
Inventor
  • (In Japanese)竹内 和広
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title DOCUMENT CREATION SUPPORT PROCESSING PROGRAM UTILIZING PARAPHRASE, RECORDING MEDIUM FOR THIS PROGRAM, AND DOCUMENT CREATION SUPPORT PROCESSING METHOD commons
Abstract PROBLEM TO BE SOLVED: To provide a processing program that supports document creation by means of sentence paraphrasing.
SOLUTION: An input/output processing means 11 acquires a sentence 2 to be operated from the original sentence data. A sentence analysis processing means 12 analyzes the internal structure and meaning of the sentence 2 using an indeclinable word dictionary 21 and a declinable word dictionary 22, and determines the propositional type or the inter-propositional type of the sentence 2 by referring to a proposition dictionary 23 and a propositional juncture dictionary 24. A paraphrase processing means 13 paraphrases the sentence 2 by referring to a paraphrase dictionary 25 and creates a group of paraphrases. A context matching processing means 14 performs the processing of matching the context of model sentence data in a template dictionary 26 with the context of case sentence data resulting from the paraphrasing of a predetermined range of document data including the sentence 2 with the group of paraphrases, and outputs a similar paraphrase as a paraphrase candidate.
Outline of related art and contending technology (In Japanese)



言い換えとは、ある自然言語で記述された文を別の表現による文に変換する処理であって、文の中核的な意味を保持したままで、文の長さ・文体・表現などを変換するものをいう。





言い換えは、概ね、構文的言い換え、意味的言い換え、およびプラグマティックな言い換えに分類することができる(非特許文献1参照)。





構文的言い換えは、文に表れる語句を同義語や類義語に置き換えて文の表現を変える処理、文構造のマッピングにもとづいて文を変形する処理などをいう。例えば、元の表現「システムを生成する」の<生成する>を<作る>に置き換えて、新たな表現「システムを作る」に変形する処理である。





意味的言い換えは、参照表現などをその指示内容に置き換えて文の表現を変える処理のように、その文が発話された文脈や状況などを参照して文を変形する処理をいう。例えば、元の表現「去年の出来事」が1999年に発話されていた場合に、<去年>が<1998年>を意味すると解析して、新たな表現「1998年の出来事」に変形する処理である。





プラグマティックな言い換えとは、前記の二種類の言い換え以外のより複雑な言い換えを行う処理であって、ある状況において同じ効果を持つような表現へ変形する処理をいう。例えば、元の表現「どなたかgccのソースの在りかをご存じないでしょうか」において、<どなたか-ご存じないでしょうか。>、<gccのソースの在り処を>などの意味解析から、この表現が、物の所在場所を問い合わせる文脈であると解析し、新たな表現「gccのソースが置いてあるftpサイトを教えてください」に変形するものである。





ここで、コンピュータやワープロで実行される文章作成処理ソフトウェアの文章編集機能を利用して文の言い換えを行う例として、以下のような2つの文の順序を入れ替える作業を想定する。





「太郎は公園を散歩しなかった。なぜなら、雨が降っていたからだ。」

ユーザは、先ずカット・アンド・ペースト操作により、前文「太郎は公園を散歩しなかった。」を後文「なぜなら、雨が降っていたからだ。」の後尾に移動させる。2つの文は以下のようになる。





「なぜなら、雨が降っていたからだ。太郎は公園を散歩しなかった。」

しかし、並び替え後の2つの文の表現は、自然言語(ここでは、日本語)としては不自然であり、文の表現を変える必要がある。そこで、ユーザは、不要な文字や語句の削除、必要な文字や語句の挿入などを、文字キーの操作(以下、キータイプという)によって行う。キータイプ後、2つの文は以下のようになる。





「<>雨が降って<いた>。<だから、>太郎は公園を散歩しなかった。」(<>は、キータイプによる変更部分)

さらに、並び替えた2つの文を1つの文に結合する言い換えを想定する。ユーザは、同様に、語句の削除・挿入をキータイプによって行う。キータイプ後、2つの文は以下のようになる。





「雨が降っていた<から、>太郎は公園を散歩しなかった。」

以上のように、文の並び替え、結合などによる文の言い換えでは、文の表現が自然なものとなるように、語句の削除や挿入などのキータイプが必要となる場合が多い。





【非特許文献1】

乾 健太郎、”言語表現を言い換える技術”、

言語処理学会第8回年次大会チュートリアル予稿集、言語処理学会、

2002年3月、pp.1-21

Field of industrial application (In Japanese)



本発明は、コンピュータを用いた自然言語処理技術に関する。より詳しくは、ある自然言語で記述された文を別の表現による文に変換する言い換えを利用して文章作成を支援する、言い換えを利用した文章作成支援処理装置および方法に関する。

Scope of claims (In Japanese)
【請求項1】
 
ある自然言語で記述された文データを別の表現による文データに変換する言い換え処理を利用した文章作成支援処理装置であって、
文データが記述する行為もしくは状態を定義する命題タイプが記述された命題辞書、または、前記命題辞書および文中の手がかり表現と文同士の対応関係を示す命題間タイプとの関係が記述された命題連接辞書との組のいずれかの辞書データを記憶する命題辞書記憶手段と、
係り受け関係もしくは手がかり表現にもとづく言い換えパターンを記述した言い換え辞書を記憶する言い換え辞書記憶手段と、
良い文章構造であると認定された文章データであって、前記命題タイプが付与された模範文章データを記憶するテンプレート辞書を記憶するテンプレート辞書記憶手段と、
ユーザに対して表示された文章データから、ユーザの操作によって特定された言い換え操作の対象とする操作対象部分、および言い換え操作の種別を示す文操作情報を取得する入力処理手段と、
前記操作対象部分の内部構造および意味を解析し、前記命題辞書記憶手段に記憶された前記命題辞書を参照して、前記解析結果から前記操作対象部分の命題タイプを同定する文解析処理手段と、
前記文操作情報に従って、前記言い換え辞書記憶手段に記憶された言い換え辞書の前記言い換えパターンを参照して前記操作対象部分の言い換えを行い、言い換え群を生成する言い換え処理手段と、
前記テンプレート辞書記憶手段に記憶された前記テンプレート辞書から前記操作対象部分の命題タイプを含む模範文章データを抽出し、前記模範文章データの文脈と前記操作対象部分を含む所定の範囲の文章データであって前記言い換え群から取り出した言い換えにより言い換えた事例文章データの文脈とを比較して、前記模範文章データの文章構造と前記事例文章データの文章構造との類似を評価し、所定の評価を得た言い換えを言い換え候補として出力する文脈マッチング処理手段とを備える
言い換えを利用した文章作成支援処理装置。

【請求項2】
 
前記入力処理手段は、前記操作対象部分および前記文操作情報を取得する場合に、前記ユーザに対して表示された文章データの任意の節もしくは文、または所定の選択項目を、入力ポインティング機能を用いて選択することにより行う
ことを特徴とする請求項1に記載の言い換えを利用した文章作成支援処理装置。

【請求項3】
 
前記命題辞書記憶手段は、前記命題辞書とともに、文中の手がかり表現と文同士の対応関係を示す命題間タイプとの関係が記述された命題連接辞書を記憶し、
前記テンプレート辞書記憶手段は、前記命題タイプが付与された模範文章データを記憶し、
前記文解析処理手段は、前記命題辞書記憶手段に記憶された前記命題辞書および前記命題連接辞書を参照して、前記解析結果から前記操作対象部分の命題タイプおよび命題間タイプを同定する
ことを特徴とする請求項1または請求項2のいずれか一項に記載の言い換えを利用した文章作成支援処理装置。

【請求項4】
 
ある自然言語で記述された文データを別の表現による文データに変換する言い換え処理を利用した文章作成支援処理を行うために、文データが記述する行為もしくは状態を定義する命題タイプが記述された命題辞書を記憶する命題辞書記憶手段と、係り受け関係もしくは手がかり表現にもとづく言い換えパターンを記述した言い換え辞書を記憶する言い換え辞書記憶手段と、良い文章構造であると認定された文章データであって、前記命題タイプが付与された模範文章データを記憶するテンプレート辞書を記憶するテンプレート辞書記憶手段と、入力処理手段と、文解析処理手段と、言い換え処理手段と、文脈マッチング処理手段とを備えたコンピュータが行う処理方法であって、
前記入力処理手段が、ユーザに対して表示された文章データから、ユーザの操作によって特定された言い換え操作の対象とする操作対象部分、および言い換え操作の種別を示す文操作情報を取得し、
前記文解析処理手段が、前記操作対象部分の内部構造および意味を解析し、前記命題辞書記憶手段に記憶された前記命題辞書を参照して、前記解析結果から前記操作対象部分の命題タイプを同定し、
前記言い換え処理手段が、前記文操作情報に従って、前記言い換え辞書記憶手段に記憶された言い換え辞書の前記言い換えパターンを参照して前記操作対象部分の言い換えを行い、言い換え群を生成し、
前記文脈マッチング処理手段が、前記テンプレート辞書記憶手段に記憶された前記テンプレート辞書から前記操作対象部分の命題タイプを含む模範文章データを抽出し、前記模範文章データの文脈と前記操作対象部分を含む所定の範囲の文章データであって前記言い換え群から取り出した言い換えにより言い換えた事例文章データの文脈とを比較して、前記模範文章データの文章構造と前記事例文章データの文章構造との類似を評価し、所定の評価を得た言い換えを言い換え候補として出力する
言い換えを利用した文章作成支援処理方法。

【請求項5】
 
前記入力処理手段が、前記操作対象部分および前記文操作情報を取得する処理において、前記ユーザに対して表示された文章データの任意の節もしくは文、または所定の選択項目を、入力ポインティング機能を用いて選択することにより行う
ことを特徴とする請求項4に記載の言い換えを利用した文章作成支援処理方法。

【請求項6】
 
前記命題辞書記憶手段に、前記命題辞書とともに、文中の手がかり表現と文同士の対応関係を示す命題間タイプとの関係が記述された命題連接辞書が記憶され、
前記テンプレート辞書記憶手段に、前記命題タイプが付与された模範文章データが記憶される場合に、
前記文解析処理手段が、前記解析結果から前記操作対象部分の命題タイプを同定する処理において、前記命題辞書記憶手段に記憶された前記命題辞書および前記命題連接辞書を参照して、前記解析結果から前記操作対象部分の命題タイプおよび命題間タイプを同定する
ことを特徴とする請求項4または請求項5のいずれか一項に記載の言い換えを利用した文章作成支援処理方法。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2003186859thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close