Top > Search of Japanese Patents > TEXT GENERATION METHOD AND TEXT GENERATION DEVICE

TEXT GENERATION METHOD AND TEXT GENERATION DEVICE commons

Patent code P140010709
File No. 02-05
Posted date Jul 3, 2014
Application number P2002-074270
Publication number P2003-271592A
Patent number P4085156
Date of filing Mar 18, 2002
Date of publication of application Sep 26, 2003
Date of registration Feb 29, 2008
Inventor
  • (In Japanese)内元 清貴
  • (In Japanese)関根 聡
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title TEXT GENERATION METHOD AND TEXT GENERATION DEVICE commons
Abstract PROBLEM TO BE SOLVED: To provide a text generation method and a text generation device for generating a significant text even with insufficient keywords to be inputted.
SOLUTION: A keyword 2 is inputted to the text generation device 1. A segment generation rule 9 is acquired from a corpus 8 in a segment generation rule acquisition part 4, and segment candidates are generated from the keyword 2 in a segment candidate generation part 5. A modification relation is temporarily set to the segment candidates to generate text candidates in a text candidate generation part 6. The text candidates are evaluated in an evaluation part 7, and a text 3 is outputted according to the evaluation.
Outline of related art and contending technology (In Japanese)

テキスト生成は機械翻訳、要約、対話システムなど自然言語処理の様々な応用に利用される重要な要素技術の一つである。近年、大量のコーパスが利用可能となり、自然な表層文を生成する目的にもコーパスが利用されるようになってきた。その典型例の一つが原言語から目的言語への機械翻訳に用いられる言語モデルである。

例えば、本件出願人らが特願2001-395618号で開示したテキスト生成のシステムでは、置き換えた単語や句を目的言語側で尤もらしい順序に並び替え、目的言語を生成する。言語モデルの入力は、一般に語の集合であり、言語モデルに要求されるのは、基本的にそれらの語の並べ換えである。

このような従来のシステムでは、与えられた語の集合を並べ換えると自然な文を生成できるという仮定がある。つまり、自然な文を生成するための語の集合は翻訳モデルにより過不足なく生成されることが前提となっている。

しかし、この前提のためには大規模な対訳コーパスが必要であり、日本語などの比較的コーパスが整備された言語が原言語であっても、対象言語との対訳コーパスの状況、対象言語におけるコーパスの状況によっては、上記従来の手法では十分なテキスト生成が行えない場合があった。

また、上記開示でもある程度の語句の補完は行うが、補助的な補完を行うのみで、効率的に関連する語句を補完することはできなかった。

この問題は機械翻訳に限らず、一般的にテキスト生成において生じる問題であり、原言語テキストが完全なものでなく、誤りのあるOCR 認識結果や音声認識結果などの場合には同様に高精度なテキスト生成ができない問題があった。

Field of industrial application (In Japanese)

本発明は自然言語処理の方法及び装置に関する。特に、いくつかのキーワードからテキストを生成する手法に関わる。

Scope of claims (In Japanese)
【請求項1】
 
所定の言語の文又は文章のテキストを生成するテキスト生成装置であって、
複数のキーワードとなる単語を入力する入力手段と、
キーワードから文節や句の候補(以下、文節等候補と呼ぶ。)を生成する文節等候補生成手段と、
係り受けの方向についての修飾条件、係り受け関係が交差するか否かについての交差条件、及び、係り受け要素に対する受け要素の個数についての対応条件からなる3つの係り受け条件に従った係り受け関係を仮定してテキスト候補を生成するテキスト候補生成手段と、
該テキスト候補を評価付けする評価手段と、
評価付けされた少なくとも1つのテキスト候補を出力する出力手段と共に、
入力手段で入力されたキーワードを含む文・語句を、データベースから抽出する抽出手段と、
抽出された文・語句を形態素解析及び/又は構文解析を行い、該キーワードを含む主辞形態素及び、それに連続する任意の数の形態素とから成る形態素集合を抽出し、該キーワードと該形態素集合との対応を文節等候補の生成規則として自動獲得する生成規則獲得手段と
を少なくとも備え、
文節等候補生成手段においては、少なくとも1つの該キーワードの前又は後に、該キーワードに関連した文字列を付加して文節等候補を生成し、他の全ての該キーワードについても同様に文字列を付加し、或いは付加せずに文節等候補を生成する処理か、又はキーワードから該生成規則を用いて文節等候補を生成する処理かのいずれかの処理を行い、
テキスト候補生成手段においては、該文節等候補から係り要素と受け要素の組合せを生成して該組合せ数に相当するテキスト候補を生成する
ことを特徴とするテキスト生成装置。

【請求項2】
 
前記入力手段において、
入力された単語と係り受け関係を有する単語を当該言語のデータベースから抽出し、その単語を新たなキーワードとして入力する
請求項1に記載のテキスト生成装置。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2002074270thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close