Top > Search of Japanese Patents > TEXT GENERATING METHOD AND TEXT GENERATING DEVICE

TEXT GENERATING METHOD AND TEXT GENERATING DEVICE commons

Patent code P140010707
File No. 01-134
Posted date Jul 3, 2014
Application number P2001-395618
Publication number P2003-196280A
Patent number P3921523
Date of filing Dec 27, 2001
Date of publication of application Jul 11, 2003
Date of registration Mar 2, 2007
Inventor
  • (In Japanese)内元 清貴
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title TEXT GENERATING METHOD AND TEXT GENERATING DEVICE commons
Abstract PROBLEM TO BE SOLVED: To provide a method and device for generating a natural text from one or more key words.
SOLUTION: A key word 2 is inputted from a key word input part 1, and a text or words and phrases including at least one key word 2 are extracted from a data base 13 by a text words and phrases retrieving/extracting part 11. A text generating part 12 executes the morpheme analysis/syntax analysis of the extracted text or the like, and combines the key word 2 with the text or the like, and outputs a natural text 3.
Outline of related art and contending technology (In Japanese)

近年、コンピュータによって言語のテキストを解析する技術、或いは生成する技術の開発が進んでいる。特にテキストの生成においては、いかに自然なテキストを生成できるかが、課題となっており、人間が生成したものと遜色のない生成方法の提供が求められている。

例えば、いくつかのキーワードを入力したときに、それらのキーワードを用いて自然なテキストを生成する技術は、外国人など、文章作成の苦手な者への作成支援を行うことに寄与する。

また、単語を列挙することで相手への意思を伝達できるため、機械翻訳に近い使い方も可能である。

例えば、失語症患者の文生成支援では、現在、日本全国でおよそ10万人程度の失語症患者がおり、その8割程度の人はとぎれとぎれの文(単語の列)を発声できる、あるいは単語の候補を提示してあげると言いたいことを表現するためにその中からいくつか単語を選択することができると言われている。

そこで、例えば「彼女 公園 行った」などを発声あるいは選択し、そこから自然な文「彼女が公園へ行った」、「彼女と公園へ行った」などを生成して提示することによって、患者のコミュニケーションを支援する。

このように、1つ以上のキーワードを入力して、自然なテキストを生成する従来の技術として、テンプレートをもとに文を生成する技術や、キーワードをもとにデータベースから文を検索する技術はすでに存在する。

しかし、これらの技術ではテンプレートに合致する場合のみ、あるいはデータベース中に含まれる文と合致する場合のみにしか有効でなく、いずれも限られた型の文しか生成できない。

また、検索の際、適合しやすくなるようにキーワードを類義語などに置き換える技術も提案されているが、キーワードから生成されるべき文のバリエーションは多岐に亙るため、十分であるとはいえない。

Field of industrial application (In Japanese)

本発明は自然言語処理方法及び装置に関する。特に、いくつかのキーワードからテキストを生成する手法に特徴を有する。

Scope of claims (In Japanese)
【請求項1】
 
文又は文章のテキストを生成するテキスト生成方法であって、
入力手段により1個以上のキーワードとなる単語を入力する入力ステップ、
抽出手段により該キーワードに係るテキストを、データベースから抽出する抽出ステップ、
解析手段と係り受け構造形成手段とを含むテキスト生成手段により、抽出されたテキストを各テキストに含まれる部分的な係り受け関係から組み合わせ、入力したキーワードを用いたテキストを生成するテキスト生成ステップを有し、
該テキスト生成ステップにおいて、
解析手段が、抽出されたテキストを形態素解析及び構文解析して該テキストの係り受け構造を得ると共に、
係り受け構造形成手段が、該係り受け構造におけるキーワードを含む少なくとも1個のノードと、それ以外のノードとの部分的な係り受け関係を複数抽出し、部分的な係り受け関係を組み合わせることでキーワードを含む1文全体の係り受け構造を形成してテキストを生成する
ことを特徴とするテキスト生成方法。

【請求項2】
 
前記テキスト生成ステップにおいて、
前記キーワードを含む係り受け構造を形成する過程で、
係り受け構造形成手段により係り受けモデルを用いてテキスト全体の係り受け確率を求め、
テキスト生成手段により該確率が最大となるテキストを生成する
請求項1に記載のテキスト生成方法。

【請求項3】
 
前記テキスト生成ステップにおいて、
係り受け構造を形成する過程あるいは形成した後で、
テキスト生成手段により語順モデルを用いてテキスト全体の正しい文の並びである確率を求め、該確率が最大となるテキストを生成する
請求項1又は2に記載のテキスト生成方法。

【請求項4】
 
前記テキスト生成ステップにおいて、
単語補完手段により、
前記キーワードの全ての配列について、任意の2つのキーワード間に補完すべき単語があるか否かを学習モデルを用いて判定し、
学習モデルにおいて補完すべき確率の高い単語から順に補完するとき、
該補完する単語をキーワードに編入し、又は編入せずに、
いずれのキーワード間についても補完すべき単語がない確率が最も高くなるまで繰り返す
単語補完処理を行う請求項1ないし3に記載のテキスト生成方法。

【請求項5】
 
前記データベースに、特徴的なテキストパターンを有するテキストを備える構成において、
テキスト生成手段により、
該特徴的なテキストパターンに準拠したテキストを生成する
請求項1ないし4に記載のテキスト生成方法。

【請求項6】
 
文又は文章のテキストを生成するテキスト生成装置において、
1個以上のキーワードとなる単語を入力する入力手段、
複数のテキストから構成されるテキストデータベース、
該キーワードに係るテキストを、該テキストデータベースから検索し、抽出する抽出手段、
抽出されたテキストを各テキストに含まれる部分的な係り受け関係から組み合わせ、入力したキーワードを用いたテキストを生成するテキスト生成手段
を備え、
該テキスト生成手段が、
抽出されたテキストを形態素解析及び構文解析して該テキストの係り受け構造を得る解析手段と、
該係り受け構造におけるキーワードを含む少なくとも1個のノードと、それ以外のノードとの部分的な係り受け関係を複数抽出し、部分的な係り受け関係を組み合わせることでキーワードを含む1文全体の係り受け構造を形成する係り受け構造形成手段と
を含むことを特徴とするテキスト生成装置。

【請求項7】
 
前記テキスト生成手段において、
前記係り受け構造形成手段が、係り受けモデルを用いてテキスト全体の係り受け確率を求め、
該確率が最大となるテキストとして生成する
請求項6に記載のテキスト生成装置。

【請求項8】
 
前記テキスト生成手段において、
係り受け構造を形成する過程あるいは形成した後で、
語順モデルを用いてテキスト全体の正しい文の並びである確率を求め、該確率が最大となるテキストを生成する
請求項6又は7に記載のテキスト生成装置。

【請求項9】
 
前記テキスト生成手段において、
前記キーワードの全ての配列について、任意の2つのキーワード間に補完すべき単語があるか否かを学習モデルを用いて判定し、
学習モデルにおいて補完すべき確率の高い単語から順に補完するとき、
該補完する単語をキーワードに編入し、又は編入せずに、
いずれのキーワード間についても補完すべき単語がない確率が最も高くなるまで繰り返す
単語補完手段を含む請求項6ないし8に記載のテキスト生成装置。

【請求項10】
 
前記データベースに、特徴的なテキストパターンを有するテキストを備える構成において、
前記テキスト生成手段が、
該特徴的なテキストパターンに準拠したテキストを生成する
請求項6ないし9に記載のテキスト生成装置。

【請求項11】
 
前記テキスト生成装置において、
特徴的な複数のテキストパターンを有するテキストを備えるデータベースを1つないし複数を備える一方、
該複数のテキストパターンから所望のテキストパターンを選択するパターン選択手段を備えた
請求項10に記載のテキスト生成装置。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001395618thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close