TOP > 国内特許検索 > テキスト生成方法及びテキスト生成装置

テキスト生成方法及びテキスト生成装置 コモンズ

国内特許コード P140010707
整理番号 01-134
掲載日 2014年7月3日
出願番号 特願2001-395618
公開番号 特開2003-196280
登録番号 特許第3921523号
出願日 平成13年12月27日(2001.12.27)
公開日 平成15年7月11日(2003.7.11)
登録日 平成19年3月2日(2007.3.2)
発明者
  • 内元 清貴
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 テキスト生成方法及びテキスト生成装置 コモンズ
発明の概要 【課題】 1つ以上のキーワードを基に、そのキーワードから自然なテキストを生成する生成方法・生成装置を提供すること。
【解決手段】 キーワード2をキーワード入力部1から入力し、キーワード2を1つでも含むテキストや語句をデータベース13からテキスト語句検索抽出部11で抽出する。テキスト生成部12では抽出されたテキストなどを形態素解析・構文解析し、テキストなどにキーワード2を組み合わせることで自然なテキスト3を出力する。
従来技術、競合技術の概要



近年、コンピュータによって言語のテキストを解析する技術、或いは生成する技術の開発が進んでいる。特にテキストの生成においては、いかに自然なテキストを生成できるかが、課題となっており、人間が生成したものと遜色のない生成方法の提供が求められている。

例えば、いくつかのキーワードを入力したときに、それらのキーワードを用いて自然なテキストを生成する技術は、外国人など、文章作成の苦手な者への作成支援を行うことに寄与する。

また、単語を列挙することで相手への意思を伝達できるため、機械翻訳に近い使い方も可能である。





例えば、失語症患者の文生成支援では、現在、日本全国でおよそ10万人程度の失語症患者がおり、その8割程度の人はとぎれとぎれの文(単語の列)を発声できる、あるいは単語の候補を提示してあげると言いたいことを表現するためにその中からいくつか単語を選択することができると言われている。

そこで、例えば「彼女 公園 行った」などを発声あるいは選択し、そこから自然な文「彼女が公園へ行った」、「彼女と公園へ行った」などを生成して提示することによって、患者のコミュニケーションを支援する。





このように、1つ以上のキーワードを入力して、自然なテキストを生成する従来の技術として、テンプレートをもとに文を生成する技術や、キーワードをもとにデータベースから文を検索する技術はすでに存在する。

しかし、これらの技術ではテンプレートに合致する場合のみ、あるいはデータベース中に含まれる文と合致する場合のみにしか有効でなく、いずれも限られた型の文しか生成できない。

また、検索の際、適合しやすくなるようにキーワードを類義語などに置き換える技術も提案されているが、キーワードから生成されるべき文のバリエーションは多岐に亙るため、十分であるとはいえない。

産業上の利用分野



本発明は自然言語処理方法及び装置に関する。特に、いくつかのキーワードからテキストを生成する手法に特徴を有する。

特許請求の範囲 【請求項1】
文又は文章のテキストを生成するテキスト生成方法であって、
入力手段により1個以上のキーワードとなる単語を入力する入力ステップ、
抽出手段により該キーワードに係るテキストを、データベースから抽出する抽出ステップ、
解析手段と係り受け構造形成手段とを含むテキスト生成手段により、抽出されたテキストを各テキストに含まれる部分的な係り受け関係から組み合わせ、入力したキーワードを用いたテキストを生成するテキスト生成ステップを有し、
該テキスト生成ステップにおいて、
解析手段が、抽出されたテキストを形態素解析及び構文解析して該テキストの係り受け構造を得ると共に、
係り受け構造形成手段が、該係り受け構造におけるキーワードを含む少なくとも1個のノードと、それ以外のノードとの部分的な係り受け関係を複数抽出し、部分的な係り受け関係を組み合わせることでキーワードを含む1文全体の係り受け構造を形成してテキストを生成する
ことを特徴とするテキスト生成方法。

【請求項2】
前記テキスト生成ステップにおいて、
前記キーワードを含む係り受け構造を形成する過程で、
係り受け構造形成手段により係り受けモデルを用いてテキスト全体の係り受け確率を求め、
テキスト生成手段により該確率が最大となるテキストを生成する
請求項1に記載のテキスト生成方法。

【請求項3】
前記テキスト生成ステップにおいて、
係り受け構造を形成する過程あるいは形成した後で、
テキスト生成手段により語順モデルを用いてテキスト全体の正しい文の並びである確率を求め、該確率が最大となるテキストを生成する
請求項1又は2に記載のテキスト生成方法。

【請求項4】
前記テキスト生成ステップにおいて、
単語補完手段により、
前記キーワードの全ての配列について、任意の2つのキーワード間に補完すべき単語があるか否かを学習モデルを用いて判定し、
学習モデルにおいて補完すべき確率の高い単語から順に補完するとき、
該補完する単語をキーワードに編入し、又は編入せずに、
いずれのキーワード間についても補完すべき単語がない確率が最も高くなるまで繰り返す
単語補完処理を行う請求項1ないし3に記載のテキスト生成方法。

【請求項5】
前記データベースに、特徴的なテキストパターンを有するテキストを備える構成において、
テキスト生成手段により、
該特徴的なテキストパターンに準拠したテキストを生成する
請求項1ないし4に記載のテキスト生成方法。

【請求項6】
文又は文章のテキストを生成するテキスト生成装置において、
1個以上のキーワードとなる単語を入力する入力手段、
複数のテキストから構成されるテキストデータベース、
該キーワードに係るテキストを、該テキストデータベースから検索し、抽出する抽出手段、
抽出されたテキストを各テキストに含まれる部分的な係り受け関係から組み合わせ、入力したキーワードを用いたテキストを生成するテキスト生成手段
を備え、
該テキスト生成手段が、
抽出されたテキストを形態素解析及び構文解析して該テキストの係り受け構造を得る解析手段と、
該係り受け構造におけるキーワードを含む少なくとも1個のノードと、それ以外のノードとの部分的な係り受け関係を複数抽出し、部分的な係り受け関係を組み合わせることでキーワードを含む1文全体の係り受け構造を形成する係り受け構造形成手段と
を含むことを特徴とするテキスト生成装置。

【請求項7】
前記テキスト生成手段において、
前記係り受け構造形成手段が、係り受けモデルを用いてテキスト全体の係り受け確率を求め、
該確率が最大となるテキストとして生成する
請求項6に記載のテキスト生成装置。

【請求項8】
前記テキスト生成手段において、
係り受け構造を形成する過程あるいは形成した後で、
語順モデルを用いてテキスト全体の正しい文の並びである確率を求め、該確率が最大となるテキストを生成する
請求項6又は7に記載のテキスト生成装置。

【請求項9】
前記テキスト生成手段において、
前記キーワードの全ての配列について、任意の2つのキーワード間に補完すべき単語があるか否かを学習モデルを用いて判定し、
学習モデルにおいて補完すべき確率の高い単語から順に補完するとき、
該補完する単語をキーワードに編入し、又は編入せずに、
いずれのキーワード間についても補完すべき単語がない確率が最も高くなるまで繰り返す
単語補完手段を含む請求項6ないし8に記載のテキスト生成装置。

【請求項10】
前記データベースに、特徴的なテキストパターンを有するテキストを備える構成において、
前記テキスト生成手段が、
該特徴的なテキストパターンに準拠したテキストを生成する
請求項6ないし9に記載のテキスト生成装置。

【請求項11】
前記テキスト生成装置において、
特徴的な複数のテキストパターンを有するテキストを備えるデータベースを1つないし複数を備える一方、
該複数のテキストパターンから所望のテキストパターンを選択するパターン選択手段を備えた
請求項10に記載のテキスト生成装置。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001395618thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close