TOP > 国内特許検索 > 言語変換処理統一システム

言語変換処理統一システム コモンズ

国内特許コード P140010696
整理番号 01-43
掲載日 2014年7月3日
出願番号 特願2001-205889
公開番号 特開2003-022264
登録番号 特許第3932350号
出願日 平成13年7月6日(2001.7.6)
公開日 平成15年1月24日(2003.1.24)
登録日 平成19年3月30日(2007.3.30)
発明者
  • 村田 真樹
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 言語変換処理統一システム コモンズ
発明の概要 【課題】 各種の言い換えを統一的に扱うことができるシステムを提供し,種々の言語変換処理システムの開発を容易に行うことができるようにする。
【解決手段】 変形処理部11は,変換対象文10を入力すると,変形規則記憶部15中の変形規則を用いて多くの変換の候補を生成する。評価処理部12は,生成された変換の候補について,文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価するための尺度である評価情報を用いて評価し,評価結果のよい表現の文字列を選択する。その評価の高い文字列を変換結果文13として出力する。変換規則および評価情報を交換または選択するだけで,質問応答,文内圧縮(要約),難解文変換(平易文生成),推敲,個人文体変換といった各種の言語変換処理に適応させたシステムを構築することができる。
従来技術、競合技術の概要



自然言語で記述された文または文章に関する表現の変換処理として典型的なものは,機械翻訳である。機械翻訳では,ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。





機械翻訳が他の国の言語に変換するのに対し,同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば,要約文を自動生成したり,文章を推敲したりするシステムである。





一般に同一自然言語間での文の変換処理では,変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し,いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し,該当するパターンがあれば,それを変換後の語・句・文などのパターンに置き換える処理を行っている。

産業上の利用分野



本発明は,ある自然言語で記述された文または文章などの文字列を,同一の自然言語で記述された他の表現による文字列に変換するシステムであって,特に,コンピュータによる自然言語処理において多種多様な言い換えを統一的に扱うことができるようにした言語変換処理統一システムに関するものである。

特許請求の範囲 【請求項1】
ある自然言語で記述された文字列を,同一の自然言語で記述された他の表現による文字列に変換するシステムにおいて,
前記自然言語の文字列に関する変換目的ごとに用意される変形の規則であって,変形対象の文字列またはそのパターンと,変形後の文字列またはそのパターンとの組の情報からなる変形規則を,文字列の変換の目的に応じて交換可能または後記の変形処理手段が選択可能な状態で記憶する変形規則記憶手段と,
文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価する所定の評価の尺度に従って評価値を算出するための評価関数または評価規則に関する変換目的ごとに用意される評価情報を,文字列の変換の目的に応じて交換可能または後記の評価処理手段が選択可能な状態で記憶する評価情報記憶手段と,
自然言語で記述された変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された複数の変形の規則を用いて変形し,複数の変換の候補を生成する,変換目的の異なる複数の変換方式に対して共通に用いることができる変形処理手段と,
前記変形処理手段によって生成された変換の候補を,前記評価情報記憶手段に記憶された評価関数または評価規則を用いて評価値を算出し,評価の最も高い表現を選択する,変換目的の異なる複数の変換方式に対して共通に用いることができる評価処理手段と,
前記変形処理手段による変形および前記評価処理手段による評価結果から,評価の最も高い文字列の変換結果を出力する出力手段とを備える
ことを特徴とする言語変換処理統一システム。

【請求項2】
前記変換対象となる文字列は,自然言語による質問文に対してデータベースを検索して回答を自然言語で応える質問応答システムにおいて当該システムが入力した質問文と,当該システムが質問文をもとにデータベースから取得した前記質問文に対する回答を含む文の候補の文字列であり,
前記変形規則は,変形対象の第1の文字列を同義の変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記変形処理手段は,前記変形規則を用いて多段に変形を繰り返すように構成され,
前記評価関数または評価規則による評価の尺度は,前記質問文または前記変形処理手段により生成された質問文の変換の候補と,前記回答を含む文の候補または前記変形処理手段により生成された回答を含む文の候補の変換の候補とに対して構文解析により算出された類似度の値の大小であり,類似度の値の大きいものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。

【請求項3】
前記文字列の変換は,入力した文字列から冗長な表現を修正して短くした文字列を生成する文内圧縮システムのための変換であり,
前記変形規則は,変形対象の第1の文字列を変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記評価関数または評価規則による評価の尺度は,変形後の文字列の長短を含み,変形後の文字列が短いものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。

【請求項4】
前記文字列の変換は,入力した文字列の表現を推敲し,より良い表現の文字列に改善する推敲システムのための変換であり,
前記変形規則は,変形対象の第1の文字列を同義の変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記評価関数または評価規則による評価の尺度は,コーパスとしての大量の用例に関する言語データ中に現れる,変形されなかった変形対象を含む変換の候補の出現頻度または出現確率であり,出現頻度または出現確率が大きいものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。

【請求項5】
前記文字列の変換は,入力した難解文の文字列を平易文に変換する難解文変換システムのための変換であり,
前記変規則は,変形対象の第1の文字列を同義の変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記評価関数または評価規則による評価の尺度は,平易な文章集合からなるコーパスとしての大量の用例における,変形されなかった変形対象を含む変換の候補の出現頻度または出現確率であり,出現頻度または出現確率が大きいものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001205889thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close