Top > Search of Japanese Patents > SYSTEM FOR INTEGRATING LANGUAGE CONVERSION PROCESSING

SYSTEM FOR INTEGRATING LANGUAGE CONVERSION PROCESSING commons

Patent code P140010696
File No. 01-43
Posted date Jul 3, 2014
Application number P2001-205889
Publication number P2003-022264A
Patent number P3932350
Date of filing Jul 6, 2001
Date of publication of application Jan 24, 2003
Date of registration Mar 30, 2007
Inventor
  • (In Japanese)村田 真樹
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title SYSTEM FOR INTEGRATING LANGUAGE CONVERSION PROCESSING commons
Abstract PROBLEM TO BE SOLVED: To easily develop various language conversion processing systems by providing a system capable of integrally dealing with various rephrasing.
SOLUTION: When inputting a sentence 10 to be converted, a deformation processing part 11 generates a plurality of conversion candidates by using a deformation rule in a deformation rule storing part 15. An evaluation processing part 12 evaluates the generated conversion candidates by using evaluation information being a scale for evaluating whether the deformed result of a character string is suitably converted as desired, and selects and outputs the highly evaluated character string as a converted result sentence 13. Thus, it is possible to configure a system applied to various language conversion processing such as questions and answers, in-sentence compression (summarization), difficult sentence conversion (simple sentence generation), elaboration, and personal style conversion only by converting or selecting the conversion rule or evaluation information.
Outline of related art and contending technology (In Japanese)



自然言語で記述された文または文章に関する表現の変換処理として典型的なものは,機械翻訳である。機械翻訳では,ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。





機械翻訳が他の国の言語に変換するのに対し,同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば,要約文を自動生成したり,文章を推敲したりするシステムである。





一般に同一自然言語間での文の変換処理では,変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し,いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し,該当するパターンがあれば,それを変換後の語・句・文などのパターンに置き換える処理を行っている。

Field of industrial application (In Japanese)



本発明は,ある自然言語で記述された文または文章などの文字列を,同一の自然言語で記述された他の表現による文字列に変換するシステムであって,特に,コンピュータによる自然言語処理において多種多様な言い換えを統一的に扱うことができるようにした言語変換処理統一システムに関するものである。

Scope of claims (In Japanese)
【請求項1】
 
ある自然言語で記述された文字列を,同一の自然言語で記述された他の表現による文字列に変換するシステムにおいて,
前記自然言語の文字列に関する変換目的ごとに用意される変形の規則であって,変形対象の文字列またはそのパターンと,変形後の文字列またはそのパターンとの組の情報からなる変形規則を,文字列の変換の目的に応じて交換可能または後記の変形処理手段が選択可能な状態で記憶する変形規則記憶手段と,
文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価する所定の評価の尺度に従って評価値を算出するための評価関数または評価規則に関する変換目的ごとに用意される評価情報を,文字列の変換の目的に応じて交換可能または後記の評価処理手段が選択可能な状態で記憶する評価情報記憶手段と,
自然言語で記述された変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された複数の変形の規則を用いて変形し,複数の変換の候補を生成する,変換目的の異なる複数の変換方式に対して共通に用いることができる変形処理手段と,
前記変形処理手段によって生成された変換の候補を,前記評価情報記憶手段に記憶された評価関数または評価規則を用いて評価値を算出し,評価の最も高い表現を選択する,変換目的の異なる複数の変換方式に対して共通に用いることができる評価処理手段と,
前記変形処理手段による変形および前記評価処理手段による評価結果から,評価の最も高い文字列の変換結果を出力する出力手段とを備える
ことを特徴とする言語変換処理統一システム。

【請求項2】
 
前記変換対象となる文字列は,自然言語による質問文に対してデータベースを検索して回答を自然言語で応える質問応答システムにおいて当該システムが入力した質問文と,当該システムが質問文をもとにデータベースから取得した前記質問文に対する回答を含む文の候補の文字列であり,
前記変形規則は,変形対象の第1の文字列を同義の変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記変形処理手段は,前記変形規則を用いて多段に変形を繰り返すように構成され,
前記評価関数または評価規則による評価の尺度は,前記質問文または前記変形処理手段により生成された質問文の変換の候補と,前記回答を含む文の候補または前記変形処理手段により生成された回答を含む文の候補の変換の候補とに対して構文解析により算出された類似度の値の大小であり,類似度の値の大きいものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。

【請求項3】
 
前記文字列の変換は,入力した文字列から冗長な表現を修正して短くした文字列を生成する文内圧縮システムのための変換であり,
前記変形規則は,変形対象の第1の文字列を変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記評価関数または評価規則による評価の尺度は,変形後の文字列の長短を含み,変形後の文字列が短いものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。

【請求項4】
 
前記文字列の変換は,入力した文字列の表現を推敲し,より良い表現の文字列に改善する推敲システムのための変換であり,
前記変形規則は,変形対象の第1の文字列を同義の変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記評価関数または評価規則による評価の尺度は,コーパスとしての大量の用例に関する言語データ中に現れる,変形されなかった変形対象を含む変換の候補の出現頻度または出現確率であり,出現頻度または出現確率が大きいものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。

【請求項5】
 
前記文字列の変換は,入力した難解文の文字列を平易文に変換する難解文変換システムのための変換であり,
前記変規則は,変形対象の第1の文字列を同義の変形後の第2の文字列に言い換えるための,前記第1の文字列またはそのパターンと,前記第2の文字列またはそのパターンとの組の情報からなる変形規則であり,
前記評価関数または評価規則による評価の尺度は,平易な文章集合からなるコーパスとしての大量の用例における,変形されなかった変形対象を含む変換の候補の出現頻度または出現確率であり,出現頻度または出現確率が大きいものに高い評価を与えるものである
ことを特徴とする請求項1記載の言語変換処理統一システム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001205889thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close