Top > Search of Japanese Patents > LANGUAGE CONVERSION PROCESSING SYSTEM BY USE OF A PLURALITY OF SCALES AND PROCESSING PROGRAM THEREFOR

LANGUAGE CONVERSION PROCESSING SYSTEM BY USE OF A PLURALITY OF SCALES AND PROCESSING PROGRAM THEREFOR commons

Patent code P140010698
File No. 01-44
Posted date Jul 3, 2014
Application number P2001-268513
Publication number P2003-076687A
Patent number P4041876
Date of filing Sep 5, 2001
Date of publication of application Mar 14, 2003
Date of registration Nov 22, 2007
Inventor
  • (In Japanese)村田 真樹
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title LANGUAGE CONVERSION PROCESSING SYSTEM BY USE OF A PLURALITY OF SCALES AND PROCESSING PROGRAM THEREFOR commons
Abstract PROBLEM TO BE SOLVED: To provide a system capable of converting a plurality of kinds of sentences requiring saying in other words into target sentences simply.
SOLUTION: A deformation processing part 11 generates many candidates for conversion using deformation rules in a deformation rule storage part 15 when inputting the sentence to be converted 10. An evaluation processing part 12 evaluates whether the result of deformation of character strings is objective and suitable conversion or not using a plurality of evaluation scales concerning the generated candidates for conversion to select a character string having the expression having excellent evaluation result. The character string having high evaluation is outputted as a conversion result sentence 17. The evaluation scale can be selected by an evaluation scale selection part 13, and a degree of importance of the selected evaluation scale can be set by an evaluation importance degree setting part 14.
Outline of related art and contending technology (In Japanese)



自然言語で記述された文または文章に関する表現の変換処理として典型的なものは,機械翻訳である。機械翻訳では,ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。





機械翻訳が他の国の言語に変換するのに対し,同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば,要約文を自動生成したり,文章を推敲したりするシステムである。





一般に同一自然言語間での文の変換処理では,変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し,いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し,該当するパターンがあれば,それを変換後の語・句・文などのパターンに置き換える処理を行っている。

Field of industrial application (In Japanese)



本発明は,ある自然言語で記述された文または文章などの文字列を,同一または他の自然言語で記述された他の表現による文字列に変換するシステムであって,特に,コンピュータによる自然言語処理において多種多様な言い換えを扱うことができるようにした複数尺度の利用による言語変換処理システムおよびその処理プログラムに関するものである。

Scope of claims (In Japanese)
【請求項1】
 
ある自然言語で記述された文字列を他の表現による文字列に変換するシステムであって,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,コンピュータにより,複数の異なる辞書における同じ項目の定義文を照合し,該定義文において一致する文字列部分と一致しない文字列部分とを抽出することにより,同義表現の文字列を獲得し,得られた同義表現の文字列から自動生成された前記第1の文字列と前記第2の文字列からなる変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする表現になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価尺度ごとの評価情報であって,該評価情報を規定する評価尺度がM種類存在し,それらのM種類の評価尺度の中に,変換の候補の文字列の長短に基づき変換の候補の文字列が短いものほど高い評価値を与えるように予め定められた評価尺度,または,所定の平易な文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,口語もしくは文章語で表現された文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,特定の個人の文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,変換対象となっている複数の文字列の類似度に基づき類似度が高いものほど高い評価値を与えるように予め定められた評価尺度のいずれか少なくとも2種類を含む,M種類の各評価尺度に対応した評価情報を記憶する評価情報記憶手段と,
自然言語で記述された変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変換の候補の評価に用いるN種類の評価尺度を,前記M種類(M≧N)の評価尺度の中から外部からの指定により選択し,前記変形処理手段により生成された複数の変換の候補の評価値を,前記評価情報記憶手段に記憶された前記N種類の評価尺度に対応する評価情報を用いて前記評価尺度ごとに算出し,その算出されたN種類の評価尺度によるN個の評価値のすべてを用いて算出された総合評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする表現に変換された文字列として出力する出力手段とを備え,
前記評価処理手段は,前記出力手段により変換結果が出力された後に,前記N種類の評価尺度を変更する指示があると,前記総合評価値の最も高い表現を選択する処理を,変更された評価尺度を用いて繰り返す
ことを特徴とする複数尺度の利用による言語変換処理システム。

【請求項2】
 
前記評価処理手段が変換の候補の評価に用いるN種類の評価尺度に対して,各評価尺度の重要度に関する指定情報を入力する手段を備え,
前記評価処理手段は,入力された指定情報に基づいて,個々の評価尺度に対する評価値に前記重要度に応じた重み付けをし,前記総合評価値を算出する
ことを特徴とする請求項1記載の複数尺度の利用による言語変換処理システム。

【請求項3】
 
る自然言語で記述された文字列を他の表現による文字列に変換するシステムを,コンピュータによって実現するためのプログラムであって,
前記コンピュータを,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,複数の異なる辞書における同じ項目の定義文を照合し,該定義文において一致する文字列部分と一致しない文字列部分とを抽出することにより,同義表現の文字列を獲得し,得られた同義表現の文字列から自動生成された前記第1の文字列と前記第2の文字列からなる変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする表現になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価尺度ごとの評価情報であって,該評価情報を規定する評価尺度がM種類存在し,それらのM種類の評価尺度の中に,変換の候補の文字列の長短に基づき変換の候補の文字列が短いものほど高い評価値を与えるように予め定められた評価尺度,または,所定の平易な文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,口語もしくは文章語で表現された文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,特定の個人の文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,変換対象となっている複数の文字列の類似度に基づき類似度が高いものほど高い評価値を与えるように予め定められた評価尺度のいずれか少なくとも2種類を含む,M種類の各評価尺度に対応した評価情報を記憶する評価情報記憶手段と,
自然言語で記述された変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変換の候補の評価に用いるN種類の評価尺度を,前記M種類(M≧N)の評価尺度の中から外部からの指定により選択し,前記変形処理手段により生成された複数の変換の候補の評価値を,前記評価情報記憶手段に記憶された前記N種類の評価尺度に対応する評価情報を用いて前記評価尺度ごとに算出し,その算出されたN種類の評価尺度によるN個の評価値のすべてを用いて算出された総合評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする表現に変換された文字列として出力する出力手段として機能させ,
さらに前記評価処理手段が,前記出力手段により変換結果が出力された後に,前記N種類の評価尺度を変更する指示があると,前記総合評価値の最も高い表現を選択する処理を,変更された評価尺度を用いて繰り返すものとして
能させるための複数尺度の利用による言語変換処理プログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001268513thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close