Top > Search of Japanese Patents > TEXT WORD/STYLE CONVERSION SYSTEM AND TEXT WORD/STYLE CONVERSION PROCESSING PROGRAM

TEXT WORD/STYLE CONVERSION SYSTEM AND TEXT WORD/STYLE CONVERSION PROCESSING PROGRAM commons

Patent code P140010694
File No. 01-42
Posted date Jul 3, 2014
Application number P2001-205888
Publication number P2003-022266A
Patent number P4041875
Date of filing Jul 6, 2001
Date of publication of application Jan 24, 2003
Date of registration Nov 22, 2007
Inventor
  • (In Japanese)村田 真樹
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title TEXT WORD/STYLE CONVERSION SYSTEM AND TEXT WORD/STYLE CONVERSION PROCESSING PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To properly convert an inputted text word into a target style.
SOLUTION: This system is provided with a deformation rule storing part 14 for storing a plurality of deformation rules for rephrasing a first character string to a synonym second character string and an evaluation information storing part 15 for storing an evaluation function or evaluation rule for applying a scale for evaluating whether or not the deformed result of the character string is a proper style as desired. At inputting the character string being the target of style conversion described in natural language, the inputted character string is deformed by using a deformation rule by a deformation processing part 11, and conversion candidates are generated. Then, the generated conversion candidates are evaluated by using the evaluation function or the evaluation rule by an evaluation processing part 12, and the highly evaluated expression is selected, and the converted result of the selected expression is outputted as a text word converted into the desired style.
Outline of related art and contending technology (In Japanese)

自然言語で記述された文または文章に関する表現の変換処理として典型的なものは,機械翻訳である。機械翻訳では,ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。

機械翻訳が他の国の言語に変換するのに対し,同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば,要約文を自動生成したり,文章を推敲したりするシステムである。

一般に同一自然言語間での文の変換処理では,変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し,いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し,該当するパターンがあれば,それを変換後の語・句・文などのパターンに置き換える処理を行っている。

また,同一自然言語間での文の変換処理として,要約文を自動生成したり,文章を推敲したりすることは行われていたが,例えば芥川龍之介が書いた小説を,夏目漱石の文体の小説に変換するというように,ある特定の個人の文体または一般的な文体の文章を,他の特定の個人の文体に変換するというようなことは行われていなかった。

Field of industrial application (In Japanese)

本発明は,ある自然言語で記述された文章語の文字列を,同一の自然言語で記述された他の文体による文章語の文字列に変換する文章語文体変換システムに関するものである。

Scope of claims (In Japanese)
【請求項1】
 
ある自然言語で記述された文章語を,同一の自然言語で記述された他の文体による文章語に変換するシステムであって,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,コンピュータにより,複数の異なる辞書ファイルから同じ単語の説明文を抽出し,抽出した複数の説明文の言語情報を突き合わせ,突き合わせた結果から得られた同義語または同義語フレーズによって自動生成された前記第1の文字列と前記第2の文字列からなる,目的とする文体の変換の方向に依存しない変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする文体になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価情報であって,該評価情報を規定する評価尺度が,変換先の文体による文章の集合を格納したデータベース中の用例における変換の候補の出現頻度または出現確率が大きいものほど高い評価値を与えるものであるように予め定められた評価情報を記憶する評価情報記憶手段と,
自然言語で記述された文体変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形の規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変形処理手段により生成された複数の変換の候補について前記評価情報記憶手段に記憶された評価情報を用いて前記評価尺度による評価値を算出し,算出された評価値によって各変換の候補の表現を評価し,評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする文体に変換された文章語として出力する出力手段とを備える
ことを特徴とする文章語文体変換システム。

【請求項2】
 
前記評価処理手段は,前記各変換の候補の表現を評価するにあたって,変換の候補によって変形した文字列における変形した部分を含む領域範囲の文字列が,前記データベースにおける文章の集合の中で何回出現したかを示す出現頻度を評価尺度として用い,前記出現頻度が大きいものほど高い評価値を与えて,前記変換の候補の表現を評価する
ことを特徴とする請求項1記載の文章語文体変換システム。

【請求項3】
 
る自然言語で記述された文章語を,同一の自然言語で記述された他の文体による文章語に変換するシステムを,コンピュータによって実現するためのプログラムであって,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,複数の異なる辞書ファイルから同じ単語の説明文を抽出し,抽出した複数の説明文の言語情報を突き合わせ,突き合わせた結果から得られた同義語または同義語フレーズによって自動生成された前記第1の文字列と前記第2の文字列からなる,目的とする文体の変換の方向に依存しない変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする文体になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価情報であって,該評価情報を規定する評価尺度が,変換先の文体による文章の集合を格納したデータベース中の用例における変換の候補の出現頻度または出現確率が大きいものほど高い評価値を与えるものであるように予め定められた評価情報を記憶する評価情報記憶手段と,
自然言語で記述された文体変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形の規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変形処理手段により生成された複数の変換の候補について前記評価情報記憶手段に記憶された評価情報を用いて前記評価尺度による評価値を算出し,算出された評価値によって各変換の候補の表現を評価し,評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする文体に変換された文章語として出力する出力手段として,
コンピュータを機能させるための文章語文体変換処理プログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001205888thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close