TOP > 国内特許検索 > 文章語文体変換システムおよび文章語文体変換処理プログラム

文章語文体変換システムおよび文章語文体変換処理プログラム コモンズ

国内特許コード P140010694
整理番号 01-42
掲載日 2014年7月3日
出願番号 特願2001-205888
公開番号 特開2003-022266
登録番号 特許第4041875号
出願日 平成13年7月6日(2001.7.6)
公開日 平成15年1月24日(2003.1.24)
登録日 平成19年11月22日(2007.11.22)
発明者
  • 村田 真樹
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 文章語文体変換システムおよび文章語文体変換処理プログラム コモンズ
発明の概要 【課題】 入力した文章語を目的とする文体に適切に変換できるようにする。
【解決手段】 第1の文字列を同義の第2の文字列に言い換える変形の規則を多数記憶する変形規則記憶部14と,文字列を変形した結果が目的とするふさわしい文体になっているかどうかを評価するための尺度を与える評価関数または評価規則を記憶する評価情報記憶部15とを用意し,自然言語で記述された文体変換対象の文字列を入力すると,変形処理部11によって,入力された文字列を変形規則を用いて変形し,変換の候補を生成する。次に,生成された変換の候補を,評価処理部12によって,評価関数または評価規則を用いて評価し,評価結果のよい表現を選択し,選択された表現の変換結果を,目的とする文体に変換された文章語として出力する。
従来技術、競合技術の概要



自然言語で記述された文または文章に関する表現の変換処理として典型的なものは,機械翻訳である。機械翻訳では,ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。





機械翻訳が他の国の言語に変換するのに対し,同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば,要約文を自動生成したり,文章を推敲したりするシステムである。





一般に同一自然言語間での文の変換処理では,変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し,いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し,該当するパターンがあれば,それを変換後の語・句・文などのパターンに置き換える処理を行っている。





また,同一自然言語間での文の変換処理として,要約文を自動生成したり,文章を推敲したりすることは行われていたが,例えば芥川龍之介が書いた小説を,夏目漱石の文体の小説に変換するというように,ある特定の個人の文体または一般的な文体の文章を,他の特定の個人の文体に変換するというようなことは行われていなかった。

産業上の利用分野



本発明は,ある自然言語で記述された文章語の文字列を,同一の自然言語で記述された他の文体による文章語の文字列に変換する文章語文体変換システムに関するものである。

特許請求の範囲 【請求項1】
ある自然言語で記述された文章語を,同一の自然言語で記述された他の文体による文章語に変換するシステムであって,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,コンピュータにより,複数の異なる辞書ファイルから同じ単語の説明文を抽出し,抽出した複数の説明文の言語情報を突き合わせ,突き合わせた結果から得られた同義語または同義語フレーズによって自動生成された前記第1の文字列と前記第2の文字列からなる,目的とする文体の変換の方向に依存しない変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする文体になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価情報であって,該評価情報を規定する評価尺度が,変換先の文体による文章の集合を格納したデータベース中の用例における変換の候補の出現頻度または出現確率が大きいものほど高い評価値を与えるものであるように予め定められた評価情報を記憶する評価情報記憶手段と,
自然言語で記述された文体変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形の規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変形処理手段により生成された複数の変換の候補について前記評価情報記憶手段に記憶された評価情報を用いて前記評価尺度による評価値を算出し,算出された評価値によって各変換の候補の表現を評価し,評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする文体に変換された文章語として出力する出力手段とを備える
ことを特徴とする文章語文体変換システム。

【請求項2】
前記評価処理手段は,前記各変換の候補の表現を評価するにあたって,変換の候補によって変形した文字列における変形した部分を含む領域範囲の文字列が,前記データベースにおける文章の集合の中で何回出現したかを示す出現頻度を評価尺度として用い,前記出現頻度が大きいものほど高い評価値を与えて,前記変換の候補の表現を評価する
ことを特徴とする請求項1記載の文章語文体変換システム。

【請求項3】
る自然言語で記述された文章語を,同一の自然言語で記述された他の文体による文章語に変換するシステムを,コンピュータによって実現するためのプログラムであって,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,複数の異なる辞書ファイルから同じ単語の説明文を抽出し,抽出した複数の説明文の言語情報を突き合わせ,突き合わせた結果から得られた同義語または同義語フレーズによって自動生成された前記第1の文字列と前記第2の文字列からなる,目的とする文体の変換の方向に依存しない変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする文体になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価情報であって,該評価情報を規定する評価尺度が,変換先の文体による文章の集合を格納したデータベース中の用例における変換の候補の出現頻度または出現確率が大きいものほど高い評価値を与えるものであるように予め定められた評価情報を記憶する評価情報記憶手段と,
自然言語で記述された文体変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形の規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変形処理手段により生成された複数の変換の候補について前記評価情報記憶手段に記憶された評価情報を用いて前記評価尺度による評価値を算出し,算出された評価値によって各変換の候補の表現を評価し,評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする文体に変換された文章語として出力する出力手段として,
コンピュータを機能させるための文章語文体変換処理プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001205888thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close