TOP > 国内特許検索 > 複数尺度の利用による言語変換処理システムおよびその処理プログラム

複数尺度の利用による言語変換処理システムおよびその処理プログラム コモンズ

国内特許コード P140010698
整理番号 01-44
掲載日 2014年7月3日
出願番号 特願2001-268513
公開番号 特開2003-076687
登録番号 特許第4041876号
出願日 平成13年9月5日(2001.9.5)
公開日 平成15年3月14日(2003.3.14)
登録日 平成19年11月22日(2007.11.22)
発明者
  • 村田 真樹
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 複数尺度の利用による言語変換処理システムおよびその処理プログラム コモンズ
発明の概要 【課題】 複数種類の言い換えが必要な文または文章を,目的とする文または文章に簡単に変換することができるシステムを提供する。
【解決手段】 変形処理部11は,変換対象文10を入力すると,変形規則記憶部15中の変形規則を用いて多くの変換の候補を生成する。評価処理部12は,生成された変換の候補について,文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価するための複数の評価尺度を用いて評価し,評価結果のよい表現の文字列を選択する。その評価の高い文字列を変換結果文17として出力する。評価尺度は,評価尺度選択部13によって選択することができ,また選択した評価尺度の重要度は,評価重要度設定部14によって設定することができる。
従来技術、競合技術の概要



自然言語で記述された文または文章に関する表現の変換処理として典型的なものは,機械翻訳である。機械翻訳では,ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。





機械翻訳が他の国の言語に変換するのに対し,同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば,要約文を自動生成したり,文章を推敲したりするシステムである。





一般に同一自然言語間での文の変換処理では,変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し,いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し,該当するパターンがあれば,それを変換後の語・句・文などのパターンに置き換える処理を行っている。

産業上の利用分野



本発明は,ある自然言語で記述された文または文章などの文字列を,同一または他の自然言語で記述された他の表現による文字列に変換するシステムであって,特に,コンピュータによる自然言語処理において多種多様な言い換えを扱うことができるようにした複数尺度の利用による言語変換処理システムおよびその処理プログラムに関するものである。

特許請求の範囲 【請求項1】
ある自然言語で記述された文字列を他の表現による文字列に変換するシステムであって,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,コンピュータにより,複数の異なる辞書における同じ項目の定義文を照合し,該定義文において一致する文字列部分と一致しない文字列部分とを抽出することにより,同義表現の文字列を獲得し,得られた同義表現の文字列から自動生成された前記第1の文字列と前記第2の文字列からなる変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする表現になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価尺度ごとの評価情報であって,該評価情報を規定する評価尺度がM種類存在し,それらのM種類の評価尺度の中に,変換の候補の文字列の長短に基づき変換の候補の文字列が短いものほど高い評価値を与えるように予め定められた評価尺度,または,所定の平易な文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,口語もしくは文章語で表現された文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,特定の個人の文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,変換対象となっている複数の文字列の類似度に基づき類似度が高いものほど高い評価値を与えるように予め定められた評価尺度のいずれか少なくとも2種類を含む,M種類の各評価尺度に対応した評価情報を記憶する評価情報記憶手段と,
自然言語で記述された変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変換の候補の評価に用いるN種類の評価尺度を,前記M種類(M≧N)の評価尺度の中から外部からの指定により選択し,前記変形処理手段により生成された複数の変換の候補の評価値を,前記評価情報記憶手段に記憶された前記N種類の評価尺度に対応する評価情報を用いて前記評価尺度ごとに算出し,その算出されたN種類の評価尺度によるN個の評価値のすべてを用いて算出された総合評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする表現に変換された文字列として出力する出力手段とを備え,
前記評価処理手段は,前記出力手段により変換結果が出力された後に,前記N種類の評価尺度を変更する指示があると,前記総合評価値の最も高い表現を選択する処理を,変更された評価尺度を用いて繰り返す
ことを特徴とする複数尺度の利用による言語変換処理システム。

【請求項2】
前記評価処理手段が変換の候補の評価に用いるN種類の評価尺度に対して,各評価尺度の重要度に関する指定情報を入力する手段を備え,
前記評価処理手段は,入力された指定情報に基づいて,個々の評価尺度に対する評価値に前記重要度に応じた重み付けをし,前記総合評価値を算出する
ことを特徴とする請求項1記載の複数尺度の利用による言語変換処理システム。

【請求項3】
る自然言語で記述された文字列を他の表現による文字列に変換するシステムを,コンピュータによって実現するためのプログラムであって,
前記コンピュータを,
前記自然言語で記述された第1の文字列を同義の第2の文字列に言い換える変形の規則であって,複数の異なる辞書における同じ項目の定義文を照合し,該定義文において一致する文字列部分と一致しない文字列部分とを抽出することにより,同義表現の文字列を獲得し,得られた同義表現の文字列から自動生成された前記第1の文字列と前記第2の文字列からなる変形規則を記憶する変形規則記憶手段と,
文字列を変形した結果の表現が目的とする表現になっているかどうかを評価するための数値情報,関数群もしくはサブルーチン群,評価方法を記述した規則,またはこれらを組み合わせた情報からなる評価尺度ごとの評価情報であって,該評価情報を規定する評価尺度がM種類存在し,それらのM種類の評価尺度の中に,変換の候補の文字列の長短に基づき変換の候補の文字列が短いものほど高い評価値を与えるように予め定められた評価尺度,または,所定の平易な文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,口語もしくは文章語で表現された文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,特定の個人の文章集合からなる言語データ中に現れる出現頻度もしくは出現確率に基づき変換の候補の出現頻度もしくは出現確率が大きいものほど高い評価値を与えるように予め定められた評価尺度,または,変換対象となっている複数の文字列の類似度に基づき類似度が高いものほど高い評価値を与えるように予め定められた評価尺度のいずれか少なくとも2種類を含む,M種類の各評価尺度に対応した評価情報を記憶する評価情報記憶手段と,
自然言語で記述された変換対象の文字列を入力する入力手段と,
前記入力された文字列を前記変形規則記憶手段に記憶された変形規則を用いて変形し,複数の変換の候補を生成する変形処理手段と,
前記変換の候補の評価に用いるN種類の評価尺度を,前記M種類(M≧N)の評価尺度の中から外部からの指定により選択し,前記変形処理手段により生成された複数の変換の候補の評価値を,前記評価情報記憶手段に記憶された前記N種類の評価尺度に対応する評価情報を用いて前記評価尺度ごとに算出し,その算出されたN種類の評価尺度によるN個の評価値のすべてを用いて算出された総合評価値の最も高い表現を選択する評価処理手段と,
前記選択された表現の変換結果を,目的とする表現に変換された文字列として出力する出力手段として機能させ,
さらに前記評価処理手段が,前記出力手段により変換結果が出力された後に,前記N種類の評価尺度を変更する指示があると,前記総合評価値の最も高い表現を選択する処理を,変更された評価尺度を用いて繰り返すものとして
能させるための複数尺度の利用による言語変換処理プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001268513thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close