Top > Search of Japanese Patents > PERSONAL ENVIRONMENT FREQUENCY STORAGE DEVICE, PERSONAL ENVIRONMENT LANGUAGE CONVERSION DEVICE, PERSONAL ENVIRONMENT DIFFERENCE EMPHASIS DEVICE AND PROGRAM

PERSONAL ENVIRONMENT FREQUENCY STORAGE DEVICE, PERSONAL ENVIRONMENT LANGUAGE CONVERSION DEVICE, PERSONAL ENVIRONMENT DIFFERENCE EMPHASIS DEVICE AND PROGRAM commons

Patent code P140010726
File No. 03-09
Posted date Jul 7, 2014
Application number P2003-053258
Publication number P2004-265014A
Patent number P4119979
Date of filing Feb 28, 2003
Date of publication of application Sep 24, 2004
Date of registration May 9, 2008
Inventor
  • (In Japanese)村田 真樹
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title PERSONAL ENVIRONMENT FREQUENCY STORAGE DEVICE, PERSONAL ENVIRONMENT LANGUAGE CONVERSION DEVICE, PERSONAL ENVIRONMENT DIFFERENCE EMPHASIS DEVICE AND PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To easily execute the difference emphasis or language conversion of an input sentence to a personal environment by the frequency information of a character string in the personal environment.
SOLUTION: This personal environment frequency storage device has a reading/writing input part 5 inputting reading/writing in the personal environment, and a frequency storage means 3a retrieving the frequency information of the character string. The frequency storage means 3a extracts an arbitrary character string from reading/writing data in the personal environment inputted from the reading/writing input part 5, and counts the number of the character strings by the extracted character strings.
Outline of related art and contending technology (In Japanese)



従来、自然言語で記述された文または文章に関する表現の変換処理として典型的なものは、機械翻訳である。機械翻訳では、ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。





機械翻訳が他の国の言語に変換するのに対し、同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば、要約文を自動生成したり、文章を推敲したりするシステムである。





一般に同一自然言語間での文の変換処理では、変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し、いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し、該当するパターンがあれば、それを変換後の語・句・文などのパターンに置き換える処理を行うものであった。





また、各種の言い換えを統一的に扱うことができるようにするため、ある自然言語で記述された文字列を、同一の自然言語で記述された他の表現による文字列に変換するシステムとして次のものが提案されている。





主要なモジュールとして変形処理手段と評価処理手段と、自然言語の文字列に関する変形の規則を記憶する変形規則記憶手段と、文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価するための尺度を与える評価関数または評価規則を記憶する評価情報記憶手段とを持ち、これらを変換の目的に応じて交換できるようにする。さらに、変形規則記憶手段および評価情報記憶手段に、変形規則および評価関数等を複数種類用意し、変換の目的に応じて選択できるようにする。





これにより、複数の言語変換処理システムを開発する場合の開発コストを低減し、また、複数の言語変換処理システムを統一されたインタフェースで利用可能にすることができるものがあった(例えば、非特許文献1及び特願2001-205889参照)。





【非特許文献1】

村田真樹,井佐原均, 言い換えの統一的モデル-尺度に基づく変形の利用-,2001年 3月30日言語処理学会第7回年次大会ワークショップ論文集,p.21~26

Field of industrial application (In Japanese)



本発明は、個人環境での読み書きの入力データから文字列の頻度情報を求める個人環境頻度記憶装置と、該個人環境頻度記憶装置を使用する個人環境言語変換装置及び個人環境差分強調装置及びプログラムに関する。





特に、個人環境の読み書きシステムにおいてその個人の良く知っている文字列(単語)を認定する個人環境頻度記憶装置及びプログラムと、なるべく個人の良く知っている文字列(単語)を使って表示するようにする個人環境言語変換装置及びプログラムと、個人環境での文字列の出現頻度により文字列を強調表示する個人環境差分強調装置及びプログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記言語変換手段は、入力文の文字列を前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列に変換して出力することを特徴とした個人環境言語変換装置。

【請求項2】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記言語変換手段は、入力文の文字列のうち前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列を求め、該求めた文字列を同じ意味の前記入力文の文字列の近くに括弧づけで補助表記して出力することを特徴とした個人環境言語変換装置。

【請求項3】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項4】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以上のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項5】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力された文字列の差分として出力する対象の単位である抽出単位と入力された文字列の差分を検出するために比較する領域の単位である検出領域を設定し、抽出手段で入力された文字列の現在の前記検出領域以外の領域から全ての前記抽出単位に相当するものを抽出して格納手段に格納し、現在の前記検出領域において、前記格納手段に格納されていない前記抽出単位に相当するものを強調表示すべきと判断して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返す差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度を求め、
前記差分強調装置は、前記抽出手段で強調表示すべきと判断された前記入力された文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項6】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力された文字列の差分として出力する対象の単位である抽出単位と入力された文字列の差分を検出するために比較する領域の単位である検出領域を設定し、抽出手段で、入力された文書データの現在の前記検出領域において、格納手段に格納されていない前記抽出単位に相当するものを強調表示すべきと判断して現在の検出領域の文書を出力し、前記強調表示すべきと判断したものを前記格納手段に格納することを、前記検出領域ごとに繰り返す差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度を求め、
前記差分強調装置は、前記抽出手段で強調表示すべきと判断された前記入力された文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項7】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、統計的検定を用い、入力文の文字列のうち前記頻度記憶手段の文字列出現頻度より求めたユーザ個人での文字列出現確率が一般的なテキスト集合で求めた出現確率より有意に大きいものだけを強調表示することを特徴とした個人環境差分強調装置。

【請求項8】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、入力文の文字列のうち前記頻度記憶手段の文字列出現頻度より求めたユーザ個人の読み書きデータでの文字列出現確率が一般的なテキスト集合で求めた出現確率のある値倍より大きいものだけを強調表示することを特徴とした個人環境差分強調装置。

【請求項9】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列を前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列に変換して出力する前記言語変換手段として、コンピュータを機能させるためのプログラム。

【請求項10】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列のうち前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列を求め、該求めた文字列を同じ意味の前記入力文の文字列の近くに括弧づけで補助表記して出力する前記言語変換手段として、コンピュータを機能させるためのプログラム。

【請求項11】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示する前記差分強調装置として、コンピュータを機能させるためのプログラム。

【請求項12】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以上のものを強調表示する前記差分強調装置として、コンピュータを機能させるためのプログラム。

【請求項13】
 
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力された文字列の差分として出力する対象の単位である抽出単位と入力された文字列の差分を検出するために比較する領域の単位である検出領域を設定し、抽出手段で入力された文字列の現在の前記検出領域以外の領域から全ての前記抽出単位に相当するものを抽出して格納手段に格納し、現在の前記検出領域において、前記格納手段に格納されていない前記抽出単位に相当するものを強調表示すべきと判断して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返す差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度を求め、
前記抽出手段で強調表示すべきと判断された前記入力された文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示する前記差分強調装置として、コンピュータを機能させるためのプログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2003053258thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close