TOP > 国内特許検索 > 個人環境言語変換装置及び個人環境差分強調装置及びプログラム

個人環境言語変換装置及び個人環境差分強調装置及びプログラム コモンズ

国内特許コード P140010726
整理番号 03-09
掲載日 2014年7月7日
出願番号 特願2003-053258
公開番号 特開2004-265014
登録番号 特許第4119979号
出願日 平成15年2月28日(2003.2.28)
公開日 平成16年9月24日(2004.9.24)
登録日 平成20年5月9日(2008.5.9)
発明者
  • 村田 真樹
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 個人環境言語変換装置及び個人環境差分強調装置及びプログラム コモンズ
発明の概要 【課題】個人環境での文字列の頻度情報により、入力文の個人環境への言語変換や差分強調を容易に行えるようにすること。
【解決手段】個人環境での読み書きの入力を行う読み書き入力部5と、文字列の頻度情報の検索を行う頻度記憶手段3aとを備え、前記頻度記憶手段3aは、前記読み書き入力部5から入力された個人環境での読み書きデータから任意の文字列を抽出し、該抽出した文字列毎の個数をカウントする。
【選択図】 図1
従来技術、競合技術の概要



従来、自然言語で記述された文または文章に関する表現の変換処理として典型的なものは、機械翻訳である。機械翻訳では、ある国の自然言語で記述された文または文章を他の国の自然言語で記述された文または文章に変換する。





機械翻訳が他の国の言語に変換するのに対し、同一の自然言語間での文または文章の変換処理を行うシステムも用いられるようになってきている。例えば、要約文を自動生成したり、文章を推敲したりするシステムである。





一般に同一自然言語間での文の変換処理では、変換前の語・句・文などのパターンと変換後の語・句・文などのパターンとの対からなる変換規則を大量に用意し、いわゆるパターン・マッチングによって入力文中に現れる変換前のパターンを探し出し、該当するパターンがあれば、それを変換後の語・句・文などのパターンに置き換える処理を行うものであった。





また、各種の言い換えを統一的に扱うことができるようにするため、ある自然言語で記述された文字列を、同一の自然言語で記述された他の表現による文字列に変換するシステムとして次のものが提案されている。





主要なモジュールとして変形処理手段と評価処理手段と、自然言語の文字列に関する変形の規則を記憶する変形規則記憶手段と、文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価するための尺度を与える評価関数または評価規則を記憶する評価情報記憶手段とを持ち、これらを変換の目的に応じて交換できるようにする。さらに、変形規則記憶手段および評価情報記憶手段に、変形規則および評価関数等を複数種類用意し、変換の目的に応じて選択できるようにする。





これにより、複数の言語変換処理システムを開発する場合の開発コストを低減し、また、複数の言語変換処理システムを統一されたインタフェースで利用可能にすることができるものがあった(例えば、非特許文献1及び特願2001-205889参照)。





【非特許文献1】

村田真樹,井佐原均, 言い換えの統一的モデル-尺度に基づく変形の利用-,2001年 3月30日言語処理学会第7回年次大会ワークショップ論文集,p.21~26

産業上の利用分野



本発明は、個人環境での読み書きの入力データから文字列の頻度情報を求める個人環境頻度記憶装置と、該個人環境頻度記憶装置を使用する個人環境言語変換装置及び個人環境差分強調装置及びプログラムに関する。





特に、個人環境の読み書きシステムにおいてその個人の良く知っている文字列(単語)を認定する個人環境頻度記憶装置及びプログラムと、なるべく個人の良く知っている文字列(単語)を使って表示するようにする個人環境言語変換装置及びプログラムと、個人環境での文字列の出現頻度により文字列を強調表示する個人環境差分強調装置及びプログラムに関する。

特許請求の範囲 【請求項1】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記言語変換手段は、入力文の文字列を前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列に変換して出力することを特徴とした個人環境言語変換装置。

【請求項2】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記言語変換手段は、入力文の文字列のうち前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列を求め、該求めた文字列を同じ意味の前記入力文の文字列の近くに括弧づけで補助表記して出力することを特徴とした個人環境言語変換装置。

【請求項3】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項4】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以上のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項5】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力された文字列の差分として出力する対象の単位である抽出単位と入力された文字列の差分を検出するために比較する領域の単位である検出領域を設定し、抽出手段で入力された文字列の現在の前記検出領域以外の領域から全ての前記抽出単位に相当するものを抽出して格納手段に格納し、現在の前記検出領域において、前記格納手段に格納されていない前記抽出単位に相当するものを強調表示すべきと判断して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返す差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度を求め、
前記差分強調装置は、前記抽出手段で強調表示すべきと判断された前記入力された文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項6】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力された文字列の差分として出力する対象の単位である抽出単位と入力された文字列の差分を検出するために比較する領域の単位である検出領域を設定し、抽出手段で、入力された文書データの現在の前記検出領域において、格納手段に格納されていない前記抽出単位に相当するものを強調表示すべきと判断して現在の検出領域の文書を出力し、前記強調表示すべきと判断したものを前記格納手段に格納することを、前記検出領域ごとに繰り返す差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度を求め、
前記差分強調装置は、前記抽出手段で強調表示すべきと判断された前記入力された文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示することを特徴とした個人環境差分強調装置。

【請求項7】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、統計的検定を用い、入力文の文字列のうち前記頻度記憶手段の文字列出現頻度より求めたユーザ個人での文字列出現確率が一般的なテキスト集合で求めた出現確率より有意に大きいものだけを強調表示することを特徴とした個人環境差分強調装置。

【請求項8】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
前記差分強調装置は、入力文の文字列のうち前記頻度記憶手段の文字列出現頻度より求めたユーザ個人の読み書きデータでの文字列出現確率が一般的なテキスト集合で求めた出現確率のある値倍より大きいものだけを強調表示することを特徴とした個人環境差分強調装置。

【請求項9】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え、
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列を前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列に変換して出力する前記言語変換手段として、コンピュータを機能させるためのプログラム。

【請求項10】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文を個人環境言語に同じ意味を表す文字列への言語変換の辞書を用いて変換して出力する言語変換手段とを備える個人環境言語変換装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列のうち前記頻度記憶手段に格納されている前記言語変換の辞書中の前記入力文の文字列と同じ意味で出現頻度の最も高い文字列を求め、該求めた文字列を同じ意味の前記入力文の文字列の近くに括弧づけで補助表記して出力する前記言語変換手段として、コンピュータを機能させるためのプログラム。

【請求項11】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示する前記差分強調装置として、コンピュータを機能させるためのプログラム。

【請求項12】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力文の文字列と前記頻度記憶手段に格納されている文字列の差分を強調して表示する差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度情報を求め、
入力文の文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以上のものを強調表示する前記差分強調装置として、コンピュータを機能させるためのプログラム。

【請求項13】
個人環境での読み書きの入力を行う読み書き入力部と、前記読み書き入力部に入力された読み書きデータを格納し、全文検索エンジンで任意の文字列の個数をカウントするか又は形態素解析器で単語に分割して任意の単語の出現回数をカウントして、文字列の頻度情報の検索を行う頻度記憶手段とを有する個人環境頻度記憶装置と
入力された文字列の差分として出力する対象の単位である抽出単位と入力された文字列の差分を検出するために比較する領域の単位である検出領域を設定し、抽出手段で入力された文字列の現在の前記検出領域以外の領域から全ての前記抽出単位に相当するものを抽出して格納手段に格納し、現在の前記検出領域において、前記格納手段に格納されていない前記抽出単位に相当するものを強調表示すべきと判断して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返す差分強調装置とを備える個人環境差分強調装置であって
前記頻度記憶手段に前記読み書き入力部から入力された画面上に所定時間以上連続して表示された部分である任意の文字列を読み入力とし、該読み入力を検出する読み入力検出部と文章を作成するために入力した任意の文字列を書き入力とし、該書き入力を検出する書き入力検出部を備え
前記頻度記憶手段は、前記書き入力検出部で検出した前記任意の文字列の出現頻度の重みを前記読み入力検出部で検出した前記任意の文字列の出現頻度の重みより重くして前記任意の文字列を検索して出現頻度を求め、
前記抽出手段で強調表示すべきと判断された前記入力された文字列のうち前記頻度記憶手段に格納されている文字列の出現頻度がある閾値以下のものを強調表示する前記差分強調装置として、コンピュータを機能させるためのプログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2003053258thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close