Top > Search of Japanese Patents > DICTIONARY EVALUATION SUPPORTING DEVICE AND DICTIONARY EVALUATION SUPPORTING PROGRAM

DICTIONARY EVALUATION SUPPORTING DEVICE AND DICTIONARY EVALUATION SUPPORTING PROGRAM commons

Patent code P140010724
File No. 02-59
Posted date Jul 7, 2014
Application number P2003-019546
Publication number P2004-234137A
Patent number P3823151
Date of filing Jan 28, 2003
Date of publication of application Aug 19, 2004
Date of registration Jul 7, 2006
Inventor
  • (In Japanese)善本 淳
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title DICTIONARY EVALUATION SUPPORTING DEVICE AND DICTIONARY EVALUATION SUPPORTING PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To analyze a plurality of electronic dictionaries, and to present the characteristics of the contents of the dictionaries based on objective information.
SOLUTION: This device is constituted of a word and phrase input accepting means 1, a means 2 for retrieving the accepted words and phrases from the title word group of a plurality of electronic dictionaries ED, a means 3 for extracting an explanation sentence with the words and phrases as a title word from the electronic dictionaries ED based on the result, a means 4 for outputting a portion of the words and phrases included in the explanation sentence as the words and phrases associated with the title word with respect to the extracted explanation sentence, a means 5 for generating relevant information with the title word as a reference with respect to outputted words and phrases and a means 6 for outputting the relevant information for each of those electronic dictionaries. The word and phrase input accepting means 1 accepts the input of the objective words and phrases to be evaluated, and accepts the input of the relevant words and phrases outputted by the relevant word and phrase outputting means 4, and the relevant information generating means 5 generates relevant information including hierarchical information based on the number of times how many the input of the words and phrases to be evaluated are accepted by the word and phrase input accepting means 1 until the relevant words and phrases are output with the input of the objective words and phrases as a reference.
Outline of related art and contending technology (In Japanese)

辞書や辞典には、百科事典、分類表、シソーラス、1つの言語内で閉じた「一国語辞典」、複数の言語間を結びつける「二国語辞典」など様々な種類のものがある(非特許文献1参照)。従来より、辞書を1つ選ぶとき、注意深く類似の辞書を比較してから選ぶ事は希である。すなわち、一般的に辞書をユーザである消費者が購入する場合、価格、大きさ、見出し語量、例文量、例文の容易さ、字の大きさ、図版の多さ、書評、自らの予算範囲等の表層的に得られる情報を参考にするのが通例であると考えられる。また電子辞書が書物としての辞書に対応して提供される機会が増えてきている現在では、例えばインターネット等で電子辞書のサンプル版や評価版を試してみて、気に入った辞書を選択のうえ、該当する電子辞書又はそれに対応する辞書の購入をするような場合もあると考えられる。すなわち、書物としての辞書であれ電子辞書であれ、大凡これまでの辞書の選び方というのは、辞書そのものの内容を客観的に評価する方法が存在しないため、ユーザは、表層的な情報を手掛かりにあくまで主観に基づいて漠然と辞書を評価することを購入時の参考にしていた。このことから、ユーザが辞書を選ぶ際にさらに必要なことは、今まで用いられてきた上述の表面的な評価の他に、評価し難い辞書内の語彙の偏り、他の語句との連携性、辞書編纂者の特徴の情報に関して他の辞書と比較しながら短時間で知ることだと考えられる。なお、以下では、辞書とは、図や写真に頼らない、語を他の語で説明してある1つの言語で記述・編纂された一国語辞典を指すものとするが、図や写真を利用した百科事典等も基本的にはある語を他の語でその説明を記述したものと把握することができる。

ところで、ある語句とその語句の意味内容を表す別の語句とを図象化して表現するという考え方の一例として、節とその節を線で結ぶグラフとして言葉の構造を表す、有名な意味ネットワークの概念が挙げられる(非特許文献2参照)。この概念によれば、語句に対応する節(ノード)は2種類存在し、対象となる語句をtype、またその語句を表す語句群tokenとして区別している。また、ソシュールによって、語句は記号(signe)と、それが指し示す概念と聴覚映像の所記(signifie)と能記(signifiant)という存在に明確に分離されて久しいが(非特許文献3参照)、ようやく近年では高速な計算機によって記号(signe)部分の語句処理、例えば形態素解析(例えば非特許文献4参照)などの処理は可能となった。しかしながら未だ記号(signe)が指し示す概念(signifie、signifiant)としての語句を処理することは困難な現状にある。

【非特許文献1】

シドニー・I・ランダウ(Landau,Sidney.I.)著、小島義郎・増田英夫・高野嘉明 訳、「辞書学のすべて(Dictionaries: the art and craft of lexicography)」研究社出版、1988年

【非特許文献2】

キリアン(Quillian,M.R.)著、「セマンティック メモリー(Semantic Memory)」、「セマンティック インフォメーション プロセッシング誌(Semantic Information Processing)」、ミンスキー(Minsky)編、エムアイティープレス(MIT Press)、1968年、p.216-270

【非特許文献3】

フェルディナン・ド・ソシュール(Ferdinand de Saussure)著、小林英夫訳、「一般言語学講義(改訂版)」、岩波書店、1972年

【非特許文献4】

長尾真著、「自然言語処理」、岩波書店、1996年

Field of industrial application (In Japanese)

本発明は、辞書を選ぶ際の好適な指標となる情報を提示することができる辞書評価支援装置及びそのプログラムに関するものである。

Scope of claims (In Japanese)
【請求項1】
 
見出し語群と各見出し語に対応する説明文章とを少なくとも格納した複数の電子辞書を利用して、当該複数の電子辞書の内容を評価する指標を出力するために用いられるものであって、
語句の入力を受け付ける語句入力受付手段と、この受け付けた語句を各電子辞書に格納された見出し語群から検索する見出し語検索手段と、この検索結果に基づいて当該語句を見出し語とする説明文章を各電子辞書から抽出する説明文章抽出手段と、抽出した各説明文章に対して形態素解析を実行し当該説明文章に含まれる語句のうち少なくとも一部の語句を電子辞書ごとについて前記見出し語に関連する関連語句として出力する関連語句出力手段と、出力した各関連語句について見出し語を基準とする関連性を示す関連情報を電子辞書ごとについて生成する関連情報生成手段と、生成した関連情報をそれぞれ出力する関連情報出力手段とを具備し、前記語句入力受付手段が、初期値として評価対象である評価対象語句の入力を受け付けるとともに、関連語句出力手段で出力される関連語句の入力を自動的に受け付けるものであり、関連情報生成手段が、各関連語句に関して、評価対象語句の入力を基準として当該関連語句が出力されるまでに語句入力受付手段において初期値としての評価対象語句を見出し語とした語句の入力を受け付けた回数と関連語句を見出し語とした語句の入力を受け付けた回数の合計回数に基づく階層情報を含む関連情報を生成することを特徴とする辞書評価支援装置。

【請求項2】
 
関連語句出力手段が、説明文章を一以上の説明文に分割し、その分割した各説明文に対して実行した形態素解析の結果に基づいて、各説明文に出現する語句に対して当該説明文における文頭からの出現順位を示す語句出現順位を付与し、所定の語句出現順位に係る語句を関連語句として出力するものである請求項1記載の辞書評価支援装置。

【請求項3】
 
関連語句出力手段が、語句出現順位が1位の語句を関連語句として出力するものである請求項2記載の辞書評価支援装置。

【請求項4】
 
関連語句の階層情報について所定階層までの関連情報の生成を指定する旨の階層指定情報の入力を受け付ける階層指定情報受付手段を更に具備し、関連情報生成手段が、階層指定情報受付手段で受け付けた階層指定情報に対応する階層情報を有する関連情報を生成した場合、関連情報の生成を終了する旨の終了情報を生成するものであり、関連情報出力手段がこの終了情報を含む関連情報を出力するものであって、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するものである請求項1、2又は3記載の辞書評価支援装置。

【請求項5】
 
関連語句出力手段が、出力する関連語句に対して前記語句出現順位と共に、説明文章において当該関連語句を含む説明文が出現した順位を示す説明文出現順位を付与するものであり、関連情報生成手段において生成する関連情報が、直前に関連語句出力手段で出力した関連語句について、当該関連語句の語句出現順位を定数とし、且つ、当該関連語句が出現した説明文により構成される説明文章に対応する見出し語と、前記説明文出現順位とを変数とする関数によって表される情報から構成されるものである請求項2、3又は4記載の辞書評価支援装置。

【請求項6】
 
関連語句出力手段が、評価対象語句についてのみ説明文出現順位が1位から所定順位までの関連語句を出力し、評価対象語句以外の関連語句については説明文出現順位が1位の関連語句のみを出力するものである請求項5記載の辞書評価支援装置。

【請求項7】
 
評価対象語句に基づいて直接出力される関連語句の説明文出現順位を指定する説明文出現順位指定情報の入力を受け付ける説明文出現順位指定情報受付手段を更に具備し、語句入力受付手段が、説明文出現順位指定情報受付手段で受け付けた説明文出現順位指定情報に係る説明文出現順位を越える説明文出現順位を有する関連語句の入力を受け付けないものである請求項1、2、3、4、5又は6記載の辞書評価支援装置。

【請求項8】
 
評価対象語句及び関連語句の品詞を指定する品詞指定情報を受け付ける品詞指定受付手段を更に具備し、語句入力受付手段が、品詞指定受付手段で受け付けた品詞のみの入力を受け付けるものであり、関連語句出力手段が、形態素解析に基づいて品詞指定受付手段で受け付けた品詞に対応する語句のみを関連語句として出力する請求項7記載の辞書評価支援装置。

【請求項9】
 
関連情報出力手段で出力した関連情報に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備し、樹系図生成手段が、複数の電子辞書に基づいて単一の樹系図を生成するものである請求項1、2、3、4、5、6、7又は8記載の辞書評価支援装置。

【請求項10】
 
関連情報出力手段で出力した関連情報に含まれる前記階層情報、語句出現順位、説明文出現順位及び品詞指定情報に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備し、樹系図生成手段が、複数の電子辞書に基づいて単一の樹系図を生成するものである請求項8記載の辞書評価支援装置。

【請求項11】
 
樹系図生成手段が、評価対象語句及び関連語句を表示可能な所定の語句表示欄を有する節と、節同士を結ぶ線とからなる前記樹系図を生成するものである請求項10記載の辞書評価支援装置。

【請求項12】
 
樹系図生成手段が、生成すべき樹系図の線の一部又は近傍に、電子辞書の名称又は種別及び関連情報から構成される添字を付加するものである請求項11記載の辞書評価支援装置。

【請求項13】
 
見出し語検索手段において検索対象である語句が何れかの電子辞書の見出し語群に存在しないと判断した場合、説明文出現順位指定情報で受け付けた説明文出現順位に該当する説明文がその説明文章に存在しないと判断した場合、又は品詞指定受付手段で受け付けた品詞指定情報に該当する説明文中の当該品詞に係る語彙数が所定の語句出現順位数未満と判断した場合、の何れかの場合に該当するとき、関連情報生成手段がその電子辞書における関連情報をヌルとするとともに、関連情報出力手段がこのヌルを返値として出力し、それに基づき樹系図生成手段が当該ヌルに該当する部位を空欄又は終了を表す表記に変換した樹系図を生成し、樹系図出力手段がこの生成された樹系図を出力するものである請求項10、11又は12記載の辞書評価支援装置。

【請求項14】
 
樹系図生成手段が、生成すべき樹系図の節について、電子辞書ごとに異なる形状の語句表示欄を設定するものである請求項9、10、11、12又は13記載の辞書評価支援装置。

【請求項15】
 
樹系図生成手段が、同一の電子辞書から得られた複数の関連語句又は異なる電子辞書からそれぞれ得られた複数の関連語句が同一であって重複する場合、当該関連語句が表示される節における語句表示欄の形状を所定形状に変化させるものである請求項14記載の辞書評価支援装置。

【請求項16】
 
樹系図生成手段が、生成すべき樹系図における線について、電子辞書ごとに異なる形状の線を設定するものである請求項10、11、12、13、14又は15記載の辞書評価支援装置。

【請求項17】
 
樹系図生成手段が、ある関連語句と、それとは異なる関連情報を有する関連語句を重複して表示しない樹系図を生成するものである請求項10、11、12、13、14、15又は16記載の辞書評価支援装置。

【請求項18】
 
樹系図生成手段が、生成すべき樹系図の線の一部又は近傍に、電子辞書の名称又は種別及び関連情報から構成される添字を付加するものである場合、前記線に付加すべき添字を重複して表示しない樹系図を生成するものである請求項17記載の辞書評価支援装置。

【請求項19】
 
樹系図生成手段が、複数の電子辞書に基づく単一の樹系図に加えて、電子辞書ごとに基づくそれぞれの樹系図をも生成するものであり、樹系図出力手段が、前記単一の樹系図又は電子辞書ごとの樹系図のいずれかを選択的に出力し得るものである請求項10、11、12、13、14、15、16、17又は18記載の辞書評価支援装置。

【請求項20】
 
樹系図出力手段が、ディスプレイ以外の出力装置にも樹系図生成手段で生成した樹系図を画像データとして出力するものである請求項10、11、12、13、14、15、16、17、18又は19記載の辞書評価支援装置。

【請求項21】
 
コンピュータに見出し語群と各見出し語に対応する説明文章とを少なくとも格納した複数の電子辞書を読み込ませ、これら電子辞書の内容を評価する指標を出力するために、当該コンピュータを、
語句の入力を受け付ける語句入力受付手段と、この受け付けた語句を各電子辞書に格納された見出し語群から検索する見出し語検索手段と、この検索結果に基づいて当該語句を見出し語とする説明文章を各電子辞書から抽出する説明文章抽出手段と、抽出した各説明文章に対して形態素解析を実行し当該説明文章に含まれる語句のうち少なくとも一部の語句を電子辞書ごとについて前記見出し語に関連する関連語句として出力する関連語句出力手段と、出力した各関連語句について見出し語を基準とする関連性を示す関連情報を電子辞書ごとについて生成する関連情報生成手段と、生成した関連情報それぞれを出力する関連情報出力手段とを具備し、前記語句入力受付手段が、初期値として評価対象である評価対象語句の入力を受け付けるとともに、関連語句出力手段で出力される関連語句の入力を自動的に受け付けるものであり、関連情報生成手段が、各関連語句に関して、評価対象語句の入力を基準として当該関連語句が出力されるまでに語句入力受付手段において初期値としての評価対象語句を見出し語とした語句の入力を受け付けた回数と関連語句を見出し語とした語句の入力を受け付けた回数の合計回数に基づく階層情報を含む関連情報を生成する辞書評価支援装置として機能させることを特徴とする辞書評価支援プログラム。

【請求項22】
 
関連語句出力手段が、説明文章を一以上の説明文に分割し、その分割した各説明文に対して実行した形態素解析の結果に基づいて、各説明文に出現する語句に対して当該説明文における文頭からの出現順位を示す語句出現順位を付与し、所定の語句出現順位に係る語句を関連語句として出力するようにコンピュータを機能させる請求項21記載の辞書評価支援プログラム。

【請求項23】
 
関連語句出力手段が、語句出現順位が1位の語句を関連語句として出力するようにコンピュータを機能させる請求項22記載の辞書評価支援プログラム。

【請求項24】
 
コンピュータに、関連語句の階層情報について所定階層までの関連情報の生成を指定する旨の階層指定情報の入力を受け付ける階層指定情報受付手段を更に具備させ、関連情報生成手段が、階層指定情報受付手段で受け付けた階層指定情報に対応する階層情報を有する関連情報を生成した場合、関連情報の生成を終了する旨の終了情報を生成し、関連情報出力手段がこの終了情報を含む関連情報を出力し、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するように当該コンピュータを機能させる請求項21、22又は23記載の辞書評価支援プログラム。

【請求項25】
 
関連語句出力手段が、出力する関連語句に対して前記語句出現順位と共に、説明文章において当該関連語句を含む説明文が出現した順位を示す説明文出現順位を付与し、関連情報生成手段において生成する関連情報を、直前に関連語句出力手段で出力した関連語句について、当該関連語句の語句出現順位を定数とし、且つ、当該関連語句が出現した説明文により構成される説明文章に対応する見出し語と、前記説明文出現順位とを変数とする関数によって表される情報から構成するようにコンピュータを機能させる請求項21、22、23又は24記載の辞書評価支援プログラム。

【請求項26】
 
関連語句出力手段が、評価対象語句についてのみ説明文出現順位が1位から所定順位までの関連語句を出力し、評価対象語句以外の関連語句については説明文出現順位が1位の関連語句のみを出力するようにコンピュータを機能させる請求項25記載の辞書評価支援プログラム。

【請求項27】
 
コンピュータに、評価対象語句に基づいて直接出力される関連語句の説明文出現順位を指定する説明文出現順位指定情報の入力を受け付ける説明文出現順位指定情報受付手段を更に具備させ、語句入力受付手段が、説明文出現順位指定情報受付手段で受け付けた説明文出現順位指定情報に係る説明文出現順位を越える説明文出現順位を有する関連語句の入力を受け付けないように当該コンピュータを機能させる請求項21、22、23、24、25又は26記載の辞書評価支援プログラム。

【請求項28】
 
コンピュータに、評価対象語句及び関連語句の品詞を指定する品詞指定情報を受け付ける品詞指定受付手段を更に具備させ、語句入力受付手段が、品詞指定受付手段で受け付けた品詞のみの入力を受け付け、関連語句出力手段が、形態素解析に基づいて品詞指定受付手段で受け付けた品詞に対応する語句のみを関連語句として出力する請求項27記載の辞書評価支援プログラム。

【請求項29】
 
コンピュータに、関連情報出力手段で出力した関連情報に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を電子辞書ごとに生成する樹系図生成手段と、生成した各樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備させる請求項21、22、23、24、25、26、27又は28記載の辞書評価支援プログラム。

【請求項30】
 
コンピュータに、関連情報出力手段で出力した関連情報に含まれる前記階層情報、語句出現順位及び説明文出現順位に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を電子辞書ごとに生成する樹系図生成手段と、生成した各樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備させる請求項28記載の辞書評価支援プログラム。

【請求項31】
 
樹系図生成手段が、評価対象語句及び関連語句を表示可能な所定の語句表示欄を有する節と、節同士を結ぶ線とからなる前記樹系図を生成するようにコンピュータを機能させる請求項30記載の辞書評価支援プログラム。

【請求項32】
 
樹系図生成手段が、生成すべき樹系図の線の一部又は近傍に、電子辞書の名称又は種別及び関連情報から構成される添字を付加するようにコンピュータを機能させる請求項31記載の辞書評価支援プログラム。

【請求項33】
 
見出し語検索手段において検索対象である語句が何れかの電子辞書の見出し語群に存在しないと判断した場合、説明文出現順位指定情報で受け付けた説明文出現順位に該当する説明文がその説明文章に存在しないと判断した場合、又は品詞指定受付手段で受け付けた品詞指定情報に該当する説明文中の当該品詞に係る語彙数が所定の語句出現順位数未満と判断した場合、の何れかの場合に該当するとき、関連情報生成手段がその電子辞書における関連情報をヌルとするとともに、関連情報出力手段がこのヌルを返値として出力し、それに基づき樹系図生成手段が当該ヌルに該当する部位を空欄又は終了を表す表記に変換した樹系図を生成し、樹系図出力手段がこの生成された樹系図を出力するようにコンピュータを機能させるものである請求項30、31又は32記載の辞書評価支援プログラム。

【請求項34】
 
樹系図生成手段が、生成すべき樹系図の節について、電子辞書ごとに異なる形状の語句表示欄を設定するようにコンピュータを機能させる請求項29、30、31、32又は33記載の辞書評価支援プログラム。

【請求項35】
 
樹系図生成手段が、同一の電子辞書から得られた複数の関連語句又は異なる電子辞書からそれぞれ得られた複数の関連語句が同一であって重複する場合、当該関連語句が表示される節における語句表示欄の形状を所定形状に変化させるようにコンピュータを機能させる請求項34記載の辞書評価支援プログラム。

【請求項36】
 
樹系図生成手段が、生成すべき樹系図における線について、電子辞書ごとに異なる形状の線を設定するようにコンピュータを機能させるものである請求項29、30、31、32、33、34又は35記載の辞書評価支援プログラム。

【請求項37】
 
樹系図生成手段が、ある関連語句と、それとは異なる関連情報を有する関連語句を重複して表示しない樹系図を生成するものである請求項29、30、31、32、33、34、35又は36記載の辞書評価支援プログラム。

【請求項38】
 
樹系図生成手段が、生成すべき樹系図の線の一部又は近傍に、電子辞書の名称又は種別及び関連情報から構成される添字を付加するものである場合、前記線に付加すべき添字を重複して表示しない樹系図を生成するものである請求項37記載の辞書評価支援プログラム。

【請求項39】
 
樹系図生成手段が、複数の電子辞書に基づく単一の樹系図に加えて、電子辞書ごとに基づくそれぞれの樹系図をも生成するものであり、樹系図出力手段が、前記単一の樹系図又は電子辞書ごとの樹系図のいずれかを選択的に出力し得るようにコンピュータを機能させるものである請求項29、30、31、32、33、34、35、36、37又は38記載の辞書評価支援プログラム。

【請求項40】
 
樹系図出力手段が、ディスプレイ以外の出力装置にも樹系図生成手段で生成した樹系図を画像データとして出力するようにコンピュータを機能させるものである請求項29、30、31、32、33、34、35、36、37、38又は39記載の辞書評価支援プログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2003019546thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close