TOP > 国内特許検索 > 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体

類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体

国内特許コード P06A009082
整理番号 A171P09
掲載日 2006年6月16日
出願番号 特願2003-110159
公開番号 特開2004-318381
登録番号 特許第3856388号
出願日 平成15年4月15日(2003.4.15)
公開日 平成16年11月11日(2004.11.11)
登録日 平成18年9月22日(2006.9.22)
発明者
  • 橋田 浩一
  • 宮田 高志
出願人
  • 独立行政法人産業技術総合研究所
発明の名称 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体
発明の概要

【課題】情報検索における文脈に応じた類義性を動的に効率良く求める。
【解決手段】CPU(処理部)は、検索質問Qを主記憶部又は入力部から入力し(S201)、グラフで表現するグラフ作成処理を実行し(S203)、記憶する(S205)。処理部は、Qのノードとリンクの集合からデータベースDのノードとリンクの集合への部分関数で表現される解候補fを求める(S206)。処理部は、シソーラスTに基づきQのノード又はリンクに対してラベルを追加して検索質問Q’を作成し(S207)解候補f’を求める(S209)。処理部は、f’の解候補としての良さを示す実数値である解候補スコアs(f’)を求め(S211)、Qの中のノード又はリンクxの既存のラベルと他のラベルLとの文脈における文脈類義性S(x、L)を求める(S213)。処理部は、S(x、L)を、記憶部に記憶し(S215)、表示部に表示する(S217)。
【選択図】 図10

従来技術、競合技術の概要
従来の情報検索は、キーワードやキーワードに対応する識別番号をAND条件やOR条件等の論理式によって組合せたものを検索質問とし、文字列照合と統計的処理によって検索を行なうものであった。利用者とのインタラクションのためには、例えば、解候補集合のいくつかの部分集合について、その各々を特徴付けるキーワード・語句を統計的な方法によって求め、それらのキーワード・語句を検索要求に加えるキーワード・語句の候補として提示して、利用者に選ばせるなどの方法が用いられていた(非特許文献1及び2)。
また、従来より、語の間の類義性を語の間の共起関係等に基づいて求める方法は、以下の非特許文献3~5のように、いくつか知られている。
【0003】
【非特許文献1】
林 良彦・小橋 喜嗣 (1998) WWW上の検索サービスの技術動向. 情報処理, 39巻9号.
【非特許文献2】
藤田 澄男 (1999) 自然言語処理を利用した情報の検索・分類へのアプローチ.情報処理、40巻4号.
【非特許文献3】
Hindle, D. Noun classification from predicate-argument structures. Proceedings of the 28th ACL, pp. 268-275, 1990.
【非特許文献4】
Pereira, F., Tishby, N., and Lee, L. Distributional clustering of English words. Proceedings of the 31st ACL, pp.183-190, 1993.
【非特許文献5】
Tokunaga, T., Iwayama, M., and Tanaka, H. Automatic thesaurus construction based on grammatical relations. Proceedings of IJCAI ’95, pp. 1308-1313, 1995.
産業上の利用分野
本発明は、情報検索の文脈に応じて類義性を求めるための類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体に係り、特に、情報検索において、ラベル付きグラフに関する個々の検索質問及びそのデータベースとの関係に応じてキーワード間の類義性を動的に求めるための類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
特許請求の範囲 【請求項1】 情報検索の文脈に応じて類義性を求めるための類義性計算方法であって、
処理部は、ノード、ノードのラベル、ノード間のリンク及びリンクのラベルからなるグラフで表現した検索質問Qを記憶部又は入力部から入力し、ラベルJ及びKの間の類義性を示す実数値である類似度T(J,K)を与える部分関数であるシソーラスTを記憶したシソーラス記憶部を参照し、検索質問Qのノード又はリンクのラベルMとの類似度T(L,M)が大きなラベルLをxに追加して検索質問Q’を作成するステップと、
処理部は、データベースDを参照し、グラフの近似照合により、検索質問Q’のノードとリンクの集合からデータベースのノードとリンクの集合への部分関数で表現される解候補f’を求めるステップと、
処理部は、解候補f’の解候補としての良さを示す実数値である解候補スコアs(f’)を求めるステップと、
処理部は、求めた解候補スコアs(f’)とに基づき、検索質問Q、データベースD、及びシソーラスTに応じ、検索質問Qの各ノード及び/又は各リンクxについて、xの既存のラベルと他のラベルLとの文脈における類義性を示す実数値である文脈類義性S(x、L)を求めるステップと、
処理部は、求めた文脈類義性S(x、L)を、ノード又はリンクxに対応して記憶部に記憶する又は表示部に表示するステップと
を含む前記類義性計算方法。
【請求項2】 処理部は、データベースDを参照し、グラフの近似照合により、検索質問Qのノードとリンクの集合からデータベースDのノードとリンクの集合への部分関数で表現される解候補fを求めるステップと
をさらに含む請求項1に記載の類義性計算方法。
【請求項3】 処理部は、入力された検索質問Qを解析してグラフで表現するステップをさらに含む請求項1に記載の類義性計算方法。
【請求項4】 前記グラフで表現するステップは、
形態素解析によって、文章を語に分割するステップと、
統語解析によって、分割された語を句又は節に統合するステップと、
意味解析によって、動作主及び動作対象等の意味構造を求めるステップと、
照応解析によって、語間の共参照又は照応等の関連を認識するステップと
を含む請求項に記載の類義性計算方法。
【請求項5】 前記文脈類義性S(x,L)を求めるステップは、文脈類義性S(x,L)を、以下の値のいずれか又は複数に関して単調増加として求める請求項1に記載の類義性計算方法。
(1)ノード又はリンクxの各ラベルMに対する類似度T(L,M)
(2)検索質問Qにおいてノード又はラベルxにラベルLを追加して得られる拡張された検索質問Q’について、検索質問Q’のデータベースにおける各解候補、つまり、検索質問Q’のノードとリンクの集合からデータベースのノードとリンクの集合への部分関数、のスコア
【請求項6】 検索質問QおよびQ’のノード及びリンクのラベルのスコアは、ラベル毎に記憶部に記憶されており、処理部は、記憶部を参照することでスコアを得る請求項5に記載の類義性計算方法。
【請求項7】 ラベル間の類義性を示すラベルのスコアは、処理部は、類似度T(L,M)及び/又は以前に求めた文脈類義性S(x,L)に基づき求める請求項5に記載の類義性計算方法。
【請求項8】 前記文脈類義性S(x,L)を求めるステップは、
シソーラスTから、ノード又はリンクxの各ラベルMについて類似度T(L,M)を読み出し、類似度T(L,M)の最大値を求めるステップと、
検索質問Q’のデータベースにおける各解候補f’に対して解候補スコアs(f’)の最大値を求めるステップと、
求めた両方の最大値に従い文脈類義性S(x,L)を求めるステップとを含む請求項1に記載の類義性計算方法。
【請求項9】 処理部は、文脈類義性S(x,L)に応じてノード又はリンクxのラベルの候補Lをソートして、各ノード又はリンクxに対応するラベルの候補を表示部に表示する請求項1に記載の類義性計算方法。
【請求項10】 処理部は、ノード又はリンクxのラベルの候補Lに対応して文脈類義性S(x,L)の値を表示部に表示する請求項1に記載の類義性計算方法。
【請求項11】 前記解候補スコアs(f’)を求めるステップは、次の量のいずれか又は複数を記憶部から読み出すことにより、解候補スコアs(f’)をそれらの量に関する何らかの単調増加関数の値として求める請求項1に記載の類義性計算方法。
(1)ノードf(u)が定義されるノードuの個数と経路f(u→v)が定義されるリンクu→vの本数に基づく、fの定義域の大きさ
(2)検索質問Qの各ノードuについて、ノードuとノードf(u)との類似性、
(3)検索質問Qの各リンクu→vについて、リンクu→vと経路f(u→v)との類似性、
(4)Dの経路f(u→v)がノードf(u)を始点とするような、検索質問Qのリンクu→vの本数、
(5)Dの経路f(u→v)がノードf(v)を終点とするような、検索質問Qのリンクu→vの本数。
【請求項12】 処理部は、入力された検索質問Qに従い、データベースDを参照し、検索質問Qによるデータベースの検索結果として解候補集合Fを求める検索ステップと、
処理部は、求めた解候補集合Fを表示部に表示するステップと、
処理部は、解候補集合Fのいくつかの要素が解に該当するかどうかについての入力情報を入力部から入力するステップと、
処理部は、その入力情報に従い、解候補集合Fのいくつかの要素を、解候補集合Fから削除するステップと、
処理部は、入力部からのシソーラスT及び/又は検索質問Qに関する削除、追加又は変更についての入力情報に基づき、シソーラスTの内容を変更する及び/又は検索質問Qのノード、リンク、及び/又はそれらのラベルを削除又は追加するステップと、
処理部は、利用者から再検索の要求があれば前記検索ステップに戻り処理を繰返し、一方、その要求がなければ処理を終了するステップと
を含む請求項1に記載の類義性計算方法。
【請求項13】 処理部は、表示部に検索質問Qを表示するステップと、
処理部は、検索質問Qの2つのノードを結ぶリンクがない場合にそのようなリンクを挿入することを指示する入力情報を入力部から入力するステップと、
処理部は、その入力情報に従い、そのリンクを挿入するステップと、
処理部には、検索質問Qのリンクを削除することを指示する入力情報を入力部から入力するステップと、
処理部は、その入力情報に従い、そのリンクを削除するステップと、
処理部には、検索質問Qに新たなノードを付加することを指示する入力情報が入力部から入力されるステップと、
処理部は、その入力情報に従い、検索質問Qにそのノードを付加するステップと、
処理部には、検索質問Qのノードを削除することを指示する入力情報を入力部から入力するステップと、
処理部は、その入力情報に従い、検索質問Qからそのノードを削除するステップと、
をさらに含む請求項1に記載の類義性計算方法。
【請求項14】 情報検索の文脈に応じて類義性を求めるための類義性計算プログラムであって、
処理部は、ノード、ノードのラベル、ノード間のリンク及びリンクのラベルからなるグラフで表現した検索質問Qを記憶部又は入力部から入力し、ラベルJ及びKの間の類義性を示す実数値である類似度T(J,K)を与える部分関数であるシソーラスTを記憶したシソーラス記憶部を参照し、検索質問Qのノード又はリンクに対してそのラベルMとの類似度T(L,M)に基づきラベルLを追加して検索質問Q’を作成するステップと、
処理部は、データベースDを参照し、グラフの近似照合により、検索質問Q’のノードとリンクの集合からデータベースのノードとリンクの集合への部分関数で表現される解候補f’を求めるステップと、
処理部は、解候補f’の解候補としての良さを示す実数値である解候補スコアs(f’)を求めるステップと、
処理部は、求めた解候補スコアs(f’)に基づき、検索質問Q、データベースD、及びシソーラスTに応じ、検索質問Qの各ノード及び/又は各リンクについて、検索質問Qの中のノード又はリンクxの既存のラベルと他のラベルLとの文脈における類義性を示す実数値である文脈類義性S(x、L)を求めるステップと、
処理部は、求めた文脈類義性S(x、L)を、ノード又はリンクxに対応して記憶部に記憶する又は表示部に表示するステップと
をコンピュータに実行させるための類義性計算プログラム。
【請求項15】 情報検索の文脈に応じて類義性を求めるための類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
処理部は、ノード、ノードのラベル、ノード間のリンク及びリンクのラベルからなるグラフで表現した検索質問Qを記憶部又は入力部から入力し、ラベルJ及びKの間の類義性を示す実数値である類似度T(J,K)を与える部分関数であるシソーラスTを記憶したシソーラス記憶部を参照し、検索質問Qのノード又はリンクに対してそのラベルMとの類似度T(L,M)に基づきラベルLを追加して検索質問Q’を作成するステップと、
処理部は、データベースDを参照し、グラフの近似照合により、検索質問Q’のノードとリンクの集合からデータベースのノードとリンクの集合への部分関数で表現される解候補f’を求めるステップと、
処理部は、解候補f’の解候補としての良さを示す実数値である解候補スコアs(f’)を求めるステップと、
処理部は、求めた解候補スコアs(f’)に基づき、検索質問Q、データベースD、及びシソーラスTに応じ、検索質問Qの各ノード及び/又は各リンクについて、検索質問Qの中のノード又はリンクxの既存のラベルと他のラベルLとの文脈における類義性を示す実数値である文脈類義性S(x、L)を求めるステップと、
処理部は、求めた文脈類義性S(x、L)を、ノード又はリンクxに対応して記憶部に記憶する又は表示部に表示するステップと
をコンピュータに実行させるための類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体。
産業区分
  • 計算機応用
  • 記憶装置
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2003110159thum.jpg
出願権利状態 権利存続中
参考情報 (研究プロジェクト等) CREST 高度メディア社会の生活情報技術 領域
ライセンスをご希望の方、特許の内容に興味を持たれた方は、問合せボタンを押してください。


PAGE TOP

close
close
close
close
close
close
close