Top > Search of Japanese Patents > INFORMATION RESOURCE RETRIEVAL DEVICE, INFORMATION RESOURCE RETRIEVAL METHOD AND INFORMATION RESOURCE RETRIEVAL PROGRAM

INFORMATION RESOURCE RETRIEVAL DEVICE, INFORMATION RESOURCE RETRIEVAL METHOD AND INFORMATION RESOURCE RETRIEVAL PROGRAM

Patent code P10A015383
File No. A0200124
Posted date Apr 9, 2010
Application number P2005-380311
Publication number P2007-179490A
Patent number P4324650
Date of filing Dec 28, 2005
Date of publication of application Jul 12, 2007
Date of registration Jun 19, 2009
Inventor
  • (In Japanese)神門 典子
  • (In Japanese)金沢 輝一
Applicant
  • (In Japanese)大学共同利用機関法人情報・システム研究機構
Title INFORMATION RESOURCE RETRIEVAL DEVICE, INFORMATION RESOURCE RETRIEVAL METHOD AND INFORMATION RESOURCE RETRIEVAL PROGRAM
Abstract PROBLEM TO BE SOLVED: To regularly obtain a retrieval result without impairing retrieval efficiency even if metadata assigned to an information resource usable on a Web is imperfect or a retrieval condition is improper.
SOLUTION: The device comprises a first score calculation part 21 calculating a first score for information resources with metadata containing a free word matched with an input free word; a second score calculation part 22 calculating a second score for information resources with metadata containing a thesaurus keyword matched with an input thesaurus keyword, and multiplying, for information resources with metadata containing the thesaurus keyword belonging to another node in the same facet, the second score by a weight according to a distance on a tree structure for the information resources with metadata containing a thesaurus keyword belonging to another node in the same facet, and taking the result as the second score; a score addition part 23 obtaining a third score by adding the first and second scores; and a sorting part 24 obtaining a list of information resources sorted in the descending order of the third score as a retrieval result to be outputted.
Outline of related art and contending technology (In Japanese)

例えばHTML化或いはPDF化された、又はテキストデータである学術論文等の文書や、写真、地図、稀少本などのデジタルライブラリー化されたデジタルコンテンツは、インターネット上でウェブブラウザを介して閲覧可能である。これらの情報資源の量はすでに膨大であり、そのデータベース化、その円滑な流通、再利用が強く要請される。

他人の情報資源を利用するためには、検索エンジンを使用して所望する情報資源に辿り着く必要があるが、従来の検索エンジンは、専ら情報資源に書誌情報として付与されたメタデータを対象として、入力された検索テキストと一致するテキストを含む情報資源を検索結果として抽出する。

メタデータの記述方式としては、例えばダブリンコア(Dublin Core)方式が規格化されている(ISO15836)。このダブリンコア方式においては、title(資源の題名)、creator(作成者)、subject(資源の内容に含まれるトピック、キーワード)、description(資源の内容の説明、要約、目次等)、date(作成日又は公開日)、type(資源の内容の性質又はジャンル)、coverage(資源の範囲若しくは対象。地理区分、時間区分等)、rights(著作権、産業財産権等の言明)等、全部で15の要素タイプが記述すべきメタデータの要素として定義される。情報資源提供者或いはライブラリアンは、人手によって、或いは一部自動生成により、この記述方式に従い、メタデータを例えばRDF(Resource Description Framework)やHTML等が規定するタグ等として記述し、このメタデータを情報資源に付与してウェブ上で公表する。
【特許文献1】
特開2000-112949
【特許文献2】
特開2004-310199

Field of industrial application (In Japanese)

本発明は、情報資源検索装置、情報資源検索方法及び情報資源検索プログラムに関する。より詳しくは、作者、タイトル、作成日等の書誌情報がメタデータとして付与された、インターネット上でウェブブラウザを介して閲覧可能である情報資源や文書の検索において、検索におけるヒットミスを解消し、もって情報資源の可用性を向上させるための検索技術及びその検索条件の入力及び検索結果のブラウジングにおけるユーザーインターフェースに関する。

Scope of claims (In Japanese)
【請求項1】
 
情報資源に付与されるメタデータであって、該メタデータは、前記情報資源ごとに、シソーラス上のファセット内のノード名を記述するシソーラスキーワードと、前記情報資源内に記述されたフリーワード及びその重要度の対とを含むメタデータを記憶するメタデータ記憶部と、
異なる複数のファセットに属するシソーラスキーワードを木構造上で同時に選択入力可能に表示し、かつ現在指定されているファセット及びシソーラスキーワードを表示すると共に、前記情報資源を検索するための加点用シソーラスキーワードを選択入力するシソーラスキーワード入力部と、
前記情報資源を検索するための入力フリーワードを入力するフリーワード入力部と、
前記入力フリーワードと一致する又は類似する前記フリーワードを前記メタデータに含む情報資源について、前記一致する又は類似するフリーワードと対をなす重要度に基づいて、第1のスコアを算出し、該第1のスコアを保持する処理を全ての検索対象情報資源について実行する第1のスコア算出部と、
前記加点用シソーラスキーワードと一致する前記シソーラスキーワード、又は前記加点用シソーラスキーワードの属するファセットの木構造上前記一致するシソーラスキーワードの下位ノードに属するシソーラスキーワードを前記メタデータに含む情報資源について、第2のスコアを算出すると共に、前記ファセット内のその他のノードに属するシソーラスキーワードを前記メタデータに含む情報資源について、前記第2のスコアに前記木構造上の距離に応じた重みを乗じて第2のスコアを算出し、該第2のスコアを保持する処理を全ての検索対象情報資源について実行する第2のスコア算出部と、
情報資源ごとに、前記第1のスコアと前記第2のスコアとを合算して第3のスコアを得るスコア合算部と、
前記第3のスコアの大きい順にソートされた情報資源を検索結果として一覧表示することにより、選択入力された前記加点用シソーラスキーワード又は前記入力フリーワードのいずれかと一致するシソーラスキーワード又はフリーワードを含むメタデータが付与されていない情報資源が表示出力され得る検索結果出力部と
前記検索結果の出力に引き続いて加点用シソーラスキーワードが選択入力されると、前記第2のスコアを算出して保持される第2のスコアに加算し、前記第3のスコアを再計算し、再計算された前記第3のスコアの大きい順に再ソートされた情報資源を更新表示する更新出力部とを具備する
ことを特徴とする情報資源検索装置。

【請求項2】
 
前記更新出力部は、前記検索結果の出力に引き続いて同一ファセット内のシソーラスキーワードが選択入力された場合には、前記第2のスコアを初期化して新たに算出し、異なるファセット内のシソーラスキーワードが選択入力された場合には、前記第2のスコアを算出して保持される第2のスコアに加算する
ことを特徴とする請求項1に記載の情報検索装置。

【請求項3】
 
前記第1のスコア算出部は、前記出力部による前記検索結果の出力に引き続いて前記入力フリーワードが入力された場合、前記入力フリーワードの入力によって算出された第1のスコアを、保持される第1のスコアに加算して第1のスコアとし、
前記更新出力部は、前記第3のスコアの大きい順に再度ソートされた情報資源を更新表示する
ことを特徴とする請求項1又は2に記載の情報検索装置。

【請求項4】
 
前記シソーラスキーワード入力部は、複数の前記ファセットの木構造を選択的に表示し、表示された前記複数の木構造上のノードを同時に選択可能とする
ことを特徴とする請求項1ないし3のいずれか記載の情報検索装置。

【請求項5】
 
前記検索結果出力部は、前記加点用シソーラスキーワードと一致する前記シソーラスキーワード、又は前記加点用シソーラスキーワードの属するファセットの木構造上前記一致するシソーラスキーワードの下位ノードに属するシソーラスキーワードを前記メタデータに含む情報資源を、前記第3のスコアの大きい順にソートして一覧表示する第1の表示出力欄と、
前記ファセット内のその他のノードに属するシソーラスキーワードを前記メタデータに含む情報資源を、前記第3のスコアの大きい順にソートして一覧表示する第2の表示出力欄とを具備する
ことを特徴とする請求項1ないし4のいずれか記載の情報資源検索装置。

【請求項6】
 
前記検索結果出力部は、実質的に、表示装置の有効表示領域内に一度に表示可能な件数の情報資源を一覧表示する
ことを特徴とする請求項1ないし5のいずれか記載の情報資源検索装置。

【請求項7】
 
上記情報資源検索装置は、さらに、
前記情報資源の検索結果を絞り込むための絞込み条件シソーラスキーワードを入力する絞込み条件入力部と、
入力された絞込み条件シソーラスキーワードと一致する前記シソーラスキーワード、又は前記絞込み条件シソーラスキーワードの属するファセットの木構造上前記一致するシソーラスキーワードの下位ノードに属するシソーラスキーワードを前記メタデータに含む情報資源のみを、出力されるべき情報資源として設定するフィルタリング処理部とを具備する
ことを特徴とする請求項1ないし6のいずれか記載の情報資源検索装置。

【請求項8】
 
上記情報資源検索装置は、さらに、
前記ファセット中のいずれのノードにも属さない情報資源を、前記第3のスコアの大きい順にソートして一覧表示する第3の表示出力欄を具備する
ことを特徴とする請求項5に記載の情報資源検索装置。

【請求項9】
 
前記情報資源に付与されるメタデータに基づいて、前記入力フリーワード又は加点用シソーラスキーワードに一致するメタデータを有する情報資源の集合である第1の情報資源群について、スコアを算出するとともに、前記加点用シソーラスキーワードが属するファセット内の他のノードに属するシソーラスキーワードに一致するメタデータを有する情報資源の集合である第2の情報資源群について、スコアを算出する処理部と、
スコアの大きい順にそれぞれソートされた前記第1の情報資源群と、前記第2の情報資源群とを、表示画面上区別可能に一覧表示する出力部とを具備する
ことを特徴とする請求項1ないし8に記載の情報資源検索装置。

【請求項10】
 
メタデータ記憶部と、シソーラスキーワード入力部と、フリーワード入力部と、第1のスコア算出部と、第2のスコア算出部と、スコア合算部と、検索結果出力部と、更新出力部とを備える情報資源検索装置により実行される情報資源検索方法であって、
前記メタデータ記憶部により、情報資源に付与されるメタデータであって、該メタデータは、前記情報資源ごとに、シソーラス上のファセット内のノード名を記述するシソーラスキーワードと、前記情報資源内に記述されたフリーワード及びその重要度の対とを含むメタデータを記憶するステップと、
前記シソーラスキーワード入力部により、異なる複数のファセットに属するシソーラスキーワードを木構造上で同時に選択入力可能に表示し、かつ現在指定されているファセット及びシソーラスキーワードを表示すると共に、前記情報資源を検索するための加点用シソーラスキーワードを選択入力するステップと、
前記フリーワード入力部により、前記情報資源を検索するための入力フリーワードを入力するステップと、
前記第1のスコア算出部により、前記入力フリーワードと一致する又は類似する前記フリーワードを前記メタデータに含む情報資源について、前記一致する又は類似するフリーワードと対をなす重要度に基づいて、第1のスコアを算出し、該第1のスコアを保持する処理を全ての検索対象資源について実行するステップと、
前記第2のスコア算出部により、前記加点用シソーラスキーワードと一致する前記シソーラスキーワード、又は前記加点用シソーラスキーワードの属するファセットの木構造上前記一致するシソーラスキーワードの下位ノードに属するシソーラスキーワードを前記メタデータに含む情報資源について、第2のスコアを算出すると共に、前記ファセット内のその他のノードに属するシソーラスキーワードを前記メタデータに含む情報資源について、前記第2のスコアに前記木構造上の距離に応じた重みを乗じて第2のスコアを算出し、該第2のスコアを保持する処理を全ての検索対象資源について実行するステップと、
前記スコア合算部により、情報資源ごとに、前記第1のスコアと前記第2のスコアとを合算して第3のスコアを得るステップと、
前記第3のスコアの大きい順にソートされた情報資源を検索結果として一覧表示することにより、選択入力された前記加点用シソーラスキーワード又は前記入力フリーワードのいずれかと一致するシソーラスキーワード又はフリーワードを含むメタデータが付与されていない情報資源が表示出力され得るステップと
前記更新出力部により、前記検索結果の出力に引き続いて加点用シソーラスキーワードが選択入力されると、前記第2のスコアを算出して保持される第2のスコアに加算し、前記第3のスコアを再計算し、再計算された前記第3のスコアの大きい順に再ソートされた情報資源を更新表示するステップとを含む
ことを特徴とする情報資源検索方法。

【請求項11】
 
情報資源を検索するための入力フリーワードを入力するとともに、シソーラス上の複数のファセットの木構造を選択的に表示し、表示された前記木構造上のノードを選択させることにより、加点用シソーラスキーワードを入力するステップと、
前記情報資源に付与されるメタデータに基づいて、前記入力フリーワード又は加点用シソーラスキーワードに一致するメタデータを有する情報資源の集合である第1の情報資源群について、スコアを算出するとともに、前記加点用シソーラスキーワードが属するファセット内の他のノードに属するシソーラスキーワードに一致するメタデータを有する情報資源の集合である第2の情報資源群について、スコアを算出するステップと、
スコアの大きい順にそれぞれソートされた前記第1の情報資源群と、前記第2の情報資源群とを、表示画面上区別可能に一覧表示するステップとを含む
ことを特徴とする請求項10に記載の情報資源検索方法。

【請求項12】
 
情報資源検索処理を、メタデータ記憶部と、シソーラスキーワード入力部と、フリーワード入力部と、第1のスコア算出部と、第2のスコア算出部と、スコア合算部と、検索結果出力部と、更新出力部とを備える情報資源検索装置として動作するコンピュータに実行させるための情報資源検索プログラムであって、該プログラムは、前記コンピュータに、
前記メタデータ記憶部が、情報資源に付与されるメタデータであって、該メタデータは、前記情報資源ごとに、シソーラス上のファセット内のノード名を記述するシソーラスキーワードと、前記情報資源内に記述されたフリーワード及びその重要度の対とを含むメタデータを記憶するメタデータ記憶処理と、
前記シソーラスキーワード入力部が、異なる複数のファセットに属するシソーラスキーワードを木構造上で同時に選択入力可能に表示し、かつ現在指定されているファセット及びシソーラスキーワードを表示すると共に、前記情報資源を検索するための加点用シソーラスキーワードを選択入力するシソーラスキーワード入力処理と、
前記フリーワード入力部が、前記情報資源を検索するための入力フリーワードを入力するフリーワード入力処理と、
前記第1のスコア算出部が、前記入力フリーワードと一致する又は類似する前記フリーワードを前記メタデータに含む情報資源について、前記一致する又は類似するフリーワードと対をなす重要度に基づいて、第1のスコアを算出し、該第1のスコアを保持する処理を全ての検索対象情報資源について実行する第1のスコア算出処理と、
前記第2のスコア算出部が、前記加点用シソーラスキーワードと一致する前記シソーラスキーワード、又は前記加点用シソーラスキーワードの属するファセットの木構造上前記一致するシソーラスキーワードの下位ノードに属するシソーラスキーワードを前記メタデータに含む情報資源について、第2のスコアを算出すると共に、前記ファセット内のその他のノードに属するシソーラスキーワードを前記メタデータに含む情報資源について、前記第2のスコアに前記木構造上の距離に応じた重みを乗じて第2のスコアを算出し、該第2のスコアを保持する処理を全ての検索対象情報資源について実行する第2のスコア算出処理と、
前記スコア合算部が、情報資源ごとに、前記第1のスコアと前記第2のスコアとを合算して第3のスコアを得るスコア合算処理と、
前記検索結果出力部が、前記第3のスコアの大きい順にソートされた情報資源を検索結果として一覧表示することにより、選択入力された前記加点用シソーラスキーワード又は前記入力フリーワードのいずれかと一致するシソーラスキーワード又はフリーワードを含むメタデータが付与されていない情報資源が表示出力され得る検索結果出力処理と
前記更新出力部が、前記検索結果の出力に引き続いて加点用シソーラスキーワードが選択入力されると、前記第2のスコアを算出して保持される第2のスコアに加算し、前記第3のスコアを再計算し、再計算された前記第3のスコアの大きい順に再ソートされた情報資源を更新表示する更新出力処理とを含む処理を実行させるためのものである
ことを特徴とする情報資源検索プログラム。

【請求項13】
 
情報資源を検索するための入力フリーワードを入力するとともに、シソーラス上の複数のファセットの木構造を選択的に表示し、表示された前記木構造上のノードを選択させることにより、加点用シソーラスキーワードを入力する処理と、
前記情報資源に付与されるメタデータに基づいて、前記入力フリーワード又は加点用シソーラスキーワードに一致するメタデータを有する情報資源の集合である第1の情報資源群について、スコアを算出するとともに、前記加点用シソーラスキーワードが属するファセット内の他のノードに属するシソーラスキーワードに一致するメタデータを有する情報資源の集合である第2の情報資源群について、スコアを算出する処理と、
スコアの大きい順にそれぞれソートされた前記第1の情報資源群と、前記第2の情報資源群とを、表示画面上区別可能に一覧表示する処理とを含む処理とをさらに含む
ことを特徴とする請求項12に記載の情報資源検索プログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2005380311thum.jpg
State of application right Registered
(In Japanese)情報・システム研究機構 国立情報学研究所(NII)は、我が国唯一の情報系に特化した研究所です。NIIでは、外部資金による研究成果の社会還元を中心に、技術移転活動に積極的に取り組んでいます。上記の発明にライセンス対象や共同開発対象として関心をお持ちいただいた方は、国立情報学研究所 社会連携推進室までお気軽にお問合せください。


PAGE TOP

close
close
close
close
close
close
close