Top > Search Technology seeds > (In Japanese)検索装置及び検索方法

(In Japanese)検索装置及び検索方法 meetings

Seeds code S090004383
Posted date Mar 30, 2010
Researchers
  • (In Japanese)安川 美智子
  • (In Japanese)横尾 英俊
  • (In Japanese)内山 智文
Name of technology (In Japanese)検索装置及び検索方法 meetings
Technology summary (In Japanese)ユーザが検索語を入力すると、検索クエリログデータベース12から、検索語に関連する複数の関連語を示す関連語データを取得する。入力された検索語に対応してメタサーチを行い、Web検索エンジン14から、Web検索結果データとキャッシュデータを取得し、キャッシュデータデータベース16に格納する。キャッシュデータからテキストデータを抽出し、形態素解析器20のユーザ辞書に対して、形態素解析結果から、雑音を除去し、検索語の周辺の名詞及び未知語のみを抽出する。複数のWebページに対する単語頻度行列を作成し、作成された単語頻度行列における関連語と一致する単語の列要素IDを抽出し、関連語にのみ注目した関連語同士の類似度を算出する。関連語のクラスタリングを行い、所定数の関連語クラスタを生成し、生成された関連語クラスタの重み付けを行い、重みに基づいて関連語クラスタを順序付けて、関連語クラスタをソートする。関連語クラスタとWeb検索データが示すWebページとの対応付けを行い、ソートされた関連語クラスタのリストを検索結果として表示する。
Drawing

※Click image to enlarge.

S090004383_01SUM.gif
Research field
  • Retrieval technology
Seeds that can be deployed (In Japanese)ユーザにとって分かりやすいクラスタにより検索結果を表示することができる検索装置及び検索方法を提供する。
検索語に適合する各文書データにおける検索語に関連する複数の関連語の各々の出現頻度に基づいて関連語をクラスタリングした結果を、検索結果として表示することにより、ユーザによって入力される検索語に関係のない単語を除外して生成した関連語クラスタを検索結果として表示するため、ユーザにとって分かりやすいクラスタにより検索結果を表示することができる。
Usage Use field (In Japanese)検索装置、検索エンジン
Application patent   patent IPC(International Patent Classification)
( 1 ) (In Japanese)国立大学法人群馬大学, . (In Japanese)安川 美智子, 横尾 英俊, 内山 智文, . RETRIEVAL SYSTEM AND RETRIEVAL METHOD. P2008-027207A. Feb 7, 2008
  • G06F  17/30     

PAGE TOP