TOP > 技術シーズ検索 > 検索装置及び検索方法

検索装置及び検索方法 新技術説明会

シーズコード S090004383
掲載日 2010年3月30日
研究者
  • 安川 美智子
  • 横尾 英俊
  • 内山 智文
技術名称 検索装置及び検索方法 新技術説明会
技術概要 ユーザが検索語を入力すると、検索クエリログデータベース12から、検索語に関連する複数の関連語を示す関連語データを取得する。入力された検索語に対応してメタサーチを行い、Web検索エンジン14から、Web検索結果データとキャッシュデータを取得し、キャッシュデータデータベース16に格納する。キャッシュデータからテキストデータを抽出し、形態素解析器20のユーザ辞書に対して、形態素解析結果から、雑音を除去し、検索語の周辺の名詞及び未知語のみを抽出する。複数のWebページに対する単語頻度行列を作成し、作成された単語頻度行列における関連語と一致する単語の列要素IDを抽出し、関連語にのみ注目した関連語同士の類似度を算出する。関連語のクラスタリングを行い、所定数の関連語クラスタを生成し、生成された関連語クラスタの重み付けを行い、重みに基づいて関連語クラスタを順序付けて、関連語クラスタをソートする。関連語クラスタとWeb検索データが示すWebページとの対応付けを行い、ソートされた関連語クラスタのリストを検索結果として表示する。
画像

※ 画像をクリックすると拡大します。

S090004383_01SUM.gif
研究分野
  • 検索技術
展開可能なシーズ ユーザにとって分かりやすいクラスタにより検索結果を表示することができる検索装置及び検索方法を提供する。
検索語に適合する各文書データにおける検索語に関連する複数の関連語の各々の出現頻度に基づいて関連語をクラスタリングした結果を、検索結果として表示することにより、ユーザによって入力される検索語に関係のない単語を除外して生成した関連語クラスタを検索結果として表示するため、ユーザにとって分かりやすいクラスタにより検索結果を表示することができる。
用途利用分野 検索装置、検索エンジン
出願特許   特許 国際特許分類(IPC)
( 1 ) 国立大学法人群馬大学, . 安川 美智子, 横尾 英俊, 内山 智文, . 検索装置及びプログラム. 特開2008-027207. 2008-02-07
  • G06F  17/30     

PAGE TOP