TOP > 中国の大学の特許 > 清華大学の特許一覧 > 検索支援システム、検索支援方法及び検索支援プログラム

検索支援システム、検索支援方法及び検索支援プログラム

国内特許コード P150011702
掲載日 2015年3月30日
出願番号 特願2010-152556
公開番号 特開2011-221979
登録番号 特許第5427127号
出願日 平成22年7月3日(2010.7.3)
公開日 平成23年11月4日(2011.11.4)
登録日 平成25年12月6日(2013.12.6)
優先権データ
  • 201010140447.0 (2010.4.2) CN
発明者
  • 李 春平
  • 王 益▲びん▼
  • 阿部 昌平
出願人
  • 清華大学
  • 株式会社野村総合研究所
発明の名称 検索支援システム、検索支援方法及び検索支援プログラム
発明の概要 【課題】ユーザの検索意図に合致したWebページを効率的に提示する。
【解決手段】検索キーワードを検索サーバ28に送信して検索を依頼する手段と、送信された検索結果リストをクライアント端末24に送信し、基準Webページの選択を促す手段と、この基準Webページ中のテキストを形態素単位に分解し、名詞をキーワードとして抽出する手段と、各抽出キーワードと検索キーワードを検索サーバ28に送信して検索を依頼する手段と、検索結果リストの中から、それぞれページランク順に上位20件のWebページを類似候補ページとして抽出する手段と、各検索式に係る類似候補ページ間における類似度を算出する手段と、類似度の高い方から20件の検索式に係る抽出キーワードを重要語と認定する手段と、全類似候補ページ中で重要語を3種以上含むものを類似ページと認定する手段と、類似ページリスト画面をクライアント端末24に送信する手段を備える。
【選択図】図1
従来技術、競合技術の概要



今日、Google(登録商標)やYahoo!(登録商標)といったインターネット上の検索サイトに検索キーワードを送信することにより、誰でもが手軽に様々な情報を入手することができる。

例えば、ある銘柄の株式の購入を検討している一般投資家が、当該銘柄の企業名を検索サイトの検索窓に入力して検索をリクエストすると、当該企業に関するWebページのリストが検索結果として送信され、Webブラウザ上に表示される。

これに対し投資家は、ニュース記事やリリース記事、ブログ記事等を次々と閲覧し、当該企業の最近の動向をチェックする。

そして、新製品情報や不祥事情報など、株価に影響を及ぼすような記事を見出した場合には、当該記事中に用いられている適当なキーワードを企業名に追加し、さらに検索を続けることで、必要な情報を集中的に収集することが可能となる。

【非特許文献1】

oogle インターネットURL:http://www.google.co.jp/ 検索日:平成22年1月16日

【非特許文献2】

ahoo! JAPAN インターネットURL:http://www.yahoo.co.jp/ 検索日:平成22年1月16日

産業上の利用分野



この発明は検索支援システム、検索支援方法及び検索支援プログラムに係り、特に、ユーザの意図に合致したWebページを効率的に抽出する技術に関する。

特許請求の範囲 【請求項1】
クライアント端末から送信された検索キーワードを検索サーバに送信し、検索を依頼する手段と、
上記検索サーバから送信された検索結果リストが記載された画面を上記クライアント端末に送信し、基準Webページの選択を促す手段と、
上記クライアント端末から基準Webページの選択情報を受信した場合に、この基準Webページ中のテキストを形態素単位に分解し、特定の品詞に係るキーワードを抽出する手段と、
これらの抽出キーワードと上記検索キーワードとをAND条件で繋いだ検索式を抽出キーワード毎に生成し、これらの検索式を上記検索サーバに送信して検索を依頼する手段と、
検索サーバから送信された各検索式に係る検索結果リストの中から、それぞれページランク順に上位所定件数のWebページを類似候補ページとして抽出する手段と、
各検索式に係る類似候補ページ間における類似度を算出するページ間類似度算出手段と、
類似度の高い所定件数の検索式に係る抽出キーワードを、重要語と認定する手段と、
上記の全類似候補ページの中で、上記重要語を所定種類以上含むものを類似ページと認定する手段と、
この類似ページのリストが記載された画面を生成し、上記クライアント端末に送信する手段と、
を備えたことを特徴とする検索支援システム。

【請求項2】
上記ページ間類似度算出手段は、
各検索式に係る類似候補ページ中の一の類似候補ページを比較対象ページとして設定する処理と、この比較対象ページと残りの類似候補ページ間の類似度を個別に算出する処理と、各算出結果の中で類似度が上位所定数のものを抽出し、これらの類似度の平均値を隣接値として算出する処理を、当該検索式に係る全ての類似候補ページが比較対象ページとして設定されるまで繰り返した後、
得られた隣接値の中で最も大きな値の隣接値を当該検索式に係るページ間類似度と認定することを特徴とする請求項1に記載の検索支援システム。

【請求項3】
上記ページ間類似度算出手段は、
上記の比較対象ページと、他の類似候補ページを形態素単位に分解し、各ページから所定の品詞に係る形態素を抽出する処理と、抽出された各形態素のTF-IDF値を算出する処理と、この各形態素のTF-IDF値に基づいて各ページをベクトル化する処理と、比較対象ページのベクトルと他の類似候補ページのベクトルとの内積値を、両ページ間の類似度として算出する処理を実行することを特徴とする請求項2に記載の検索支援システム。

【請求項4】
クライアント端末から送信された検索キーワードを検索サーバに送信し、検索を依頼するステップと、
上記検索サーバから送信された検索結果リストが記載された画面を上記クライアント端末に送信し、基準Webページの選択を促すステップと、
上記クライアント端末から基準Webページの選択情報を受信した場合に、この基準Webページ中のテキストを形態素単位に分解し、特定の品詞に係るキーワードを抽出するステップと、
これらの抽出キーワードと上記検索キーワードとをAND条件で繋いだ検索式を抽出キーワード毎に生成し、これらの検索式を上記検索サーバに送信して検索を依頼するステップと、
検索サーバから送信された各検索式に係る検索結果リストの中から、それぞれページランク順に上位所定件数のWebページを類似候補ページとして抽出するステップと、
各検索式に係る類似候補ページ間における類似度を算出するページ間類似度算出ステップと、
類似度の高い所定件数の検索式に係る抽出キーワードを、重要語と認定するステップと、
上記の全類似候補ページの中で、上記重要語を所定種類以上含むものを類似ページと認定するステップと、
この類似ページのリストが記載された画面を生成し、上記クライアント端末に送信するステップと、
からなることを特徴とする検索支援方法。

【請求項5】
コンピュータを、
クライアント端末から送信された検索キーワードを検索サーバに送信し、検索を依頼する手段、
上記検索サーバから送信された検索結果リストが記載された画面を上記クライアント端末に送信し、基準Webページの選択を促す手段、
上記クライアント端末から基準Webページの選択情報を受信した場合に、この基準Webページ中のテキストを形態素単位に分解し、特定の品詞に係るキーワードを抽出する手段、
これらの抽出キーワードと上記検索キーワードとをAND条件で繋いだ検索式を抽出キーワード毎に生成し、これらの検索式を上記検索サーバに送信して検索を依頼する手段、
検索サーバから送信された各検索式に係る検索結果リストの中から、それぞれページランク順に上位所定件数のWebページを類似候補ページとして抽出する手段、
各検索式に係る類似候補ページ間における類似度を算出するページ間類似度算出手段、
類似度の高い所定件数の検索式に係る抽出キーワードを、重要語と認定する手段、
上記の全類似候補ページの中で、上記重要語を所定種類以上含むものを類似ページと認定する手段、
この類似ページのリストが記載された画面を生成し、上記クライアント端末に送信する手段、
として機能させることを特徴とする検索支援プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2010152556thum.jpg
出願権利状態 登録
分野
  • 物理学
※ 特許の内容に興味を持たれた方は、下記問合せ先にご相談下さい。


PAGE TOP

close
close
close
close
close
close