TOP > 国内特許検索 > 情報取得装置、そのプログラム及び方法

情報取得装置、そのプログラム及び方法 新技術説明会

国内特許コード P09A014846
掲載日 2009年11月20日
出願番号 特願2007-085469
公開番号 特開2008-243024
登録番号 特許第4967133号
出願日 平成19年3月28日(2007.3.28)
公開日 平成20年10月9日(2008.10.9)
登録日 平成24年4月13日(2012.4.13)
発明者
  • 野村 浩郷
出願人
  • 国立大学法人九州工業大学
発明の名称 情報取得装置、そのプログラム及び方法 新技術説明会
発明の概要

【課題】続報情報を発見する検索装置において関連した情報を比較、整理して効率よく必要な情報を取得し、利用者の要望に沿った形式で出力を行う情報取得装置の提供する。
【解決手段】情報取得装置は、重み付けされた検索情報の特徴ベクトルを作成する手段21と、全検索情報の特徴ベクトルの組み合わせの類似度を計算する手段216と、前記情報間類似度計算によって得られた数値の類似度行列を計算する手段217と、前記類似度計算結果から特徴ベクトルの最大固有値の固有ベクトルを求める手段218と、前記検索情報の問い合わせ内容の質問ベクトルを作成する手段219と、前記特徴ベクトルと質問ベクトルの余弦の計算値に固有ベクトルの数値を乗じて求められる関連情報の検索順位22を決定する手段と、前記検索順位の決定された関連情報の内容を統合して出力する手段40とから構成される。
【選択図】図2

従来技術、競合技術の概要


Web検索を含めた多くの情報検索システムでは、キーワード検索を元にしており、ユーザは検索キーワードをシステムに与えることで検索結果を得る。単純な単語のマッチングのみを条件として検索を行うために、検索結果が膨大になることが多く、またノイズも多い。現状ではユーザは膨大な量で、しかも玉石混淆の検索結果から要求に合致したテキストを探さなければならない。そのため、ユーザが検索結果から合致した情報を得るためには多大な労力を必要とする。また、キーワード検索の途中で関連する情報を発見したいという状況も頻繁に発生することがある。さらに、近年情報機器の普及により様々な情報が電子化されており、大量の情報がいつでも閲覧できるようになった現在、その中から必要な情報を効率よく選ぶ作業は、情報の電子化が急速に進んでいる中、困難になっている。
そこで、複数のデータベースを検索して所望の情報を取得し、その情報をユーザの望む形式に編集・加工する情報編集・加工方法が、特開平9-185632号公報に開示されている。



背景技術の情報編集・加工方法は、遠隔にある少なくとも1つのデータベースが保有していると推定される目的情報の検索指示、検索した情報の編集加工指示、編集加工した情報の出力形態決定指示とを受け付ける第1の過程と、前記検索指示に基づいて前記少なくとも1つのデータベースを検索するコマンドを生成し、前記データベースを検索する第2の過程と、前記第2の過程により取得した少なくとも1つの目的情報に対して前記第1の過程の指示に従って、編集・加工を施す第3の過程と、前記第3の過程によって、編集・加工された目的情報に対して前記情報の出力形態決定指示に従って、所定の出力形態に変換し、視覚、聴覚または他の感覚に捉え得る方法によって出力する第4の過程よりなることを特徴とする。前記第3の過程は、前記第4の過程において表示する検索結果をユーザが指定した出力順にソートする。前記出力順として、情報の関連度順、情報発生時間順、または検索順のいずれかを用いるものである。

【特許文献1】特開平9-185632号公報

産業上の利用分野


関連内容の情報の検索とそれらを集約する情報取得装置に関する。

特許請求の範囲 【請求項1】
少なくとも1つの検索情報を取得している情報取得装置において、
重み付けされた検索情報の特徴ベクトルを作成する特徴ベクトル作成手段と、
全検索情報の特徴ベクトルの組み合わせの類似度を計算する情報間類似度計算手段と、
前記情報間類似度計算によって得られた数値の類似度行列を計算する類似度行列計算手段と、
前記類似度計算結果を数値解析し、特徴ベクトルの最大固有値の固有ベクトルを求める固有ベクトル作成手段と、
前記検索情報の問い合わせ内容の質問ベクトルを作成する質問ベクトル作成手段と、
前記特徴ベクトルと質問ベクトルの余弦の計算値に固有ベクトルの数値を乗じて求められる関連情報の検索順位を決定する検索順位決定手段と、
検索された情報の文中に含まれる品詞の係り受け関係を解析する係り受け解析手段と、
各文中の動詞を含む文節に係る文節中の名詞を抽出する名詞抽出手段と、
前記抽出された名詞の単体の名詞間の類似度S1及び名詞集合の類似度S2を計算する名詞集合間類似度比較計算手段と、
抽出された名詞の表示の一致する割合の類似度S3を計算する名詞表示一致割合計算手段と、
前記類似度S2に類似度S3を加えて文類似度Sを計算する文類似度計算手段と、
検索情報の文タイプによる選定を行う文タイプ選定手段と、
前記文類似度計算及び文タイプ選定された関連情報の内容を統合したもの、並びに、前記検索順位決定手段によりスコアリングされた検索結果を出力すると共に、前記検索結果の適否及び/又はパラメータの重み付けの度合いを入力するための入力フォームを出力する出力手段と、
前記入力フォームに入力された情報に基づいて、前記特徴ベクトル及び質問ベクトルを修正する修正手段とを備え、
前記検索順位決定手段が、前記修正手段にて修正された前記特徴ベクトル及び質問ベクトルに基づいて、再度前記関連情報の検索順位を決定し、前記出力手段が、前記検索順位決定手段によりスコアリングされた検索結果を、前記検索情報間の経時的な関連性を含めて出力することを特徴とする情報取得装置。

【請求項2】
前記請求項1に記載された情報取得装置において、
前記特徴ベクトル作成手段は、
検索情報の文の形態素解析を行う形態素解析手段と、
情報毎に単語とその単語の出現回数TFを計算するTF計算手段と、
全単語について文書頻度DF及びそのIDFを計算するIDF計算手段と、
各情報の各単語についてTF-IDF法を用いて単語重み付けを計算する単語重み計算手段と、
前記単語重み付けから各文書の特徴ベクトルを作成する特徴ベクトル作成手段とを備えることを特徴とする情報取得装置。

【請求項3】
少なくとも1つの検索情報を取得している情報取得装置としてコンピュータを機能させる情報取得プログラムにおいて、
重み付けされた検索情報の特徴ベクトルを作成する特徴ベクトル作成手段、
全検索情報の特徴ベクトルの組み合わせの類似度を計算する情報間類似度計算手段、
前記情報間類似度計算によって得られた数値の類似度行列を計算する類似度行列計算手段、
前記類似度計算結果を数値解析し、特徴ベクトルの最大固有値の固有ベクトルを求める固有ベクトル作成手段、
前記検索情報の問い合わせ内容の質問ベクトルを作成する質問ベクトル作成手段、
前記特徴ベクトルと質問ベクトルの余弦の計算値に固有ベクトルの数値を乗じて求められる関連情報の検索順位を決定する検索順位決定手段、
検索された情報の文中に含まれる品詞の係り受け関係を解析する係り受け解析手段、
各文中の動詞を含む文節に係る文節中の名詞を抽出する名詞抽出手段、
前記抽出された名詞の単体の名詞間の類似度S1及び名詞集合の類似度S2を計算する名詞集合間類似度比較計算手段、
抽出された名詞の表示の一致する割合の類似度S3を計算する名詞表示一致割合計算手段、
前記類似度S2に類似度S3を加えて文類似度Sを計算する文類似度計算手段、
検索情報の文タイプによる選定を行う文タイプ選定手段、
前記文類似度計算及び文タイプ選定された関連情報の内容を統合したもの、並びに、前記検索順位決定手段によりスコアリングされた検索結果を出力すると共に、前記検索結果の適否及び/又はパラメータの重み付けの度合いを入力するための入力フォームを出力する出力手段、
前記入力フォームに入力された情報に基づいて、前記特徴ベクトル及び質問ベクトルを修正する修正手段としてコンピュータを機能させ、
前記検索順位決定手段が、前記修正手段にて修正された前記特徴ベクトル及び質問ベクトルに基づいて、再度前記関連情報の検索順位を決定し、前記出力手段が、前記検索順位決定手段によりスコアリングされた検索結果を、前記検索情報間の経時的な関連性を含めて出力することを特徴とする情報取得プログラム。

【請求項4】
少なくとも1つの検索情報を取得している情報取得装置のコンピュータが
重み付けされた検索情報の特徴ベクトルを作成する特徴ベクトル作成ステップと、
全検索情報の特徴ベクトルの組み合わせの類似度を計算する情報間類似度計算ステップと、
前記情報間類似度計算によって得られた数値の類似度行列を計算する類似度行列計算ステップと、
前記類似度計算結果を数値解析し、特徴ベクトルの最大固有値の固有ベクトルを求める固有ベクトル作成ステップと、
前記検索情報の問い合わせ内容の質問ベクトルを作成する質問ベクトル作成ステップと、
前記特徴ベクトルと質問ベクトルの余弦の計算値に固有ベクトルの数値を乗じて求められる関連情報の検索順位を決定する検索順位決定ステップと、
検索された情報の文中に含まれる品詞の係り受け関係を解析する係り受け解析ステップと、
各文中の動詞を含む文節に係る文節中の名詞を抽出する名詞抽出ステップと、
前記抽出された名詞の単体の名詞間の類似度S1及び名詞集合の類似度S2を計算する名詞集合間類似度比較計算ステップと、
抽出された名詞の表示の一致する割合の類似度S3を計算する名詞表示一致割合計算ステップと、
前記類似度S2に類似度S3を加えて文類似度Sを計算する文類似度計算ステップと、
検索情報の文タイプによる選定を行う文タイプ選定ステップと、
前記文類似度計算及び文タイプ選定された関連情報の内容を統合したもの、並びに、前記検索順位決定手段によりスコアリングされた検索結果を出力すると共に、前記検索結果の適否及び/又はパラメータの重み付けの度合いを入力するための入力フォームを出力する出力ステップと、
前記入力フォームに入力された情報に基づいて、前記特徴ベクトル及び質問ベクトルを修正する修正ステップとを実行し、
前記検索順位決定ステップが、前記修正手段にて修正された前記特徴ベクトル及び質問ベクトルに基づいて、再度前記関連情報の検索順位を決定し、前記出力ステップが、前記検索順位決定手段によりスコアリングされた検索結果を、前記検索情報間の経時的な関連性を含めて出力することを特徴とする情報取得方法。
産業区分
  • 計算機応用
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2007085469thum.jpg
出願権利状態 権利存続中
詳細は、下記「問合せ先」まで直接お問い合わせください。


PAGE TOP

close
close
close
close
close
close
close