Top > Search of Japanese Patents > INFORMATION ACQUISITION DEVICE, PROGRAM THEREFOR AND METHOD

INFORMATION ACQUISITION DEVICE, PROGRAM THEREFOR AND METHOD meetings

Patent code P09A014846
Posted date Nov 20, 2009
Application number P2007-085469
Publication number P2008-243024A
Patent number P4967133
Date of filing Mar 28, 2007
Date of publication of application Oct 9, 2008
Date of registration Apr 13, 2012
Inventor
  • (In Japanese)野村 浩郷
Applicant
  • (In Japanese)国立大学法人九州工業大学
Title INFORMATION ACQUISITION DEVICE, PROGRAM THEREFOR AND METHOD meetings
Abstract PROBLEM TO BE SOLVED: To provide an information acquisition device comparing and organizing related information to efficiently acquire necessary information, and outputting it in a format fit for the demand of a user, in a retrieval device finding a follow-up information.
SOLUTION: This information acquisition device comprises: a mens 21 creating a characteristic vector of weighted retrieval information; a means 216 calculating similarity of a combination of the characteristic vectors of all the retrieval information; a means 217 calculating a similarity array of a numerical value obtained by the inter-information similarity calculation; a means 218 obtaining an eigenvector of a maximum eigenvalue of the characteristic vector from a similarity calculation result; a means 219 creating a question vector of inquiry contents of the retrieval information; a means determining retrieval order 22 of the related information obtained by multiplying a calculation value of a cosine between the question vector and the characteristic vector by a numerical value of the eigenvector; and a means 40 integrating and outputting contents of the related information having the determined retrieval order.
Outline of related art and contending technology (In Japanese)

Web検索を含めた多くの情報検索システムでは、キーワード検索を元にしており、ユーザは検索キーワードをシステムに与えることで検索結果を得る。単純な単語のマッチングのみを条件として検索を行うために、検索結果が膨大になることが多く、またノイズも多い。現状ではユーザは膨大な量で、しかも玉石混淆の検索結果から要求に合致したテキストを探さなければならない。そのため、ユーザが検索結果から合致した情報を得るためには多大な労力を必要とする。また、キーワード検索の途中で関連する情報を発見したいという状況も頻繁に発生することがある。さらに、近年情報機器の普及により様々な情報が電子化されており、大量の情報がいつでも閲覧できるようになった現在、その中から必要な情報を効率よく選ぶ作業は、情報の電子化が急速に進んでいる中、困難になっている。
そこで、複数のデータベースを検索して所望の情報を取得し、その情報をユーザの望む形式に編集・加工する情報編集・加工方法が、特開平9-185632号公報に開示されている。

背景技術の情報編集・加工方法は、遠隔にある少なくとも1つのデータベースが保有していると推定される目的情報の検索指示、検索した情報の編集加工指示、編集加工した情報の出力形態決定指示とを受け付ける第1の過程と、前記検索指示に基づいて前記少なくとも1つのデータベースを検索するコマンドを生成し、前記データベースを検索する第2の過程と、前記第2の過程により取得した少なくとも1つの目的情報に対して前記第1の過程の指示に従って、編集・加工を施す第3の過程と、前記第3の過程によって、編集・加工された目的情報に対して前記情報の出力形態決定指示に従って、所定の出力形態に変換し、視覚、聴覚または他の感覚に捉え得る方法によって出力する第4の過程よりなることを特徴とする。前記第3の過程は、前記第4の過程において表示する検索結果をユーザが指定した出力順にソートする。前記出力順として、情報の関連度順、情報発生時間順、または検索順のいずれかを用いるものである。
【特許文献1】
特開平9-185632号公報

Field of industrial application (In Japanese)

関連内容の情報の検索とそれらを集約する情報取得装置に関する。

Scope of claims (In Japanese)
【請求項1】
 
少なくとも1つの検索情報を取得している情報取得装置において、
重み付けされた検索情報の特徴ベクトルを作成する特徴ベクトル作成手段と、
全検索情報の特徴ベクトルの組み合わせの類似度を計算する情報間類似度計算手段と、
前記情報間類似度計算によって得られた数値の類似度行列を計算する類似度行列計算手段と、
前記類似度計算結果を数値解析し、特徴ベクトルの最大固有値の固有ベクトルを求める固有ベクトル作成手段と、
前記検索情報の問い合わせ内容の質問ベクトルを作成する質問ベクトル作成手段と、
前記特徴ベクトルと質問ベクトルの余弦の計算値に固有ベクトルの数値を乗じて求められる関連情報の検索順位を決定する検索順位決定手段と、
検索された情報の文中に含まれる品詞の係り受け関係を解析する係り受け解析手段と、
各文中の動詞を含む文節に係る文節中の名詞を抽出する名詞抽出手段と、
前記抽出された名詞の単体の名詞間の類似度S1及び名詞集合の類似度S2を計算する名詞集合間類似度比較計算手段と、
抽出された名詞の表示の一致する割合の類似度S3を計算する名詞表示一致割合計算手段と、
前記類似度S2に類似度S3を加えて文類似度Sを計算する文類似度計算手段と、
検索情報の文タイプによる選定を行う文タイプ選定手段と、
前記文類似度計算及び文タイプ選定された関連情報の内容を統合したもの、並びに、前記検索順位決定手段によりスコアリングされた検索結果を出力すると共に、前記検索結果の適否及び/又はパラメータの重み付けの度合いを入力するための入力フォームを出力する出力手段と、
前記入力フォームに入力された情報に基づいて、前記特徴ベクトル及び質問ベクトルを修正する修正手段とを備え、
前記検索順位決定手段が、前記修正手段にて修正された前記特徴ベクトル及び質問ベクトルに基づいて、再度前記関連情報の検索順位を決定し、前記出力手段が、前記検索順位決定手段によりスコアリングされた検索結果を、前記検索情報間の経時的な関連性を含めて出力することを特徴とする情報取得装置。

【請求項2】
 
前記請求項1に記載された情報取得装置において、
前記特徴ベクトル作成手段は、
検索情報の文の形態素解析を行う形態素解析手段と、
情報毎に単語とその単語の出現回数TFを計算するTF計算手段と、
全単語について文書頻度DF及びそのIDFを計算するIDF計算手段と、
各情報の各単語についてTF-IDF法を用いて単語重み付けを計算する単語重み計算手段と、
前記単語重み付けから各文書の特徴ベクトルを作成する特徴ベクトル作成手段とを備えることを特徴とする情報取得装置。

【請求項3】
 
少なくとも1つの検索情報を取得している情報取得装置としてコンピュータを機能させる情報取得プログラムにおいて、
重み付けされた検索情報の特徴ベクトルを作成する特徴ベクトル作成手段、
全検索情報の特徴ベクトルの組み合わせの類似度を計算する情報間類似度計算手段、
前記情報間類似度計算によって得られた数値の類似度行列を計算する類似度行列計算手段、
前記類似度計算結果を数値解析し、特徴ベクトルの最大固有値の固有ベクトルを求める固有ベクトル作成手段、
前記検索情報の問い合わせ内容の質問ベクトルを作成する質問ベクトル作成手段、
前記特徴ベクトルと質問ベクトルの余弦の計算値に固有ベクトルの数値を乗じて求められる関連情報の検索順位を決定する検索順位決定手段、
検索された情報の文中に含まれる品詞の係り受け関係を解析する係り受け解析手段、
各文中の動詞を含む文節に係る文節中の名詞を抽出する名詞抽出手段、
前記抽出された名詞の単体の名詞間の類似度S1及び名詞集合の類似度S2を計算する名詞集合間類似度比較計算手段、
抽出された名詞の表示の一致する割合の類似度S3を計算する名詞表示一致割合計算手段、
前記類似度S2に類似度S3を加えて文類似度Sを計算する文類似度計算手段、
検索情報の文タイプによる選定を行う文タイプ選定手段、
前記文類似度計算及び文タイプ選定された関連情報の内容を統合したもの、並びに、前記検索順位決定手段によりスコアリングされた検索結果を出力すると共に、前記検索結果の適否及び/又はパラメータの重み付けの度合いを入力するための入力フォームを出力する出力手段、
前記入力フォームに入力された情報に基づいて、前記特徴ベクトル及び質問ベクトルを修正する修正手段としてコンピュータを機能させ、
前記検索順位決定手段が、前記修正手段にて修正された前記特徴ベクトル及び質問ベクトルに基づいて、再度前記関連情報の検索順位を決定し、前記出力手段が、前記検索順位決定手段によりスコアリングされた検索結果を、前記検索情報間の経時的な関連性を含めて出力することを特徴とする情報取得プログラム。

【請求項4】
 
少なくとも1つの検索情報を取得している情報取得装置のコンピュータが
重み付けされた検索情報の特徴ベクトルを作成する特徴ベクトル作成ステップと、
全検索情報の特徴ベクトルの組み合わせの類似度を計算する情報間類似度計算ステップと、
前記情報間類似度計算によって得られた数値の類似度行列を計算する類似度行列計算ステップと、
前記類似度計算結果を数値解析し、特徴ベクトルの最大固有値の固有ベクトルを求める固有ベクトル作成ステップと、
前記検索情報の問い合わせ内容の質問ベクトルを作成する質問ベクトル作成ステップと、
前記特徴ベクトルと質問ベクトルの余弦の計算値に固有ベクトルの数値を乗じて求められる関連情報の検索順位を決定する検索順位決定ステップと、
検索された情報の文中に含まれる品詞の係り受け関係を解析する係り受け解析ステップと、
各文中の動詞を含む文節に係る文節中の名詞を抽出する名詞抽出ステップと、
前記抽出された名詞の単体の名詞間の類似度S1及び名詞集合の類似度S2を計算する名詞集合間類似度比較計算ステップと、
抽出された名詞の表示の一致する割合の類似度S3を計算する名詞表示一致割合計算ステップと、
前記類似度S2に類似度S3を加えて文類似度Sを計算する文類似度計算ステップと、
検索情報の文タイプによる選定を行う文タイプ選定ステップと、
前記文類似度計算及び文タイプ選定された関連情報の内容を統合したもの、並びに、前記検索順位決定手段によりスコアリングされた検索結果を出力すると共に、前記検索結果の適否及び/又はパラメータの重み付けの度合いを入力するための入力フォームを出力する出力ステップと、
前記入力フォームに入力された情報に基づいて、前記特徴ベクトル及び質問ベクトルを修正する修正ステップとを実行し、
前記検索順位決定ステップが、前記修正手段にて修正された前記特徴ベクトル及び質問ベクトルに基づいて、再度前記関連情報の検索順位を決定し、前記出力ステップが、前記検索順位決定手段によりスコアリングされた検索結果を、前記検索情報間の経時的な関連性を含めて出力することを特徴とする情報取得方法。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2007085469thum.jpg
State of application right Registered
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close