Top > Search of Japanese Patents > INFORMATION ANALYZER FOR ANALYZING TIME SERIES TEXT DATA INCLUDING TIME SERIES INFORMATION AND TEXT INFORMATION

INFORMATION ANALYZER FOR ANALYZING TIME SERIES TEXT DATA INCLUDING TIME SERIES INFORMATION AND TEXT INFORMATION commons meetings

Patent code P120007788
File No. H22-041
Posted date Jul 17, 2012
Application number P2011-023339
Publication number P2012-164097A
Patent number P5614687
Date of filing Feb 4, 2011
Date of publication of application Aug 30, 2012
Date of registration Sep 19, 2014
Inventor
  • (In Japanese)村田 真樹
  • (In Japanese)堀 さな子
  • (In Japanese)徳久 雅人
Applicant
  • Tottori University
Title INFORMATION ANALYZER FOR ANALYZING TIME SERIES TEXT DATA INCLUDING TIME SERIES INFORMATION AND TEXT INFORMATION commons meetings
Abstract PROBLEM TO BE SOLVED: To provide an analysis technology for efficiently and accurately grasping the transition state between keywords appearing in the literature.
SOLUTION: An information analyzer analyzes time series text data including time series information and text information. The information analyzer comprises a time series text data acquisition unit for acquiring plural different time series text data, an analysis object information acquisition unit for acquiring text information to be an analysis object, a co-occurrence information extraction unit for extracting co-occurrence information which is other than and congeneric to the analysis object information, and co-occurs therewith from the plural different time series text data, a time series coefficient application unit for applying a time series coefficient with time series weighting to time series text data other than the time series text data used as a reference in which the analysis object information appears first time, an aggregation unit for aggregating for each co-occurrence information the time series coefficient applied to plural time series text data including the co-occurrence information, a transition state analysis unit for analyzing the time series transition state between the analysis object information and the co-occurrence information based on aggregation results of the aggregation unit, and an output unit for outputting the transition state.
Outline of related art and contending technology (In Japanese)

研究者にとって、研究者や研究分野の変遷を知ることは必要不可欠である。これを知るためには一般的に、Webや検索エンジンを使用して情報を得る方法があげられるが,これは網羅的に収集するのが困難であり、かつ多大な労力を要する。

例えば、特許文献1には、キーワード毎の文書の発表件数の動向が一目で把握できるような形式で、キーワード毎の発表件数の推移を自動的に表示する技術が記載されている。

また、川中ら(非特許文献1)は、ソーシャルブックマークにおける概念を記述するタグを解析することで、概念の派性関係(概念の変遷情報)を自動的に抽出している。

松尾ら(非特許文献2)は、Web上の情報を用いて共起の強さから人物の関係性の強さを推定し、かつ「共著関係」や「同研究室関係」などの社会的関係性を判別し、その情報が示された人間関係ネットワークを作成している。

Adarら(非特許文献3)はブログ上での情報の流れについて、テキストの類似度、リンク、時間情報を元に解析するモデルを提案している。

丹羽ら(非特許文献4)はソーシャルブックマークにおけるユーザベースの共起度とドキュメントベースの共起度を比較することで、Synonymと呼ばれる同じ意味で用いられる語を共起度の高い精度で発見する手法を提案している。

Field of industrial application (In Japanese)

本発明は、時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置に関する。

Scope of claims (In Japanese)
【請求項1】
 
時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置であって、
複数の異なる時系列的テキストデータを取得する時系列的テキストデータ取得部と、
解析の対象となるテキスト情報を取得する解析対象情報取得部と、
前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出する共起情報抽出部と、
前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与する時系列係数付与部と、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計する集計部と、
前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析する変遷状態解析部と、
前記変遷状態を出力する出力部と、
を備え、
前記複数の異なる時系列的テキストデータから、前記共起情報を介して前記解析対象情報と間接的に共起する他の同属性の間接共起情報を抽出する間接共起情報抽出部と、
前記間接共起情報を含む時系列的テキストデータに対して、前記解析対象情報及び前記間接共起情報の関連性の強さに応じて関連係数を付与する関連係数付与部と、
をさらに備え、
前記集計部が、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計する直接集計部と、
前記間接共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数及び前記関連係数を統合して得られる統合指標を前記間接共起情報ごとに集計する間接集計部と、
を有し、
前記変遷状態解析部が、前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報及び前記間接共起情報との間の時系列的な変遷状態を解析可能に構成されている、
情報解析装置。

【請求項2】
 
請求項1に記載の情報解析装置において、
前記時系列係数付与部が、前記他の時系列的テキストデータの出現順序に応じて重み付けされた時系列係数を付与する順序判定部を有する、
情報解析装置。

【請求項3】
 
請求項1に記載の情報解析装置において、
前記時系列係数付与部が、前記他の時系列的テキストデータと初出した時系列的テキストデータとの時間的距離に応じて重み付けされた前記時系列係数を付与する時間距離判定部を有する、
情報解析装置。

【請求項4】
 
請求項1~3のいずれかに記載の情報解析装置において、
前記時系列係数付与部が、前記重み付けを解析対象情報が初出した基準から離れるに連れて重みが漸減し、互いに異なる重みの合計値が有限に収まるように行う係数計算部を有する、
情報解析装置。

【請求項5】
 
請求項1に記載の情報解析装置において、
前記関連係数付与部が、前記共起情報を介して前記解析対象情報と間接的に共起する複数の種類の間接共起情報の相対的な出現頻度に応じて関連係数を算出する出現頻度算出部を有する、
情報解析装置。

【請求項6】
 
請求項1~5のいずれかに記載の情報解析装置において、
前記時系列係数付与部が、あらかじめ互いの変遷関係の分かっている前記解析対象情報及び前記対応情報を含む前記複数の異なる時系列的テキストデータを機械学習して、解析対象情報が初出した基準から離れるに連れて重みが漸減し、互いに異なる重みの合計値が有限に収まるようにパラメータを算出する機械学習部を有する、
情報解析装置。

【請求項7】
 
請求項1~6のいずれかに記載の情報解析装置において、
前記解析対象情報が、著者を特定するための情報を含む著者情報である、
情報解析装置。

【請求項8】
 
請求項1~6のいずれかに記載の情報解析装置において、
前記解析対象情報が、タイトルのキーワードである、
情報解析装置。

【請求項9】
 
請求項1~8のいずれかに記載の情報解析装置において、
前記変遷状態解析部が、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を木構造で表示するためのデータを生成するように構成されている、
情報解析装置。

【請求項10】
 
請求項1~9のいずれかに記載の情報解析装置を用いて時系列情報とテキスト情報とを含む時系列的テキストデータを解析する方法であって、
前記時系列的テキストデータ取得部が、複数の異なる時系列的テキストデータを取得するステップと、
前記解析対象情報取得部が、解析の対象となるテキスト情報を取得するステップと、
前記共起情報抽出部が、前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出するステップと、
前記時系列係数付与部が、前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与するステップと、
前記集計部が、前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記変遷状態解析部が、前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析するステップと、
前記出力部が、前記変遷状態を出力するステップと、
前記間接共起情報抽出部が、前記複数の異なる時系列的テキストデータから、前記共起情報を介して前記解析対象情報と間接的に共起する他の同属性の間接共起情報を抽出するステップと、
前記関連係数付与部が、前記間接共起情報を含む時系列的テキストデータに対して、前記解析対象情報及び前記間接共起情報の関連性の強さに応じて関連係数を付与するステップと、
を含み、
前記集計部が、前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記集計部が、前記間接共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数及び前記関連係数を統合して得られる統合指標を前記間接共起情報ごとに集計するステップと、
をさらに含み、
前記変遷状態を解析するステップが、前記集計するステップによって得られる集計結果に基づいて、前記解析対象情報と前記共起情報及び前記間接共起情報との間の時系列的な変遷状態を解析するステップを含む、
情報解析方法。

【請求項11】
 
時系列情報とテキスト情報とを含む時系列的テキストデータを解析するためのプログラムであって、
複数の異なる時系列的テキストデータを取得するステップと、
解析の対象となるテキスト情報を取得するステップと、
前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出するステップと、
前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与するステップと、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記集計するステップによって得られる集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析するステップと、
前記変遷状態を出力するステップと、
前記複数の異なる時系列的テキストデータから、前記共起情報を介して前記解析対象情報と間接的に共起する他の同属性の間接共起情報を抽出するステップと、
前記間接共起情報を含む時系列的テキストデータに対して、前記解析対象情報及び前記間接共起情報の関連性の強さに応じて関連係数を付与するステップと、
を含み、
前記集計するステップが、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記間接共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数及び前記関連係数を統合して得られる統合指標を前記間接共起情報ごとに集計するステップと、
を含み、
前記変遷状態を解析するステップが、前記集計するステップによって得られる集計結果に基づいて、前記解析対象情報と前記共起情報及び前記間接共起情報との間の時系列的な変遷状態を解析するステップを含む、
をコンピュータに実行させる、プログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2011023339thum.jpg
State of application right Registered
Reference ( R and D project ) (In Japanese) 時系列データからの派生情報の取り出し
Please contact us by E-mail or facsimile if you have any interests on this patent.


PAGE TOP

close
close
close
close
close
close
close