TOP > 国内特許検索 > 時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置

時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置 コモンズ 新技術説明会

国内特許コード P120007788
整理番号 H22-041
掲載日 2012年7月17日
出願番号 特願2011-023339
公開番号 特開2012-164097
登録番号 特許第5614687号
出願日 平成23年2月4日(2011.2.4)
公開日 平成24年8月30日(2012.8.30)
登録日 平成26年9月19日(2014.9.19)
発明者
  • 村田 真樹
  • 堀 さな子
  • 徳久 雅人
出願人
  • 国立大学法人鳥取大学
発明の名称 時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置 コモンズ 新技術説明会
発明の概要 【課題】文献に出現するキーワード同士の変遷状態を効率及び精度よく把握するための解析技術を提供する。
【解決手段】時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置であって、複数の異なる時系列的テキストデータを取得する時系列的テキストデータ取得部と、解析の対象となるテキスト情報を取得する解析対象情報取得部と、前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出する共起情報抽出部と、前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与する時系列係数付与部と、前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計する集計部と、前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析する変遷状態解析部と、前記変遷状態を出力する出力部と、を備える、情報解析装置。
【選択図】図1
従来技術、競合技術の概要



研究者にとって、研究者や研究分野の変遷を知ることは必要不可欠である。これを知るためには一般的に、Webや検索エンジンを使用して情報を得る方法があげられるが,これは網羅的に収集するのが困難であり、かつ多大な労力を要する。





例えば、特許文献1には、キーワード毎の文書の発表件数の動向が一目で把握できるような形式で、キーワード毎の発表件数の推移を自動的に表示する技術が記載されている。





また、川中ら(非特許文献1)は、ソーシャルブックマークにおける概念を記述するタグを解析することで、概念の派性関係(概念の変遷情報)を自動的に抽出している。





松尾ら(非特許文献2)は、Web上の情報を用いて共起の強さから人物の関係性の強さを推定し、かつ「共著関係」や「同研究室関係」などの社会的関係性を判別し、その情報が示された人間関係ネットワークを作成している。





Adarら(非特許文献3)はブログ上での情報の流れについて、テキストの類似度、リンク、時間情報を元に解析するモデルを提案している。





丹羽ら(非特許文献4)はソーシャルブックマークにおけるユーザベースの共起度とドキュメントベースの共起度を比較することで、Synonymと呼ばれる同じ意味で用いられる語を共起度の高い精度で発見する手法を提案している。

産業上の利用分野



本発明は、時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置に関する。

特許請求の範囲 【請求項1】
時系列情報とテキスト情報とを含む時系列的テキストデータを解析する情報解析装置であって、
複数の異なる時系列的テキストデータを取得する時系列的テキストデータ取得部と、
解析の対象となるテキスト情報を取得する解析対象情報取得部と、
前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出する共起情報抽出部と、
前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与する時系列係数付与部と、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計する集計部と、
前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析する変遷状態解析部と、
前記変遷状態を出力する出力部と、
を備え、
前記複数の異なる時系列的テキストデータから、前記共起情報を介して前記解析対象情報と間接的に共起する他の同属性の間接共起情報を抽出する間接共起情報抽出部と、
前記間接共起情報を含む時系列的テキストデータに対して、前記解析対象情報及び前記間接共起情報の関連性の強さに応じて関連係数を付与する関連係数付与部と、
をさらに備え、
前記集計部が、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計する直接集計部と、
前記間接共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数及び前記関連係数を統合して得られる統合指標を前記間接共起情報ごとに集計する間接集計部と、
を有し、
前記変遷状態解析部が、前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報及び前記間接共起情報との間の時系列的な変遷状態を解析可能に構成されている、
情報解析装置。

【請求項2】
請求項1に記載の情報解析装置において、
前記時系列係数付与部が、前記他の時系列的テキストデータの出現順序に応じて重み付けされた時系列係数を付与する順序判定部を有する、
情報解析装置。

【請求項3】
請求項1に記載の情報解析装置において、
前記時系列係数付与部が、前記他の時系列的テキストデータと初出した時系列的テキストデータとの時間的距離に応じて重み付けされた前記時系列係数を付与する時間距離判定部を有する、
情報解析装置。

【請求項4】
請求項1~3のいずれかに記載の情報解析装置において、
前記時系列係数付与部が、前記重み付けを解析対象情報が初出した基準から離れるに連れて重みが漸減し、互いに異なる重みの合計値が有限に収まるように行う係数計算部を有する、
情報解析装置。

【請求項5】
請求項に記載の情報解析装置において、
前記関連係数付与部が、前記共起情報を介して前記解析対象情報と間接的に共起する複数の種類の間接共起情報の相対的な出現頻度に応じて関連係数を算出する出現頻度算出部を有する、
情報解析装置。

【請求項6】
請求項1~のいずれかに記載の情報解析装置において、
前記時系列係数付与部が、あらかじめ互いの変遷関係の分かっている前記解析対象情報及び前記対応情報を含む前記複数の異なる時系列的テキストデータを機械学習して、解析対象情報が初出した基準から離れるに連れて重みが漸減し、互いに異なる重みの合計値が有限に収まるようにパラメータを算出する機械学習部を有する、
情報解析装置。

【請求項7】
請求項1~6のいずれかに記載の情報解析装置において、
前記解析対象情報が、著者を特定するための情報を含む著者情報である、
情報解析装置。

【請求項8】
請求項1~6のいずれかに記載の情報解析装置において、
前記解析対象情報が、タイトルのキーワードである、
情報解析装置。

【請求項9】
請求項1~8のいずれかに記載の情報解析装置において、
前記変遷状態解析部が、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を木構造で表示するためのデータを生成するように構成されている、
情報解析装置。

【請求項10】
請求項1~9のいずれかに記載の情報解析装置を用いて時系列情報とテキスト情報とを含む時系列的テキストデータを解析する方法であって、
前記時系列的テキストデータ取得部が、複数の異なる時系列的テキストデータを取得するステップと、
前記解析対象情報取得部が、解析の対象となるテキスト情報を取得するステップと、
前記共起情報抽出部が、前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出するステップと、
前記時系列係数付与部が、前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与するステップと、
前記集計部が、前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記変遷状態解析部が、前記集計部の集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析するステップと、
前記出力部が、前記変遷状態を出力するステップと、
前記間接共起情報抽出部が、前記複数の異なる時系列的テキストデータから、前記共起情報を介して前記解析対象情報と間接的に共起する他の同属性の間接共起情報を抽出するステップと、
前記関連係数付与部が、前記間接共起情報を含む時系列的テキストデータに対して、前記解析対象情報及び前記間接共起情報の関連性の強さに応じて関連係数を付与するステップと、
を含み、
前記集計部が、前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記集計部が、前記間接共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数及び前記関連係数を統合して得られる統合指標を前記間接共起情報ごとに集計するステップと、
をさらに含み、
前記変遷状態を解析するステップが、前記集計するステップによって得られる集計結果に基づいて、前記解析対象情報と前記共起情報及び前記間接共起情報との間の時系列的な変遷状態を解析するステップを含む、
情報解析方法。

【請求項11】
時系列情報とテキスト情報とを含む時系列的テキストデータを解析するためのプログラムであって、
複数の異なる時系列的テキストデータを取得するステップと、
解析の対象となるテキスト情報を取得するステップと、
前記複数の異なる時系列的テキストデータから、前記解析対象情報と共起する他の同属性の共起情報を抽出するステップと、
前記解析対象情報が初出した時系列的テキストデータを基準として、他の時系列的テキストデータに時系列的な重み付けをされた時系列係数を付与するステップと、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記集計するステップによって得られる集計結果に基づいて、前記解析対象情報と前記共起情報との間の時系列的な変遷状態を解析するステップと、
前記変遷状態を出力するステップと、
前記複数の異なる時系列的テキストデータから、前記共起情報を介して前記解析対象情報と間接的に共起する他の同属性の間接共起情報を抽出するステップと、
前記間接共起情報を含む時系列的テキストデータに対して、前記解析対象情報及び前記間接共起情報の関連性の強さに応じて関連係数を付与するステップと、
を含み、
前記集計するステップが、
前記共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数を前記共起情報ごとに集計するステップと、
前記間接共起情報を含む複数の時系列的テキストデータに付与されている前記時系列係数及び前記関連係数を統合して得られる統合指標を前記間接共起情報ごとに集計するステップと、
を含み、
前記変遷状態を解析するステップが、前記集計するステップによって得られる集計結果に基づいて、前記解析対象情報と前記共起情報及び前記間接共起情報との間の時系列的な変遷状態を解析するステップを含む、
をコンピュータに実行させる、プログラム。
産業区分
  • 演算制御装置
  • 記憶装置
  • 入出力装置
  • 計算機応用
  • その他情報処理
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2011023339thum.jpg
出願権利状態 登録
参考情報 (研究プロジェクト等) 時系列データからの派生情報の取り出し
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記「問合せ先」まで直接お問い合わせください。


PAGE TOP

close
close
close
close
close
close
close