TOP > 国内特許検索 > データ表示装置、データ表示方法及びデータ表示プログラム

データ表示装置、データ表示方法及びデータ表示プログラム コモンズ

国内特許コード P140010552
整理番号 05-94
掲載日 2014年5月21日
出願番号 特願2006-178922
公開番号 特開2008-009671
登録番号 特許第4931114号
出願日 平成18年6月29日(2006.6.29)
公開日 平成20年1月17日(2008.1.17)
登録日 平成24年2月24日(2012.2.24)
発明者
  • 村田 真樹
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 データ表示装置、データ表示方法及びデータ表示プログラム コモンズ
発明の概要 【課題】文書の大凡の内容を一見して把握できるような表示を行うことを可能とする。
【解決手段】キーワード抽出部11が書誌データDB17に蓄積されている文書群に含まれるキーワードを抽出し、頻度算出部12がキーワード抽出部11によって抽出された各キーワードの、書誌データDB17に蓄積されている文書群中に出現した頻度を算出し、データソート部14が書誌データDB17に蓄積されている各文書の文書データを抽出し、各キーワードの頻度がより高いキーワードを多く含む文書の順に、各文書の文書データをソートし、クラスタリング部13がキーワード抽出部11によって抽出された各キーワードをクラスターにクラスタリングし、表示部15がデータソート部14によってソートされた文書データに対応付けて、上記クラスター中のキーワードのうち当該ソートされた文書データが持つ文書が含むキーワードを、クラスター毎に画面表示する。
【選択図】図1
従来技術、競合技術の概要


従来から、文書中に含まれるキーワードの頻度を算出し、算出された頻度を表示する技術は存在した。



また、例えば、データを表形式で表示する技術について、下記の非特許文献1に記載されている。
【非特許文献1】
知りたい操作がすぐわかる 標準 Excel全機能Bible 2003,村田吉徳著,技術評論社,2004.2.1発行

産業上の利用分野



本発明は、データ表示技術に関し、特に、文書の大凡の内容を一見して把握できるような表示を行うデータ表示装置、データ表示方法及びデータ表示プログラムに関する。

特許請求の範囲 【請求項1】
データ表示装置であって、
複数の文書から構成される文書群中に含まれるキーワードを抽出するキーワード抽出手段と、
前記抽出された各キーワードの、前記文書群中に出現する頻度を算出する頻度算出手段と、
前記抽出されたキーワードを各キーワードが属するクラスターにクラスタリングするクラスタリング手段と、
前記算出された各キーワードの頻度の値の高いものから降順に前記各キーワードを並べ、各キーワードが文書に存在するとビット1、存在しないとビット0を割り当てて、各文書について前記並べた降順にキーワードの存否を表す複数ビットから成る2進数で表し、前記文書群を構成する各文書の文書データを頻度が高いキーワードを含む文書の順にするため、各文書を表す前記2進数の大きい数値の順にソートするデータソート手段と、
前記クラスターに属するキーワードのうちの前記文書群を構成する文書に含まれるキーワード、又は、各文書中における前記クラスターに属するキーワードの有無を示す情報を、前記各文書と前記クラスターとに対応付けて画面表示する表示手段とを備え
前記表示手段は、さらに、各クラスターに属するキーワードが出現する文書数について昇順又は降順に前記各クラスターを並び替えて画面表示するとともに、前記データソート手段でもとめた文書の順に画面表示する
ことを特徴とするデータ表示装置。

【請求項2】
請求項1に記載のデータ表示装置において、
前記クラスタリング手段は、前記各キーワードのベクトル空間上の位置を示す位置ベクトルを生成し、生成された前記位置ベクトルが示す前記各キーワードの位置情報に基づいて、前記各キーワードが属するクラスターを決定する
ことを特徴とするデータ表示装置。

【請求項3】
データ表示方法であって、
キーワード抽出手段で複数の文書から構成される文書群中に含まれるキーワードを抽出し、
頻度算出手段で前記抽出された各キーワードの、前記文書群中に出現する頻度を算出し、
クラスタリング手段で前記各キーワードを前記各キーワードが属するクラスターにクラスタリングし、
データソート手段で前記算出された各キーワードの頻度の値の高いものから降順に前記各キーワードを並べ、各キーワードが文書に存在するとビット1、存在しないとビット0を割り当てて、各文書について前記並べた降順にキーワードの存否を表す複数ビットから成る2進数で表し、前記文書群を構成する各文書の文書データを頻度が高いキーワードを含む文書の順にするため、各文書を表す前記2進数の大きい数値の順にソートし、
表示手段で前記クラスターに属するキーワードのうちの前記文書群を構成する文書に含まれるキーワード、又は、各文書中における前記クラスターに属するキーワードの有無を示す情報を、前記各文書と前記クラスターとに対応付けて画面表示し、
前記表示手段で、さらに、各クラスターに属するキーワードが出現する文書数について昇順又は降順に前記各クラスターを並び替えて画面表示するとともに、前記データソート手段でもとめた文書の順に画面表示する
ことを特徴とするデータ表示方法。

【請求項4】
データ表示プログラムであって、
コンピュータに、
複数の文書から構成される文書群中に含まれるキーワードを抽出する処理と、
前記抽出された各キーワードの、前記文書群中に出現する頻度を算出する処理と、
前記各キーワードを前記各キーワードが属するクラスターにクラスタリングする処理と、
前記算出された各キーワードの頻度の値の高いものから降順に前記各キーワードを並べ、各キーワードが文書に存在するとビット1、存在しないとビット0を割り当てて、各文書について前記並べた降順にキーワードの存否を表す複数ビットから成る2進数で表し、前記文書群を構成する各文書の文書データを頻度が高いキーワードを含む文書の順にするため、各文書を表す前記2進数の大きい数値の順にソートする処理と、
前記クラスターに属するキーワードのうちの前記文書群を構成する文書に含まれるキーワード、又は、各文書中における前記クラスターに属するキーワードの有無を示す情報を、前記各文書と前記クラスターとに対応付けて画面表示する処理とを実行させるデータ表示プログラムであって、
前記画面表示する処理は、さらに、各クラスターに属するキーワードが出現する文書数について昇順又は降順に前記各クラスターを並び替えて画面表示するとともに、前記ソートする処理でもとめた文書の順に画面表示する
ことを特徴とするデータ表示プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2006178922thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close