TOP > 技術シーズ検索 > 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム

文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム

シーズコード S120007633
掲載日 2012年1月4日
研究者
  • 曽根原 登
  • 釜江 尚彦
  • 沼田 秀穂
  • 池田 佳代
技術名称 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム
技術概要 文書テキストに自動的に重み付きキーワードを付与する文書インデキシングシステムは、文書管理サーバ1及びクライアントコンピュータ2を具備する。文書管理サーバ1は、インデキシングされるべき検索対象の文書テキストデータを格納する外部記憶装置である文書データベース11と、インデキシングされるべき検索対象の文書テキストデータを入力する文書入力部12と、入力された文書テキストデータからキーワードを自動抽出し、キーワードごとにその「重み」(抽出されたキーワードの出現頻度から一意に算出される値)を対応付けるキーワード自動抽出部13と、インデキシングされた文書テキストデータと抽出された重み付きキーワードとの対応付け及び記憶保持を管理する重み付きキーワード管理部14と、キーワードが付与された文書データを外部記憶装置であるキーワード付与文書データベース16に格納すると共に、入力された管理キーワードと一致するキーワードが付与された文書テキストデータをキーワード付与文書データベース16から検索する文書格納部15と、を具備する。
画像

※ 画像をクリックすると拡大します。

thum_2006-099401.gif
研究分野
  • 情報処理
展開可能なシーズ 所与の文書テキストデータに対して、簡易且つ自動的にインデキシングを行い、辞書或いは人的ノウハウのいずれにも依存することなく、キーワードメタデータを簡易且つ低コストで自動発生させ、利用者の文書テキストデータ検索を容易化することの可能な文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラムを提供する。
予め登録者によるキーワード付与や辞書登録を要することがなく、またこの辞書を用いた意味認識、形態素解析等の処理を要することがない。従って、文書テキストデータに簡易且つ自動的にインデキシングすることができ、登録された文書テキストデータの利用者による検索が容易化する。
用途利用分野 文書インデキシング装置、文書検索装置、文書分類装置
出願特許   特許 国際特許分類(IPC)
( 1 ) 大学共同利用機関法人情報・システム研究機構, . 曽根原 登, 釜江 尚彦, 沼田 秀穂, 池田 佳代, . 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム. 特開2007-272699. 2007-10-18
  • G06F  17/30     

PAGE TOP