TOP > 技術シーズ検索 > 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム

文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム

Seeds code S120007633
Posted date 2012年1月4日
Researchers
  • 曽根原 登
  • 釜江 尚彦
  • 沼田 秀穂
  • 池田 佳代
Name of technology 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム
Technology summary 文書テキストに自動的に重み付きキーワードを付与する文書インデキシングシステムは、文書管理サーバ1及びクライアントコンピュータ2を具備する。文書管理サーバ1は、インデキシングされるべき検索対象の文書テキストデータを格納する外部記憶装置である文書データベース11と、インデキシングされるべき検索対象の文書テキストデータを入力する文書入力部12と、入力された文書テキストデータからキーワードを自動抽出し、キーワードごとにその「重み」(抽出されたキーワードの出現頻度から一意に算出される値)を対応付けるキーワード自動抽出部13と、インデキシングされた文書テキストデータと抽出された重み付きキーワードとの対応付け及び記憶保持を管理する重み付きキーワード管理部14と、キーワードが付与された文書データを外部記憶装置であるキーワード付与文書データベース16に格納すると共に、入力された管理キーワードと一致するキーワードが付与された文書テキストデータをキーワード付与文書データベース16から検索する文書格納部15と、を具備する。
Drawing

※Click image to enlarge.

thum_2006-099401.gif
Research field
  • 情報処理
Seeds that can be deployed 所与の文書テキストデータに対して、簡易且つ自動的にインデキシングを行い、辞書或いは人的ノウハウのいずれにも依存することなく、キーワードメタデータを簡易且つ低コストで自動発生させ、利用者の文書テキストデータ検索を容易化することの可能な文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラムを提供する。
予め登録者によるキーワード付与や辞書登録を要することがなく、またこの辞書を用いた意味認識、形態素解析等の処理を要することがない。従って、文書テキストデータに簡易且つ自動的にインデキシングすることができ、登録された文書テキストデータの利用者による検索が容易化する。
Usage Use field 文書インデキシング装置、文書検索装置、文書分類装置
Application patent   patent IPC(International Patent Classification)
( 1 ) 大学共同利用機関法人情報・システム研究機構, . 曽根原 登, 釜江 尚彦, 沼田 秀穂, 池田 佳代, . 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム. 特開2007-272699. 2007-10-18
  • G06F  17/30     

PAGE TOP