TOP > 技術シーズ検索 > 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置

文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置

シーズコード S120007800
掲載日 2012年1月5日
研究者
  • 白松 俊
  • 駒谷 和範
  • 奥乃 博
技術名称 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
技術概要 検索システムは、文書データからの検索処理を実行する文単位検索装置1と、自然言語からなる文書データを記憶する文書記憶手段2と、インターネット等のパケット交換網3と、ユーザから入力されるキーワード又は音声等の言葉を受け付ける受付装置4,4,…とで構成される。文単位検索装置1は、PC(Personal Computer)であり、自然言語からなる文書データを記憶する文書記憶手段2と接続される。また、受付装置4,4,…もPCであり、文単位検索装置1は、パケット交換網3を介して受付装置4,4,…と接続され通信が可能である。検索システムでは、文単位検索装置1は、検索の対象である文単位を含む文書データを文書記憶手段2に予め記憶しておく。文単位検索装置1は、文書記憶手段2に記憶した文書データを、予め文単位に分別し、後に検索処理が可能なように各文単位に文脈上の意味を表わす定量的な情報を記憶させておく。また、受付装置4,4,…は、受け付けた言葉をコンピュータで処理可能なテキストデータ又は音声データに変換し、パケット交換網3を介して当該データを文単位検索装置1へ送信する。
画像

※ 画像をクリックすると拡大します。

thum_2008-530812.gif
研究分野
  • 自然語処理
展開可能なシーズ 受け付けた言葉から、ユーザの意識にある先の言葉からの文脈が反映された意味を表わす情報を自動的に生成し、文脈の流れの中で意味が動的に変化する文書中の文単位の内から、受け付けた言葉から生成された情報が表わす文脈上の意味のまとまりが類似する文単位を直接的に検索することができる文単位検索方法、文単位検索装置、コンピュータを文単位検索装置として機能させるコンピュータプログラム、及びコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
検索のために入力される言葉での重み値が付与された重み付き単語群と類似する重み付き単語群が対応付けられる文単位が抽出されることにより、文書全体ではなく、単語の顕現性、即ち意味のまとまりが類似する文単位を直接的に検索することができる。
用途利用分野 文単位検索装置、文単位検索プログラム、文書記憶装置
出願特許   特許 国際特許分類(IPC)
( 1 ) 国立大学法人京都大学, . 白松 俊, 駒谷 和範, 奥乃 博, . 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置. . 2010-01-07
  • G06F  17/30     

PAGE TOP