Top > Search Technology seeds > INFORMATION EXTRACTOR, ITS METHOD AND PROGRAM

INFORMATION EXTRACTOR, ITS METHOD AND PROGRAM

Seeds code S110007063
Posted date Dec 14, 2011
Researchers
  • (In Japanese)野村 浩郷
Name of technology INFORMATION EXTRACTOR, ITS METHOD AND PROGRAM
Technology summary (In Japanese)情報抽出装置は、入力部10、テンプレート抽出部20、係り受け抽出部30、ダグパターンマッチング部40、記事分割部50、見出しの形態素解析部60、見出しの助詞除去部70、見出し特徴情報マッチング部80、見出し特徴情報抽出部90、本文の形態素解析部100、本文の助詞除去部110、本文特徴情報マッチング部120、本文特徴情報抽出部130、本文の係り受け解析部140、補足説明の抽出部150、売り情報の出力160を含む。タグパターンマッチング部40は、記事にタグを付け、タグのパターンマッチングを行う。記事分割部50は、記事をタグのパターンマッチの結果に従い、見出しと本文に分割する。見出しの形態素解析部60は、分割された見出しの形態素解析を行う。ここで、形態素解析は、形態素解析システムJUMANを利用することができる。JUMANとは、日本語の形態素解析を行うためのシステムで、日本語の文章を入力とし、入力文を単語単位に区切り、それぞれの形態素を決定するものである。
Drawing

※Click image to enlarge.

thum_2007-094339.gif
Research field
  • Natural language processing
Seeds that can be deployed (In Japanese)指定された項目およびそれに関連する1つないしは複数個の情報、さらに指定された項目ではないが重要な情報を文書から見つけ出す高機能かつ高精度な情報抽出装置を提供する。
定型性の高い文章に対しては簡易かつ迅速に抽出することができる。また、文書の中からあらかじめ定められた種類の情報やあらかじめ定められた種類の情報に関連する重要な情報が簡潔な言語表現で迅速かつ簡易に抽出可能となる。
Usage Use field (In Japanese)情報抽出装置、情報抽出プログラム
Application patent   patent IPC(International Patent Classification)
( 1 ) (In Japanese)国立大学法人九州工業大学, . (In Japanese)野村 浩郷, . INFORMATION EXTRACTOR, ITS METHOD AND PROGRAM. P2008-250887A. Oct 16, 2008
  • G06F  17/30     

PAGE TOP