(In Japanese)最適パターン発見にもとづく高速テキストマイニング

Research report code R030000278
Posted date Feb 22, 2005
  • (In Japanese)有村 博紀
  • (In Japanese)九州大学大学院システム情報科学研究院
Research organization
  • (In Japanese)九州大学
Report name (In Japanese)最適パターン発見にもとづく高速テキストマイニング
Technology summary (In Japanese)本研究の目的は,ネットワーク上に蓄積された膨大なテキストと半構造データから,有用な情報を獲得するための高速なテキストデータマイニングシステムを開発することである。ウェブページやXMLデータ等のネットワーク上の大規模テキストデータの利用が急速に進みつつある現在,テキストデータからの効率良いデータマイニング手法の確立が緊急の課題となっている。しかしその一方で,これらの大規模テキストデータは,(1) 明示的な構造をもたない,(2) 多様な電子化文書の,(3) 膨大な量の集積であるという特徴をもっており,関係データベースを対象に開発されてきた従来型のデータマイニング技術をそのまま適用することができないという問題があった。そこで本研究では,従来型技術の活用ではなく,新しい観点からテキストマイニングの問題に正面から取り組み,テキストデータマイニングのための基本技術の研究開発を行なう。さらに,これら基本技術の開発を通じて,大規模テキストデータを対象とした高速テキストマイニングシステムのプロトタイプを構築する。研究の特色として,データマイニングを,人間による大量のデータ解析を支援する効率的な半自動的ツールとしてとらえ,従来の情報検索システムを超えた新しい情報アクセスシステムの開発を目指す。また,計算量理論と計算学習理論との最新の成果を積極的に取り入れて,大量のデータに対してきわめて高速かつ頑健に働くアルゴリズムの開発を目標とする。

R030000278_01SUM.gif R030000278_02SUM.gif R030000278_03SUM.gif
Research field
  • Computer system development
  • Computer system operational management
  • System programmings in general
  • Operating systems
  • Database systems
Research project
  • Precursory Research for Embryonic Science and Technology.;Information and Human Activity
Information research report
  • (In Japanese)有村 博紀. 最適パターン発見にもとづく高速テキストマイニング. 「さきがけ研究21」研究報告会 「情報と知」領域 講演要旨集 第III期研究者(研究期間:1999-2002),2002. p.37 - 46.