Top > Search Research paper > (In Japanese)計算機はどこまで言葉を学習できるのか?

(In Japanese)計算機はどこまで言葉を学習できるのか?

Research report code R030000237
Posted date Feb 22, 2005
Researchers
  • (In Japanese)鳥澤 健太郎
Affiliation
  • (In Japanese)北陸先端科学技術大学大学院情報科学研究科
Research organization
  • (In Japanese)北陸先端科学技術大学
Report name (In Japanese)計算機はどこまで言葉を学習できるのか?
Technology summary (In Japanese)本プロジェクトでは、言語の学習を大量のテキストを用いて計算機に行わせることを目標とした。この狙いを実現するにあたって、言語の学習が次にあるような二つのステップに分割できるという仮定をおき、そのおのおのについて計算機上でシミュレーションする研究を行うという計画をたてた。ステップA . 語彙学習 英語、日本語などの個別言語に関するある程度の文法や品詞レベルでの単語の性質が与えられたという仮定から出発し、単語、特に名詞の意味的な分類をテキストから学習するプロセス ステップB . 文法学習 第一のステップで前提となった文法を、より仮定の少ない状況から学習するプロセスである。より具体的には、単語の品詞(例えば、名詞や動詞)が与えられていない状況で、英語や日本語などの様々な言語に共通の性質を表現している「普遍文法」から出発し、与えられた単語列から、単語の品詞を推定しつつ、文法の学習を行う過程である。また、本研究の特徴として、使用する文法の表現方法として主辞駆動句構造文法(Head-driven Phrase Structure Grammar, HPSG)とよばれる形式を採用し、それを用いて以上のプロセスを行うシステムを構築することを目標とした。
Drawing

※Click image to enlarge.

R030000237_01SUM.gif R030000237_02SUM.gif R030000237_03SUM.gif
Research field
  • Natural language processing
  • Artificial intelligence
Published papers related (In Japanese)(1) Kentaro Torisawa. A nearly unsupervised learning method for automatic paraphrasing of Japanese noun phrases, In Proceeding of Workshop on Automatic Paraphrasing: Theories and Applications, to appear, 2001
(2) Kentaro Torisawa. An unsupervised method for canonicalization of Japanese postpositions, In Proceeding of 6th Natural Language Processing Pacific Rim Symposium, to appear, 2001.
(3) Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii. A method to integrate tables of the World Wide Web, In Proceeding of the International Workshop on Web Document Analysis (WDA 2001), 2001.
(4) Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii. Extracting ontologies from World Wide Web via HTML tables, In Proceeding of Pacific Association for Computational Linguistics 2001, 2001.
(5) Kenji Nishida, Kentaro Torisawa, Jun'ichi Tsujii. Compiling an HPSG-based grammar into more than one CFG, In Proceeding of Pacific Association in Computational Linguistics 2001, 2001.
(6) Takashi Ninomiya, Kentaro Torisawa, and Jun'ichi Tsujii. An Agent-based Parallel HPSG Parser for Shared-memory Parallel Machines,言語処理学会学会誌,Vol.8(1), pp.21・48, 2001.
(7) Kentaro Torisawa, Kenji Nishida, Yusuke Miyao, and Jun-ichi Tsujii. An HPSG Parser with CFG Filtering in Journal of Natural Language Engineering, Cambridge University Press, Vol.6(1), pp.63-80, 2000.
(8) Hiroshi Kanayama, Kentaro Torisawa, Yutaka Mitsuisi, Jun'ichi Tsujii. A Hybrid Japanese Parser with Hand-crafted Grammar and Statistics, In Proceeding of the 18th International Conference on Computational Linguistics, pp.411-417, 2000.
(9) 金山博,鳥澤健太郎,光石豊,辻井潤一。3つ以下の候補から係り先を選択する係り受け解析モデル,言語処理学会学会誌,Vol.7(5), pp.71・92, 2000.
(10) Minoru Yoshida, Takashi Ninomiya, Kentaro Torisawa, Jun'ichi Tsujii. Efficient FB-LTAG parser and its parallelization, In Proceeding of Pacific Association for Computational Linguistics '99, pp.90-103, 1999.
(11) Kenji Nishida, Kentaro Torisawa, Jun'ichi Tsujii. Efficient HPSG parsing algorithm with array unification, In Proceeding of Natural Language Pacific Rim Symposium '99, pp.144-149, 1999.
(12) Hiroshi Kanayama, Kentaro Torisawa, Yutaka Mitsuisi, Jun'ichi Tsujii. Statisitical dependency analysis with an HPSG-based Japanese grammar, pp.138-143, 1999
Research project
  • Precursory Research for Embryonic Science and Technology.;Information and Human Activity
Information research report
  • (In Japanese)鳥澤 健太郎. 計算機はどこまで言葉を学習できるのか?. 「さきがけ研究21」研究報告会 「情報と知」領域 講演要旨集 第II期研究者(研究期間:1998-2001),2001. p.67 - 76.

PAGE TOP