TOP > 研究報告検索 > 計算機はどこまで言葉を学習できるのか?

計算機はどこまで言葉を学習できるのか?

研究報告コード R030000237
掲載日 2005年2月22日
研究者
  • 鳥澤 健太郎
研究者所属機関
  • 北陸先端科学技術大学大学院情報科学研究科
研究機関
  • 北陸先端科学技術大学
報告名称 計算機はどこまで言葉を学習できるのか?
報告概要 本プロジェクトでは、言語の学習を大量のテキストを用いて計算機に行わせることを目標とした。この狙いを実現するにあたって、言語の学習が次にあるような二つのステップに分割できるという仮定をおき、そのおのおのについて計算機上でシミュレーションする研究を行うという計画をたてた。ステップA . 語彙学習 英語、日本語などの個別言語に関するある程度の文法や品詞レベルでの単語の性質が与えられたという仮定から出発し、単語、特に名詞の意味的な分類をテキストから学習するプロセス ステップB . 文法学習 第一のステップで前提となった文法を、より仮定の少ない状況から学習するプロセスである。より具体的には、単語の品詞(例えば、名詞や動詞)が与えられていない状況で、英語や日本語などの様々な言語に共通の性質を表現している「普遍文法」から出発し、与えられた単語列から、単語の品詞を推定しつつ、文法の学習を行う過程である。また、本研究の特徴として、使用する文法の表現方法として主辞駆動句構造文法(Head-driven Phrase Structure Grammar, HPSG)とよばれる形式を採用し、それを用いて以上のプロセスを行うシステムを構築することを目標とした。
画像

※ 画像をクリックすると拡大します。

R030000237_01SUM.gif R030000237_02SUM.gif R030000237_03SUM.gif
研究分野
  • 自然語処理
  • 人工知能
関連発表論文 (1) Kentaro Torisawa. A nearly unsupervised learning method for automatic paraphrasing of Japanese noun phrases, In Proceeding of Workshop on Automatic Paraphrasing: Theories and Applications, to appear, 2001
(2) Kentaro Torisawa. An unsupervised method for canonicalization of Japanese postpositions, In Proceeding of 6th Natural Language Processing Pacific Rim Symposium, to appear, 2001.
(3) Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii. A method to integrate tables of the World Wide Web, In Proceeding of the International Workshop on Web Document Analysis (WDA 2001), 2001.
(4) Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii. Extracting ontologies from World Wide Web via HTML tables, In Proceeding of Pacific Association for Computational Linguistics 2001, 2001.
(5) Kenji Nishida, Kentaro Torisawa, Jun'ichi Tsujii. Compiling an HPSG-based grammar into more than one CFG, In Proceeding of Pacific Association in Computational Linguistics 2001, 2001.
(6) Takashi Ninomiya, Kentaro Torisawa, and Jun'ichi Tsujii. An Agent-based Parallel HPSG Parser for Shared-memory Parallel Machines,言語処理学会学会誌,Vol.8(1), pp.21・48, 2001.
(7) Kentaro Torisawa, Kenji Nishida, Yusuke Miyao, and Jun-ichi Tsujii. An HPSG Parser with CFG Filtering in Journal of Natural Language Engineering, Cambridge University Press, Vol.6(1), pp.63-80, 2000.
(8) Hiroshi Kanayama, Kentaro Torisawa, Yutaka Mitsuisi, Jun'ichi Tsujii. A Hybrid Japanese Parser with Hand-crafted Grammar and Statistics, In Proceeding of the 18th International Conference on Computational Linguistics, pp.411-417, 2000.
(9) 金山博,鳥澤健太郎,光石豊,辻井潤一。3つ以下の候補から係り先を選択する係り受け解析モデル,言語処理学会学会誌,Vol.7(5), pp.71・92, 2000.
(10) Minoru Yoshida, Takashi Ninomiya, Kentaro Torisawa, Jun'ichi Tsujii. Efficient FB-LTAG parser and its parallelization, In Proceeding of Pacific Association for Computational Linguistics '99, pp.90-103, 1999.
(11) Kenji Nishida, Kentaro Torisawa, Jun'ichi Tsujii. Efficient HPSG parsing algorithm with array unification, In Proceeding of Natural Language Pacific Rim Symposium '99, pp.144-149, 1999.
(12) Hiroshi Kanayama, Kentaro Torisawa, Yutaka Mitsuisi, Jun'ichi Tsujii. Statisitical dependency analysis with an HPSG-based Japanese grammar, pp.138-143, 1999
研究制度
  • さきがけ研究21 「情報と知」領域
研究報告資料
  • 鳥澤 健太郎. 計算機はどこまで言葉を学習できるのか?. 「さきがけ研究21」研究報告会 「情報と知」領域 講演要旨集 第II期研究者(研究期間:1998-2001),2001. p.67 - 76.

PAGE TOP