Top > Search of Japanese Patents > PROCESSING METHOD FOR TRANSLATION OF TENSE, ASPECT AND MODALITY, AND SYSTEM THEREFOR

PROCESSING METHOD FOR TRANSLATION OF TENSE, ASPECT AND MODALITY, AND SYSTEM THEREFOR commons

Patent code P140010693
File No. 01-51
Posted date Jul 3, 2014
Application number P2001-201010
Publication number P2003-016067A
Patent number P3870251
Date of filing Jul 2, 2001
Date of publication of application Jan 17, 2003
Date of registration Oct 27, 2006
Inventor
  • (In Japanese)村田 真樹
  • (In Japanese)馬 青
  • (In Japanese)内元 清貴
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title PROCESSING METHOD FOR TRANSLATION OF TENSE, ASPECT AND MODALITY, AND SYSTEM THEREFOR commons
Abstract PROBLEM TO BE SOLVED: To accurately translate tense, aspect and modality of a translation target when performing a machine translation.
SOLUTION: A tense/feature set extracting part 12 extracts tense, an aspect and modality (hereafter called tens and the like 4) and a set of features by case from a database 11 on tense, aspect and modality, a machine leaning part 13 learns which feature has a tendency to become which tense from the extracted set and stores a result of the leaning into a leaning result database 14, a feature extracting part 15 extracts the set when Japanese text 3 to be translated is inputted, an estimation processing part 16 for tense, aspect and modality of translation destination estimates that to which tense and the like the feature of the text 3 has the tendency to become from the set in reference to the database 14 to output the estimated tense and the like 4.
Outline of related art and contending technology (In Japanese)

近年,WWW(World Wide Web)などのインターネットの発展とともに機械翻訳の必要性が高まり続けている。この機械翻訳において,テンス・アスペクト・モダリティは翻訳が難しい問題として知られている。

テンス・アスペクト・モダリティとは,動詞部分の時制(テンス),進行形や完了形などの相(アスペクト),または英文における助動詞相当句である様相(モダリティ)についての情報である。

従来,テンス・アスペクト・モダリティの表現は,人手により作成されたルールによって扱われていた。しかしながら,近年では,用例ベース(k近傍法)の方法などのコーパスデータにもとづくアプローチでも処理されるようになってきた。用例ベースの方法では,集めた実例ごとに,どの場合にどの時制などを使うかを記したデータを対応づけた用例データベースを用意しておき,入力された文と良く似た実例に基づいてテンス・アスペクト・モダリティを翻訳するといったことが行なわれていた。

[参考文献1]村田真樹 馬青 内元清貴 井佐原均,用例ベースによるテンス・アスペクト・モダリティの日英翻訳,人工知能学会誌,Vol.16,No.1,2001

参考文献1に記載されている研究では,日本文から英文への機械翻訳のテンス・アスペクト・モダリティの判定の際に,日本文のテンス・アスペクト・モダリティは文末に表されることに着目して,入力された日本文の文末の所定の長さの文字列と,予め用意したコーパスデータとの類似度をk近傍法により判断してテンス・アスペクト・モダリティを決定する手法を用いている。k近傍法とは,最もよく似た一つの事例の代わりに,最もよく似たk個の事例を用い,このk個の事例での多数決によって分類先を求める手法である。

Field of industrial application (In Japanese)

本発明は,コンピュータによる翻訳システムの分野において,特に,機械学習アルゴリズムを用いてテンス(時制),アスペクト(相),またはモダリティ(様相)を翻訳する翻訳処理装置に関するものである。

Scope of claims (In Japanese)
【請求項1】
 
デジタル化された文について一の言語から他の言語へ翻訳処理をする際に,変換元言語から変換先言語のテンス・アスペクト・モダリティを翻訳する処理装置であって,
予め備えられた変換元言語の事例と当該事例の変換先言語におけるテンス・アスペクト・モダリティとの組を記憶するテンス・アスペクト・モダリティ・データベースと,
前記テンス・アスペクト・モダリティ・データベースの各事例ごとに,テンス・アスペクト・モダリティと当該テンス・アスペクト・モダリティに対応する事例から抽出した単語素性および文字列素性を含む複数の形式の素性の集合とからなるテンス-素性組を抽出するテンス-素性抽出手段と,
前記テンス-素性組を教師データとして用いて複数の素性の出現パターンについて,それぞれのパターンのときになりやすいテンス・アスペクト・モダリティを,決定リスト法,最大エントロピー法,またはサポートベクトルマシン法のいずれか一の機械学習アルゴリズムにより学習する機械学習手段と,
前記機械学習手段における学習結果を,入力文の変換先言語のテンス・アスペクト・モダリティを判定するための学習データとして学習結果データベースに保存する学習結果データベースと,
変換元言語の入力文から,当該入力文の素性の集合を抽出する素性抽出手段と,
前記入力文の素性の集合をもとに,前記機械学習アルゴリズムにより,前記学習データベースに保存された学習データを参照して前記素性の集合の素性の出現のパターンについて,最もなりやすいテンス・アスペクト・モダリティを特定し,前記特定したテンス・アスペクト・モダリティを前記入力文のテンス・アスペクト・モダリティの推定解として出力する変換先テンス・アスペクト・モダリティ推定処理手段とを備える
ことを特徴とするテンス・アスペクト・モダリティ翻訳処理装置。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001201010thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close