Top > Search of Japanese Patents > WORD MAPPING DEVICE, MACHINE TRANSLATION LEARNING DEVICE, METHOD, AND PROGRAM

WORD MAPPING DEVICE, MACHINE TRANSLATION LEARNING DEVICE, METHOD, AND PROGRAM

Patent code P180015579
File No. 5056
Posted date Nov 22, 2018
Application number P2015-214659
Publication number P2017-084274A
Patent number P6558696
Date of filing Oct 30, 2015
Date of publication of application May 18, 2017
Date of registration Jul 26, 2019
Inventor
  • (In Japanese)須藤 克仁
  • (In Japanese)永田 昌明
  • (In Japanese)森 信介
Applicant
  • (In Japanese)日本電信電話株式会社
  • (In Japanese)国立大学法人京都大学
Title WORD MAPPING DEVICE, MACHINE TRANSLATION LEARNING DEVICE, METHOD, AND PROGRAM
Abstract PROBLEM TO BE SOLVED: To accurately perform automatic mapping of words which are in bilingual relationship.
SOLUTION: With respect to a first language sentence included in a pair of the first language sentence and a second language sentence which are in bilingual relationship, a word mapping part 326 inserts a virtual word, which is a syntactic element in the second language and predefined corresponding to a syntactic element which is not included in the first language, into the first language sentence. The word mapping part 326 estimates correspondence of each of the words included in the first language sentence inserted with the virtual word with each of the words included in the second language sentence, and based on the correspondence between the estimated words, removes the correspondence between the virtual words and the mapped words, and outputs a result in which the virtual word included in the correspondence between the words have been removed as a word mapping result.
Outline of related art and contending technology (In Japanese)

従来、原言語から目的言語への機械翻訳において、原言語に存在しない統語要素を目的言語への翻訳時に訳出することは一般に容易でなかった。近年用いられている統計的機械翻訳の技術においては、言語に依存しない機械翻訳を実現できる(非特許文献1)。一方で、原言語に存在しない統語要素に対して誤った対訳語句対が獲得され、その結果として翻訳時に訳語の漏れや湧き出しが起こったりするという問題がある。

このような問題への対処方法として、原言語側に存在しないが目的言語側で必要な統語要素を原言語側に補うことによって訳出しやすくする技術がある(非特許文献2、特許文献1)。いずれも韓国語あるいは日本語に存在する主語や目的語を示す助詞相当の統語要素を、英語の統語解析の結果を利用して補うことで、英語から韓国語あるいは日本語への機械翻訳を改善している。

また、翻訳時に英語側の言語モデルや統語構造を考慮することによって、冠詞を後処理として補完する技術も提案されている(非特許文献3)。また、従来の統語構造を利用する方法(非特許文献4)も提案されている。

Field of industrial application (In Japanese)

本発明は、入力された第1言語と第2言語とにおいて単語の対応関係を取得するための単語対応付け装置、機械翻訳学習装置、方法、及びプログラムに関するものである。

Scope of claims (In Japanese)
【請求項1】
 
対訳となる第1言語文及び第2言語文のペアに含まれる第1言語文について、
前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入し、
前記仮想単語を挿入した前記第1言語文に含まれる単語の各々と、前記第2言語文に含まれる単語の各々との単語の対応関係を推定し、
前記推定された単語の対応関係に基づいて、前記仮想単語と対応付けられた前記単語の対応関係を除去し、かつ前記単語の対応関係に含まれる前記仮想単語を除去した結果を単語対応付け結果とする単語対応付け部
を含み、
前記第1言語を日本語とし、
前記第2言語を英語とし、
前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素を、前記英語の冠詞とし、
前記単語対応付け部は、前記英語の冠詞に対応する予め定義した仮想単語を、前記日本語文の名詞に係る単語のうち最も左側にある形容詞、前記名詞の直前、又は前記形容詞を修飾している副詞の直前に挿入する、単語対応付け装置。

【請求項2】
 
前記第1言語文の統語解析を行う統語解析部を更に含み、
前記単語対応付け部は、前記統語解析部による前記第1言語文の統語解析結果に基づいて、前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入する請求項1記載の単語対応付け装置。

【請求項3】
 
請求項1又は2記載の単語対応付け装置と、
前記単語対応付け装置によって取得した単語対応付け結果に基づいて、前記第1言語の語句が前記第2言語の語句に翻訳される確率を計算したモデルを学習する翻訳モデル学習部
を含む、機械翻訳学習装置。

【請求項4】
 
単語対応付け部を含む単語対応付け装置における、単語対応付け方法であって、
前記単語対応付け部は、対訳となる第1言語文及び第2言語文のペアに含まれる第1言語文について、
前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入し、
前記仮想単語を挿入した前記第1言語文に含まれる単語の各々と、前記第2言語文に含まれる単語の各々との単語の対応関係を推定し、
前記推定された単語の対応関係に基づいて、前記仮想単語と対応付けられた前記単語の対応関係を除去し、かつ前記単語の対応関係に含まれる前記仮想単語を除去した結果を単語対応付け結果とすることを含み、
前記第1言語を日本語とし、
前記第2言語を英語とし、
前記単語対応付け部が挿入することでは、前記英語の冠詞に対応する予め定義した仮想単語を、前記日本語文の名詞に係る単語のうち最も左側にある形容詞、前記名詞の直前、又は前記形容詞を修飾している副詞の直前に挿入する
単語対応付け方法。

【請求項5】
 
統語解析部が前記第1言語文の統語解析を行うことを更に含み、
前記単語対応付け部により仮想単語を挿入することは、前記統語解析部による前記第1言語文の統語解析結果に基づいて、前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入する請求項4記載の単語対応付け方法。

【請求項6】
 
翻訳モデル学習部を含む機械翻訳学習装置における、機械翻訳学習方法であって、
請求項4又は請求項5記載の単語対応付け方法によって単語対応付け結果を取得し、
前記翻訳モデル学習部は、前記取得した単語対応付け結果に基づいて、前記第1言語の語句が前記第2言語の語句に翻訳される確率を計算したモデルを学習する
機械翻訳学習方法。

【請求項7】
 
コンピュータを、請求項1又は2記載の単語対応付け装置の各部として機能させるためのプログラム。

【請求項8】
 
コンピュータを、請求項3記載の機械翻訳学習装置の各部として機能させるためのプログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2015214659thum.jpg
State of application right Registered
Please contact us by e-mail or facsimile if you have any interests on this patent. Thanks.


PAGE TOP

close
close
close
close
close
close
close