TOP > 国内特許検索 > 単語対応付け装置、機械翻訳学習装置、方法、及びプログラム

単語対応付け装置、機械翻訳学習装置、方法、及びプログラム NEW

国内特許コード P180015579
整理番号 5056
掲載日 2018年11月22日
出願番号 特願2015-214659
公開番号 特開2017-084274
出願日 平成27年10月30日(2015.10.30)
公開日 平成29年5月18日(2017.5.18)
発明者
  • 須藤 克仁
  • 永田 昌明
  • 森 信介
出願人
  • 日本電信電話株式会社
  • 国立大学法人京都大学
発明の名称 単語対応付け装置、機械翻訳学習装置、方法、及びプログラム NEW
発明の概要 【課題】対訳関係にある語の自動対応付けを精度良く行う。
【解決手段】単語対応付け部326により、対訳となる第1言語文及び第2言語文のペアに含まれる第1言語文について、第2言語の統語要素であって、かつ第1言語に存在しない統語要素に対応する予め定義した仮想単語を、第1言語文に挿入し、仮想単語を挿入した第1言語文に含まれる単語の各々と、第2言語文に含まれる単語の各々との単語の対応関係を推定し、推定された単語の対応関係に基づいて、仮想単語と対応付けられた単語の対応関係を除去し、かつ単語の対応関係に含まれる仮想単語を除去した結果を単語対応付け結果とする。
【選択図】図4
従来技術、競合技術の概要


従来、原言語から目的言語への機械翻訳において、原言語に存在しない統語要素を目的言語への翻訳時に訳出することは一般に容易でなかった。近年用いられている統計的機械翻訳の技術においては、言語に依存しない機械翻訳を実現できる(非特許文献1)。一方で、原言語に存在しない統語要素に対して誤った対訳語句対が獲得され、その結果として翻訳時に訳語の漏れや湧き出しが起こったりするという問題がある。



このような問題への対処方法として、原言語側に存在しないが目的言語側で必要な統語要素を原言語側に補うことによって訳出しやすくする技術がある(非特許文献2、特許文献1)。いずれも韓国語あるいは日本語に存在する主語や目的語を示す助詞相当の統語要素を、英語の統語解析の結果を利用して補うことで、英語から韓国語あるいは日本語への機械翻訳を改善している。



また、翻訳時に英語側の言語モデルや統語構造を考慮することによって、冠詞を後処理として補完する技術も提案されている(非特許文献3)。また、従来の統語構造を利用する方法(非特許文献4)も提案されている。

産業上の利用分野


本発明は、入力された第1言語と第2言語とにおいて単語の対応関係を取得するための単語対応付け装置、機械翻訳学習装置、方法、及びプログラムに関するものである。

特許請求の範囲 【請求項1】
対訳となる第1言語文及び第2言語文のペアに含まれる第1言語文について、
前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入し、
前記仮想単語を挿入した前記第1言語文に含まれる単語の各々と、前記第2言語文に含まれる単語の各々との単語の対応関係を推定し、
前記推定された単語の対応関係に基づいて、前記仮想単語と対応付けられた前記単語の対応関係を除去し、かつ前記単語の対応関係に含まれる前記仮想単語を除去した結果を単語対応付け結果とする単語対応付け部
を含む、単語対応付け装置。

【請求項2】
前記第1言語文の統語解析を行う統語解析部を更に含み、
前記単語対応付け部は、前記統語解析部による前記第1言語文の統語解析結果に基づいて、前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入する請求項1記載の単語対応付け装置。

【請求項3】
前記第1言語を日本語とし、
前記第2言語を英語とし、
前記単語対応付け部は、前記英語の冠詞に対応する予め定義した仮想単語を、前記日本語文の名詞に係る単語のうち最も左側にある形容詞、前記名詞の直前、又は前記形容詞を修飾している副詞の直前に挿入する請求項1又は2記載の単語対応付け装置。

【請求項4】
請求項1~請求項3の何れか1項記載の単語対応付け装置によって取得した単語対応付け結果に基づいて、前記第1言語の語句が前記第2言語の語句に翻訳される確率を計算したモデルを学習する翻訳モデル学習部
を含む、機械翻訳学習装置。

【請求項5】
単語対応付け部を含む単語対応付け装置における、単語対応付け方法であって、
前記単語対応付け部は、対訳となる第1言語文及び第2言語文のペアに含まれる第1言語文について、
前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入し、
前記仮想単語を挿入した前記第1言語文に含まれる単語の各々と、前記第2言語文に含まれる単語の各々との単語の対応関係を推定し、
前記推定された単語の対応関係に基づいて、前記仮想単語と対応付けられた前記単語の対応関係を除去し、かつ前記単語の対応関係に含まれる前記仮想単語を除去した結果を単語対応付け結果とする
単語対応付け方法。

【請求項6】
統語解析部が前記第1言語文の統語解析を行うことを更に含み、
前記単語対応付け部により仮想単語を挿入することは、前記統語解析部による前記第1言語文の統語解析結果に基づいて、前記第2言語の統語要素であって、かつ前記第1言語に存在しない統語要素に対応する予め定義した仮想単語を、前記第1言語文に挿入する請求項5記載の単語対応付け方法。

【請求項7】
翻訳モデル学習部を含む機械翻訳学習装置における、機械翻訳学習方法であって、
前記翻訳モデル学習部は、請求項5又は請求項6記載の単語対応付け方法によって取得した単語対応付け結果に基づいて、前記第1言語の語句が前記第2言語の語句に翻訳される確率を計算したモデルを学習する
機械翻訳学習方法。

【請求項8】
コンピュータを、請求項1~請求項3の何れか1項記載の単語対応付け装置、又は請求項4記載の機械翻訳学習装置の各部として機能させるためのプログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2015214659thum.jpg
出願権利状態 公開
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください。


PAGE TOP

close
close
close
close
close
close
close