Top > Search of Japanese Patents > SYNTAX ANALYZING METHOD AND DEVICE

SYNTAX ANALYZING METHOD AND DEVICE commons

Patent code P140010706
File No. 01-133
Posted date Jul 3, 2014
Application number P2001-395617
Publication number P2003-196274A
Patent number P3906356
Date of filing Dec 27, 2001
Date of publication of application Jul 11, 2003
Date of registration Jan 26, 2007
Inventor
  • (In Japanese)内元 清貴
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title SYNTAX ANALYZING METHOD AND DEVICE commons
Abstract PROBLEM TO BE SOLVED: To contribute to much more accurate language processing technology by providing a highly precise syntax analyzing method.
SOLUTION: A single language document 20a and a parallel translation document 20b in a parallel translation relation are inputted, and when a plurality of analytic results are generated in the syntax analysis of the single language document 20a, for example, dependency analysis 35, and as a result it is difficult to specify any analytic result, a dependency 38 of the parallel translation document 20b is checked, and the optimal dependency analysis 35 is executed based on the information.
Outline of related art and contending technology (In Japanese)

近年、コンピュータによって言語のテキストを解析する技術、或いは生成する技術の開発が進み、特にそれらの技術を用いた機械翻訳や、要約システムの提供が図られている。

その中で、文章の係り受け関係などを解析する構文解析技術は正確な文脈の把握に極めて重要であり、従来から高精度な構文解析技術の研究が進められている。

特に、日本語のように、係り受け関係が曖昧であり、省略される語句も多い言語を解析する際には、解析時に複数の解析可能性が存在し、解析結果が不確定になる場合が少なくない。また、単語には複数の語義があることが多いが、1つの言語を解析しただけでは、いずれの語義で用いられているのかが不明な場合も多い。

従来の構文解析技術では、当該解析対象の言語についてより多くの文法情報を与え、それによって解析精度の向上を図るものが多い。しかし、このような手法では、確率的により最適なものが選択できるようになるだけで、必ずしも正しい解析結果を得ることができなかった。

Field of industrial application (In Japanese)

本発明は言語処理における構文解析の精度を向上させる技術に関するものであり、より詳しくは、複数の言語を入力して構文解析の精度向上を図る技術に関わる。

Scope of claims (In Japanese)
【請求項1】
 
言語処理におけるコンピュータによる構文解析方法であって、
対象テキスト入力手段により構文解析を行う対象テキストと、対訳テキスト入力手段により該対象テキストと少なくともその一部が対訳関係にある1つ以上の対訳テキストとを入力し、
構文解析手段が、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を、該対象テキスト及び対訳テキストについて行い、
該対象テキストについて、少なくとも2通り以上の構文解析情報が得られる場合に、
最適結果特定手段により対訳テキストに対する該構文解析の結果を参照し、その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定し、
構文解析結果出力手段により該対象テキストの構文解析結果として出力する
ことを特徴とする構文解析方法。

【請求項2】
 
前記構文解析方法が、
構文解析手段により前記対象テキストの少なくとも語順に係る情報から複数の係り受け関係が求められる場合に、
最適結果特定手段により前記対訳テキストの少なくとも語順に係る情報を参照して最も適当な前記対象テキストの係り受け関係を決定する
ことを特徴とする請求項1に記載の構文解析方法。

【請求項3】
 
言語処理における構文解析を行う装置であって、
構文解析を行う対象テキストを入力する対象テキスト入力手段、
該対象テキストと、少なくともその一部が対訳関係にある対訳テキストを、対訳関係を関連づけながら入力する対訳テキスト入力手段、
該入力された対象テキスト及び対訳テキストに係る形態素解析を行う形態素解析手段、
該形態素解析の結果に対して、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を行う構文解析手段、
該対象テキストの構文解析結果において、複数の構文解析結果が得られた場合、又は複数の構文解析結果のうち1つの構文解析結果における上記の確率の積の値が所定の閾値を超えない場合に、対訳テキストの構文解析結果を参照し、
その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定する最適結果特定手段、
該最適な結果を出力する構文解析結果出力手段
を備えることを特徴とする構文解析装置。

【請求項4】
 
前記構文解析装置の構文解析手段において、
前記対象テキストの少なくとも語順に係る情報から複数の係り受け関係が求められる場合に、
前記最適結果特定手段が、
前記対訳テキストの少なくとも語順に係る情報を参照して最も適当な前記対象テキストの係り受け関係を決定する
ことを特徴とする請求項3に記載の構文解析装置。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2001395617thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close