TOP > 国内特許検索 > 構文解析方法及び装置

構文解析方法及び装置 コモンズ

国内特許コード P140010706
整理番号 01-133
掲載日 2014年7月3日
出願番号 特願2001-395617
公開番号 特開2003-196274
登録番号 特許第3906356号
出願日 平成13年12月27日(2001.12.27)
公開日 平成15年7月11日(2003.7.11)
登録日 平成19年1月26日(2007.1.26)
発明者
  • 内元 清貴
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 構文解析方法及び装置 コモンズ
発明の概要 【課題】 精度の高い構文解析方法を提供することによって、より正確な言語処理技術に寄与すること。
【解決手段】 単言語文書20aと共に、対訳関係にある対訳文書20bを入力し、単言語文書20aの構文解析、例えば依存関係解析35で複数の解析結果が生じて特定が困難な場合に、対訳文書20bの依存関係38を調べ、その情報に基づいて最適な依存関係解析35を行う。
従来技術、競合技術の概要



近年、コンピュータによって言語のテキストを解析する技術、或いは生成する技術の開発が進み、特にそれらの技術を用いた機械翻訳や、要約システムの提供が図られている。

その中で、文章の係り受け関係などを解析する構文解析技術は正確な文脈の把握に極めて重要であり、従来から高精度な構文解析技術の研究が進められている。





特に、日本語のように、係り受け関係が曖昧であり、省略される語句も多い言語を解析する際には、解析時に複数の解析可能性が存在し、解析結果が不確定になる場合が少なくない。また、単語には複数の語義があることが多いが、1つの言語を解析しただけでは、いずれの語義で用いられているのかが不明な場合も多い。

従来の構文解析技術では、当該解析対象の言語についてより多くの文法情報を与え、それによって解析精度の向上を図るものが多い。しかし、このような手法では、確率的により最適なものが選択できるようになるだけで、必ずしも正しい解析結果を得ることができなかった。

産業上の利用分野



本発明は言語処理における構文解析の精度を向上させる技術に関するものであり、より詳しくは、複数の言語を入力して構文解析の精度向上を図る技術に関わる。

特許請求の範囲 【請求項1】
言語処理におけるコンピュータによる構文解析方法であって、
対象テキスト入力手段により構文解析を行う対象テキストと、対訳テキスト入力手段により該対象テキストと少なくともその一部が対訳関係にある1つ以上の対訳テキストとを入力し、
構文解析手段が、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を、該対象テキスト及び対訳テキストについて行い、
該対象テキストについて、少なくとも2通り以上の構文解析情報が得られる場合に、
最適結果特定手段により対訳テキストに対する該構文解析の結果を参照し、その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定し、
構文解析結果出力手段により該対象テキストの構文解析結果として出力する
ことを特徴とする構文解析方法。

【請求項2】
前記構文解析方法が、
構文解析手段により前記対象テキストの少なくとも語順に係る情報から複数の係り受け関係が求められる場合に、
最適結果特定手段により前記対訳テキストの少なくとも語順に係る情報を参照して最も適当な前記対象テキストの係り受け関係を決定する
ことを特徴とする請求項1に記載の構文解析方法。

【請求項3】
言語処理における構文解析を行う装置であって、
構文解析を行う対象テキストを入力する対象テキスト入力手段、
該対象テキストと、少なくともその一部が対訳関係にある対訳テキストを、対訳関係を関連づけながら入力する対訳テキスト入力手段、
該入力された対象テキスト及び対訳テキストに係る形態素解析を行う形態素解析手段、
該形態素解析の結果に対して、2つの語あるいは文節の間の依存関係を学習する機械学習モデルを用いて一文に含まれる各々の語あるいは文節が依存関係にある確率の積が一文全体で最も高くなるときの依存関係を求める構文解析を行う構文解析手段、
該対象テキストの構文解析結果において、複数の構文解析結果が得られた場合、又は複数の構文解析結果のうち1つの構文解析結果における上記の確率の積の値が所定の閾値を超えない場合に、対訳テキストの構文解析結果を参照し、
その中で上記の確率の積が最も大きい対訳テキストの依存関係を対象テキストにおける語あるいは文節の最も適切な依存関係として構文解析情報を特定する最適結果特定手段、
該最適な結果を出力する構文解析結果出力手段
を備えることを特徴とする構文解析装置。

【請求項4】
前記構文解析装置の構文解析手段において、
前記対象テキストの少なくとも語順に係る情報から複数の係り受け関係が求められる場合に、
前記最適結果特定手段が、
前記対訳テキストの少なくとも語順に係る情報を参照して最も適当な前記対象テキストの係り受け関係を決定する
ことを特徴とする請求項に記載の構文解析装置。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2001395617thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close