TOP > 国内特許検索 > 依存構造に基づく例文検索方法、プログラム、および例文検索プログラムを記録した記録媒体、ならびに例文検索装置

依存構造に基づく例文検索方法、プログラム、および例文検索プログラムを記録した記録媒体、ならびに例文検索装置 コモンズ

国内特許コード P07P004865
整理番号 NU-0093
掲載日 2007年11月2日
出願番号 特願2006-066829
公開番号 特開2007-241908
登録番号 特許第4802327号
出願日 平成18年3月11日(2006.3.11)
公開日 平成19年9月20日(2007.9.20)
登録日 平成23年8月19日(2011.8.19)
発明者
  • 松原 茂樹
  • 加藤 芳秀
出願人
  • 国立大学法人名古屋大学
発明の名称 依存構造に基づく例文検索方法、プログラム、および例文検索プログラムを記録した記録媒体、ならびに例文検索装置 コモンズ
発明の概要

【課題】特別な表現による検索条件を必要とすることなく、蓄積された複数の例文から、検索条件に含まれる単語を構文的に含む例文を検索する例文検索方法、装置およびプログラムを提供する。
【解決手段】予め蓄積された複数の例文と、そのそれぞれの例文を構成する単語間の依存関係を予め解析して得られた依存構造情報とをあわせて蓄積する言語資料蓄積工程と、検索しようとする文に含まれる複数の単語と該単語の順序とに基づく検索条件を設定する検索条件設定工程と、複数の単語の依存構造を表現する依存構造パターンを生成する依存構造パターン生成工程と、前記依存構造パターン生成工程によって、前記複数の例文のうち、前記検索条件に含まれるすべての単語間の依存構造を一の依存構造パターンで生成できたものを前記検索条件に該当するものとして選択する文選択工程とを有する。
【選択図】図9

従来技術、競合技術の概要


正しい英文を作成するために、用例を参照し模倣することが効果的であり、大量の例文の中から、参照に値する英文を容易に見つけることは、英文作成者にとって重要である。そのため、英文作成者は、適切な英文用例を見つけるために、「手がかりとなるフレーズ」を入力し、それを含む英文が出力される英文用例検索の環境を必要としている。



このような要求のもと、近年、大量の文が集積された大規模コーパス(corpus;言語資料)の重要性はますます高まっており、言語現象の調査、外国語学習、自然言語処理システムの開発など様々な場面で言語資源として活用されている。そして、コーパスを効果的に活用するために、コーパスから任意の検索条件に該当する文を検索する様々なコーパス検索システムが提案されている。



しかしながら、多くのシステムは、キーワードべースの用例検索を実現するにすぎず、このキーワードベースの検索は、単純で直感的であるという利点があるものの、単純なマッチング、すなわち、コーパス中の各文に、検索条件として設定された単語が単に含まれるか否かによってなされる検索であり、構文構造などの言語的構造を活用した検索はできない。このため、複数の単語から成る構文を含む例文を検索したい場合であっても、その複数を単語を単に含むのみであって、目的とする構文として含まれるわけではない文も検索結果に含まれてしまうこととなる。




【特許文献1】特開平9-265476号公報

【非特許文献1】Corley, S., Corley, M., Keller, F,. Crocker, M., and Trewin, S., ”Finding Syntactic Structure in Unparsed Corpora: The Gsearch Corpus Query System”,Computers and the Humanities,Springer Netherland,(オランダ),2001年,35巻,2号,p.81-94

【非特許文献2】Resnik, P. and Elkiss, A. ”The Linguist’s Search Engine: An Overview” the ACL Interactive Poster and Demonstration Sessions 予稿集,(米国),Association for Computational Linguistics,2005年,p.33-36

産業上の利用分野


本発明は、蓄積された言語資料中の複数の例文から、検索条件に該当する例文を検索する例文検索方法に関するものである。

特許請求の範囲 【請求項1】
予め蓄積された言語資料中の複数の例文と該例文を構成する単語間の依存関係についての情報である依存構造情報とから、検索条件に該当する例文を検索する例文検索方法であって、
コンピュータ
検索しようとする文に含まれる複数の単語と該単語の順序とについての入力を受け付け、該入力された内容に基づく検索条件を設定する検索条件設定工程と、
前記複数の例文のそれぞれに対し、前記検索条件設定工程において設定された検索条件に含まれる複数の単語の全てが含まれるか否かを判断し、前記検索条件に含まれる複数の単語の全てが含まれる場合には、前記検索条件に含まれる複数の単語のそれぞれについて、単語間の依存関係を記述するための依存構造パターンの初期状態である初期依存構造パターンを生成する依存構造パターン初期化工程、および、前記例文において該初期依存構造パターンを含む2つの依存構造パターンが存在し、該2つの依存構造パターンにおける主辞が依存関係を有する場合に、該2つの依存構造パターンを結合する操作を実行することにより1つの依存構造パターンを生成する依存構造パターン結合工程を含む依存構造パターン生成工程と、
前記依存構造パターン生成工程によって、前記複数の例文のうち、前記検索条件に含まれる複数の単語のすべての単語間の依存構造を一の依存構造パターンで生成できた例文を前記検索条件に該当するものとして選択する文選択工程と
から構成されることを特徴とする例文検索方法。

【請求項2】
予め蓄積された言語資料中の複数の例文、該例文を構成する単語間の依存関係についての情報である依存構造情報、および、該例文を構成する単語の品詞とから、検索条件に該当する例文を検索する例文検索方法であって、
前記検索条件設定工程は、前記検索しようとする文に含まれる複数の単語のうち少なくとも1つの品詞を、前記単語に加えて、あるいは該単語に替えて前記検索条件として設定するものであり、
前記依存構造パターン生成工程は、前記複数の例文のそれぞれに対し、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語について該単語に加えて設定された品詞が一致する場合、あるいは、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語に替えて設定された品詞が一致する場合に、前記依存構造パターンを生成すること
を特徴とする請求項1の例文検索方法。

【請求項3】
請求項1または2に記載の方法をコンピュータに実行させる例文検索プログラム。

【請求項4】
請求項1または2に記載の方法をコンピュータに実行させる例文検索プログラムを記録したコンピュータ読み取り可能な記録媒体。

【請求項5】
予め蓄積された言語資料中の複数の例文と該例文を構成する単語間の依存関係についての情報である依存構造情報とから、検索条件に該当する例文を検索する例文検索装置であって、
検索しようとする文に含まれる複数の単語と該単語の順序とに基づく検索条件を設定する検索条件設定手段と、
前記複数の例文のそれぞれに対し、前記検索条件設定工程において設定された検索条件に含まれる複数の単語の全てが含まれるか否かを判断し、前記検索条件に含まれる複数の単語の全てが含まれる場合には、前記検索条件に含まれる複数の単語のそれぞれについて、単語間の依存関係を記述するための依存構造パターンの初期状態である初期依存構造パターンを生成する依存構造パターン初期化手段、および、前記例文において該初期依存構造パターンを含む2つの依存構造パターンが存在し、該2つの依存構造パターンにおける主辞が依存関係を有する場合に、該2つの依存構造パターンを結合する操作を実行することにより1つの依存構造パターンを生成する依存構造パターン結合手段を含む依存構造パターン生成手段と、
前記依存構造パターン生成手段によって、前記複数の例文のうち、前記検索条件に含まれる複数の単語のすべての単語間の依存構造を一の依存構造パターンで生成できた例文を前記検索条件に該当するものとして選択する文選択手段と
を有することを特徴とする例文検索装置。

【請求項6】
予め蓄積された言語資料中の複数の例文、該例文を構成する単語間の依存関係についての情報である依存構造情報、および、該例文を構成する単語の品詞とから、検索条件に該当する例文を検索する例文検索装置であって、
前記検索条件設定手段は、前記検索しようとする文に含まれる複数の単語のうち少なくとも1つの品詞を、前記単語に加えて、あるいは該単語に替えて前記検索条件として設定するものであり、
前記依存構造パターン生成手段は、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語について該単語に加えて設定された品詞が一致する場合、あるいは、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語に替えて設定された品詞が一致する場合に、前記依存構造パターンを生成すること
を特徴とする請求項5の例文検索装置。
産業区分
  • 計算機応用
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2006066829thum.jpg
出願権利状態 権利存続中
名古屋大学の公開特許情報を掲載しています。ご関心のある案件がございましたら、下記まで電子メールでご連絡ください。


PAGE TOP

close
close
close
close
close
close
close