Top > Search of Japanese Patents > METHOD, PROGRAM, AND APPARATUS FOR RETRIEVING EXAMPLE SENTENCE BASED ON DEPENDENCE STRUCTURE, AND RECORDING MEDIUM FOR RECORDING EXAMPLE SENTENCE RETRIEVAL PROGRAM

METHOD, PROGRAM, AND APPARATUS FOR RETRIEVING EXAMPLE SENTENCE BASED ON DEPENDENCE STRUCTURE, AND RECORDING MEDIUM FOR RECORDING EXAMPLE SENTENCE RETRIEVAL PROGRAM commons

Patent code P07P004865
File No. NU-0093
Posted date Nov 2, 2007
Application number P2006-066829
Publication number P2007-241908A
Patent number P4802327
Date of filing Mar 11, 2006
Date of publication of application Sep 20, 2007
Date of registration Aug 19, 2011
Inventor
  • (In Japanese)松原 茂樹
  • (In Japanese)加藤 芳秀
Applicant
  • (In Japanese)国立大学法人名古屋大学
Title METHOD, PROGRAM, AND APPARATUS FOR RETRIEVING EXAMPLE SENTENCE BASED ON DEPENDENCE STRUCTURE, AND RECORDING MEDIUM FOR RECORDING EXAMPLE SENTENCE RETRIEVAL PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To provide a method, an apparatus, and a program for retrieving an example sentence syntactically including a word included in a retrieval condition from a plurality of stored example sentences, without requiring the retrieval condition in a special expression.
SOLUTION: The method for retrieving an example sentence comprises: a language material storage process for storing a plurality of example sentences stored beforehand, along with dependence structure information obtained by analyzing the dependence between words composing respective example sentences beforehand; a retrieval condition setting process for setting a retrieval condition, based on a plurality of words included in a sentence to be retrieved and the order of the words; a dependence structure pattern generation process for generating a dependence structure pattern which expresses the dependence structure of the plurality of words; and a sentence selection process for selecting an example sentence, in which the dependence structures between all the words included in the retrieval condition, can be generated in one dependence structure pattern by the dependence structure pattern generation process, from the plurality of example sentences, as what matches the retrieval condition.
Outline of related art and contending technology (In Japanese)

正しい英文を作成するために、用例を参照し模倣することが効果的であり、大量の例文の中から、参照に値する英文を容易に見つけることは、英文作成者にとって重要である。そのため、英文作成者は、適切な英文用例を見つけるために、「手がかりとなるフレーズ」を入力し、それを含む英文が出力される英文用例検索の環境を必要としている。

このような要求のもと、近年、大量の文が集積された大規模コーパス(corpus;言語資料)の重要性はますます高まっており、言語現象の調査、外国語学習、自然言語処理システムの開発など様々な場面で言語資源として活用されている。そして、コーパスを効果的に活用するために、コーパスから任意の検索条件に該当する文を検索する様々なコーパス検索システムが提案されている。

しかしながら、多くのシステムは、キーワードべースの用例検索を実現するにすぎず、このキーワードベースの検索は、単純で直感的であるという利点があるものの、単純なマッチング、すなわち、コーパス中の各文に、検索条件として設定された単語が単に含まれるか否かによってなされる検索であり、構文構造などの言語的構造を活用した検索はできない。このため、複数の単語から成る構文を含む例文を検索したい場合であっても、その複数を単語を単に含むのみであって、目的とする構文として含まれるわけではない文も検索結果に含まれてしまうこととなる。

【特許文献1】
特開平9-265476号公報
【非特許文献1】
Corley, S., Corley, M., Keller, F,. Crocker, M., and Trewin, S., ”Finding Syntactic Structure in Unparsed Corpora: The Gsearch Corpus Query System”,Computers and the Humanities,Springer Netherland,(オランダ),2001年,35巻,2号,p.81-94
【非特許文献2】
Resnik, P. and Elkiss, A. ”The Linguist’s Search Engine: An Overview” the ACL Interactive Poster and Demonstration Sessions 予稿集,(米国),Association for Computational Linguistics,2005年,p.33-36

Field of industrial application (In Japanese)

本発明は、蓄積された言語資料中の複数の例文から、検索条件に該当する例文を検索する例文検索方法に関するものである。

Scope of claims (In Japanese)
【請求項1】
 
予め蓄積された言語資料中の複数の例文と該例文を構成する単語間の依存関係についての情報である依存構造情報とから、検索条件に該当する例文を検索する例文検索方法であって、
コンピュータ
検索しようとする文に含まれる複数の単語と該単語の順序とについての入力を受け付け、該入力された内容に基づく検索条件を設定する検索条件設定工程と、
前記複数の例文のそれぞれに対し、前記検索条件設定工程において設定された検索条件に含まれる複数の単語の全てが含まれるか否かを判断し、前記検索条件に含まれる複数の単語の全てが含まれる場合には、前記検索条件に含まれる複数の単語のそれぞれについて、単語間の依存関係を記述するための依存構造パターンの初期状態である初期依存構造パターンを生成する依存構造パターン初期化工程、および、前記例文において該初期依存構造パターンを含む2つの依存構造パターンが存在し、該2つの依存構造パターンにおける主辞が依存関係を有する場合に、該2つの依存構造パターンを結合する操作を実行することにより1つの依存構造パターンを生成する依存構造パターン結合工程を含む依存構造パターン生成工程と、
前記依存構造パターン生成工程によって、前記複数の例文のうち、前記検索条件に含まれる複数の単語のすべての単語間の依存構造を一の依存構造パターンで生成できた例文を前記検索条件に該当するものとして選択する文選択工程と
から構成されることを特徴とする例文検索方法。

【請求項2】
 
予め蓄積された言語資料中の複数の例文、該例文を構成する単語間の依存関係についての情報である依存構造情報、および、該例文を構成する単語の品詞とから、検索条件に該当する例文を検索する例文検索方法であって、
前記検索条件設定工程は、前記検索しようとする文に含まれる複数の単語のうち少なくとも1つの品詞を、前記単語に加えて、あるいは該単語に替えて前記検索条件として設定するものであり、
前記依存構造パターン生成工程は、前記複数の例文のそれぞれに対し、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語について該単語に加えて設定された品詞が一致する場合、あるいは、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語に替えて設定された品詞が一致する場合に、前記依存構造パターンを生成すること
を特徴とする請求項1の例文検索方法。

【請求項3】
 
請求項1または2に記載の方法をコンピュータに実行させる例文検索プログラム。

【請求項4】
 
請求項1または2に記載の方法をコンピュータに実行させる例文検索プログラムを記録したコンピュータ読み取り可能な記録媒体。

【請求項5】
 
予め蓄積された言語資料中の複数の例文と該例文を構成する単語間の依存関係についての情報である依存構造情報とから、検索条件に該当する例文を検索する例文検索装置であって、
検索しようとする文に含まれる複数の単語と該単語の順序とに基づく検索条件を設定する検索条件設定手段と、
前記複数の例文のそれぞれに対し、前記検索条件設定工程において設定された検索条件に含まれる複数の単語の全てが含まれるか否かを判断し、前記検索条件に含まれる複数の単語の全てが含まれる場合には、前記検索条件に含まれる複数の単語のそれぞれについて、単語間の依存関係を記述するための依存構造パターンの初期状態である初期依存構造パターンを生成する依存構造パターン初期化手段、および、前記例文において該初期依存構造パターンを含む2つの依存構造パターンが存在し、該2つの依存構造パターンにおける主辞が依存関係を有する場合に、該2つの依存構造パターンを結合する操作を実行することにより1つの依存構造パターンを生成する依存構造パターン結合手段を含む依存構造パターン生成手段と、
前記依存構造パターン生成手段によって、前記複数の例文のうち、前記検索条件に含まれる複数の単語のすべての単語間の依存構造を一の依存構造パターンで生成できた例文を前記検索条件に該当するものとして選択する文選択手段と
を有することを特徴とする例文検索装置。

【請求項6】
 
予め蓄積された言語資料中の複数の例文、該例文を構成する単語間の依存関係についての情報である依存構造情報、および、該例文を構成する単語の品詞とから、検索条件に該当する例文を検索する例文検索装置であって、
前記検索条件設定手段は、前記検索しようとする文に含まれる複数の単語のうち少なくとも1つの品詞を、前記単語に加えて、あるいは該単語に替えて前記検索条件として設定するものであり、
前記依存構造パターン生成手段は、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語について該単語に加えて設定された品詞が一致する場合、あるいは、該例文に前記検索条件に含まれる複数の単語の全てが含まれ、かつ該複数の単語のうち少なくとも1つの単語に替えて設定された品詞が一致する場合に、前記依存構造パターンを生成すること
を特徴とする請求項5の例文検索装置。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2006066829thum.jpg
State of application right Registered
(In Japanese)名古屋大学の公開特許情報を掲載しています。ご関心のある案件がございましたら、下記まで電子メールでご連絡ください。


PAGE TOP

close
close
close
close
close
close
close