TOP > 国内特許検索 > 類推方法、類推システム及び類推プログラム

類推方法、類推システム及び類推プログラム 実績あり

国内特許コード P120007219
整理番号 2009-P45
掲載日 2012年4月5日
出願番号 特願2010-083666
公開番号 特開2011-215898
登録番号 特許第5640258号
出願日 平成22年3月31日(2010.3.31)
公開日 平成23年10月27日(2011.10.27)
登録日 平成26年11月7日(2014.11.7)
発明者
  • 高木 友博
出願人
  • 学校法人明治大学
発明の名称 類推方法、類推システム及び類推プログラム 実績あり
発明の概要 【課題】構造写像理論に基づく類推方式によって精度良くある程度正しい解を得る。
【解決手段】類推システムは、類推に用いられる知識情報が蓄積されたコーパス10と、写像対象となるベース1,2との関係Rを抽出する関係抽出モジュール20と、抽出された関係Rをターゲットに写像する関係写像モジュール30とを備える。そして、コーパス10からベース1,2が同時に出現する文を抽出し、抽出された文から関係Rを表す単語rを抽出する。また、ターゲットに関係Rを写像して、ターゲットと単語rとが同時に出現する文をコーパス10から抽出し、抽出された文から関係Rに基づく解Xの候補となる単語xを抽出することを、全ての単語rについて行う。そして、算出された所属度gradeX(x)の値が高い所定数の単語xを解Xに含まれるターゲットに関係する候補語として抽出する。
【選択図】図1
従来技術、競合技術の概要


従来より、類推の最も基本的な形として、A:B=C:Xという4項類推が知られている。4項類推は、例えばAとB間の関係を推理し、基底領域(ベース)から目標領域(ターゲット)へ関係を写像し、推理された関係をCとXに適用するというようなアプローチで行われ、その処理過程はベースからターゲットへと関係を写像することが中心となる(非特許文献1及び2)。なお、ここでベースとは、類推する際に用いる既存の知識のことであり、ターゲットとは、解決しなければならない未知の問題を指す。



また、関係の写像においては、構造写像理論が知られている(非特許文献3)。この構造写像理論では、写像の際に膨大に生じてしまう無意味な知識を、構造を利用することで排除するアプローチが取られている。この理論によれば、妥当な類推写像は、属性の非写像、構造の一貫性、システム性原理の3つの基準を満たすとされている。

産業上の利用分野


この発明は、構造写像理論に基づく類推方式を用いた類推方法、類推システム及び類推プログラムに関する。

特許請求の範囲 【請求項1】
複数の基底語(base1,base2)の間の関係Rから、目標語(target)との間で関係Rにある解Xを類推する構造写像理論に基づく類推方法であって、
類推に用いられる知識情報として形態素解析された複数の文が蓄積されたコーパスから、前記複数の基底語に基づき前記関係Rを抽出する関係抽出モジュールによって、前記複数の基底語が同時に出現する文を抽出する第1ステップと、
前記関係抽出モジュールによって前記抽出された文に含まれる単語から前記複数の基底語の間の関係Rを表す単語rを抽出する第2ステップと、
前記関係抽出モジュールによって前記抽出された単語rについて、前記関係Rへの所属度gradeR(r)を算出する第3ステップと、
前記関係抽出モジュールにより抽出された関係Rを前記目標語に写像する関係写像モジュールによって、前記目標語と前記単語rとが同時に出現する文を前記コーパスから抽出する第4ステップと、
前記関係写像モジュールによって前記抽出された文に含まれる単語の中から、前記目標語との間で関係Rにある単語xを抽出する第5ステップと、
前記第4ステップ及び前記第5ステップを前記抽出された全ての単語rについて行い、これにより抽出された全ての単語xに対して前記関係写像モジュールにより前記解Xへの所属度gradeX(x)を算出する第6ステップと、
前記算出された所属度gradeX(x)の値が高い所定数の単語xを前記解Xに含まれる前記目標語に関係する候補語として前記関係写像モジュールにより抽出する第7ステップと
を備え、
前記第5ステップでは、前記単語xは前記複数の基底語及び前記単語rの前記文における記載順序に基づき抽出される
ことを特徴とする類推方法。

【請求項2】
前記第4ステップでは、前記所属度gradeR(r)の値が所定値よりも高い単語rと前記目標語とが同時に出現する文のみを抽出する
ことを特徴とする請求項1記載の類推方法。

【請求項3】
前記関係Rは、この関係Rを構成する単語をrとし、メンバーシップ関数の値をgradeR(r)とした場合、


として表される概念ファジィ集合であり、
前記解Xは、この解Xを構成する単語をxとし、メンバーシップ関数の値をgradeX(x)とした場合、


として表される概念ファジィ集合である
ことを特徴とする請求項1又は2記載の類推方法。

【請求項4】
前記所属度gradeR(r)の値は、
count(r)を関係Rとして抽出された単語rに対する頻度、N(base1∩base2)を複数の基底語が同時に出現した文の数、N(r)をコーパスに含まれる文中に単語rが現れる文の数、Ndocをコーパスに含まれる全ての文の数とした場合、


として表される(ただしα、βは調整可能なパラメータ)
ことを特徴とする請求項1~3のいずれか1項記載の類推方法。

【請求項5】
前記所属度gradeX(x)の値は、
gradeX(x|r)を単語rが目標語に写像されたときに単語xが解Xとして正しいかを示す指数、Nrを目標語に代表される単語rの数とした場合、


として表される
ことを特徴とする請求項1~4のいずれか1項記載の類推方法。

【請求項6】
前記gradeX(x|r)の値は、
count(x|r)を単語rが目標語に写像されたときの解Xの候補として抽出される頻度、N(r∩target)をコーパスに含まれる単語rと目標語とが同時に出現した文の数、N(x)をコーパスに含まれる文中に単語xが現れる文の数、Ndocをコーパスに含まれる全ての文の数とした場合、


として表される(ただしγ、δは調整可能なパラメータ)
ことを特徴とする請求項5記載の類推方法。

【請求項7】
複数の基底語(base1,base2)の間の関係Rから、目標語(target)との間で関係Rにある解Xを類推する構造写像理論に基づく類推方式を用いた類推システムであって、
類推に用いられる知識情報として形態素解析された複数の文をコーパスとして蓄積する蓄積手段と、
前記コーパスから前記複数の基底語が同時に出現する文を抽出すると共に、抽出された文に含まれる単語から前記複数の基底語の間の関係Rを表す単語rを抽出する第1抽出手段と、
前記抽出された単語rについて、前記関係Rへの所属度gradeR(r)を算出する第1算出手段と、
前記目標語と前記単語rとが同時に出現する文を前記コーパスから抽出すると共に、抽出された文に含まれる単語の中から、前記目標語との間で関係Rにある単語xを抽出することを、前記抽出された全ての単語rについて行う第2抽出手段と、
前記抽出された全ての単語xに対して前記解Xへの所属度gradeX(x)を算出する第2算出手段と、
前記算出された所属度gradeX(x)の値が高い所定数の単語xを前記解Xに含まれる前記目標語に関係する候補語として抽出する第3抽出手段と
を備え、
前記第2抽出手段は、前記単語xを前記複数の基底語及び前記単語rの前記文における記載順序に基づき抽出する
ことを特徴とする類推システム。

【請求項8】
複数の基底語(base1,base2)の間の関係Rから、目標語(target)との間で関係Rにある解Xを類推する構造写像理論に基づく類推方式をコンピュータに実行させる類推プログラムであって、
コンピュータに、
類推に用いられる知識情報として形態素解析された複数の文が蓄積されたコーパスから、前記複数の基底語が同時に出現する文を抽出させる第1処理と、
前記抽出された文に含まれる単語から前記複数の基底語の間の関係Rを表す単語rを抽出させる第2処理と、
前記抽出された単語rについて、前記関係Rへの所属度gradeR(r)を算出させる第3処理と、
前記目標語と前記単語rとが同時に出現する文を前記コーパスから抽出させる第4処理と、
前記抽出された文に含まれる単語の中から、前記目標語との間で関係Rにある単語xを抽出させる第5処理と、
前記第4処理及び前記第5処理を前記抽出された全ての単語rについて行い、これにより抽出された全ての単語xに対して前記解Xへの所属度gradeX(x)を算出させる第6処理と、
前記算出された所属度gradeX(x)の値が高い所定数の単語xを前記解Xに含まれる前記目標語に関係する候補語として抽出させる第7処理と
を実行させ、
前記第5処理では、前記単語xは前記複数の基底語及び前記単語rの前記文における記載順序に基づき抽出される
ことを特徴とする類推プログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2010083666thum.jpg
出願権利状態 登録
掲載中の発明について更に詳しい内容の説明を御希望の際は、お気軽にお問い合せください。


PAGE TOP

close
close
close
close
close
close
close