TOP > 国内特許検索 > 関係情報拡張装置、関係情報拡張方法、及びプログラム

関係情報拡張装置、関係情報拡張方法、及びプログラム コモンズ

国内特許コード P140010663
整理番号 09-75
掲載日 2014年6月17日
出願番号 特願2010-042938
公開番号 特開2011-180746
登録番号 特許第5398007号
出願日 平成22年2月26日(2010.2.26)
公開日 平成23年9月15日(2011.9.15)
登録日 平成25年11月1日(2013.11.1)
発明者
  • 土田 正明
  • ステイン デ サーガ
  • 鳥澤 健太郎
  • 村田 真樹
  • 風間 淳一
  • 黒田 航
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 関係情報拡張装置、関係情報拡張方法、及びプログラム コモンズ
発明の概要 【課題】意味的関係を有する2以上の言語表現を有する既存の関係情報を元に、新たな関係を獲得することができる関係情報拡張装置を提供する。
【解決手段】関係情報が記憶される関係情報記憶部11と、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部12と、関係情報に含まれる少なくとも1個の言語表現を、類似情報を用いて、その言語表現に類似する言語表現に置換した拡張関係候補情報を生成して拡張関係候補情報記憶部14に蓄積する拡張関係候補情報生成部13と、拡張関係候補情報が意味的関係を有する確からしさを示すスコアを取得するスコア取得部15と、そのスコアを用いて、拡張関係候補情報のうち、スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部16と、を備える。
【選択図】図1
従来技術、競合技術の概要



従来、意味的関係を有する2以上の言語表現を有する関係情報を取得することが行われていた。ここで、意味的関係とは、例えば、原因や、上位下位等の関係である。したがって、関係情報は、例えば、死亡の原因が心筋梗塞であることを示す「原因<心筋梗塞、死亡>」や、頭痛薬の上位語が薬であることを示す「上位<薬、頭痛薬>」等である。その関係情報を取得する方法として、例えば、非特許文献1で開示されている方法を用いることができる。その非特許文献1では、例えば、「XがYの原因である」という表現のパターンを手がかりとして、文書からX,Yの部分を取得することにより、関係情報を取得することができた。しかしながら、そのようなパターンを用いた方法では、その手がかりとなるパターンで書かれた関係しか取得できないという問題があった。





その問題を解決するための方法として、類推を用いて関係情報を取得する方法が、例えば、非特許文献2で開示されている。

産業上の利用分野



本発明は、意味的関係を有する2以上の言語表現を有する関係情報を拡張する関係情報拡張装置等に関する。

特許請求の範囲 【請求項1】
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアを取得するスコア取得部と、
前記スコア取得部が取得した経由スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該経由スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備えた関係情報拡張装置。

【請求項2】
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアと、前記拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアとを取得するスコア取得部と、
前記スコア取得部が取得した共起スコアと経由スコアとを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアが高く、かつ、当該経由スコアが高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備えた関係情報拡張装置。

【請求項3】
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアを取得するスコア取得部と、
前記スコア取得部が取得した共起スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備え、
前記スコア取得部は、前記拡張関係候補情報に含まれる2以上の言語表現と、当該拡張関係候補情報の生成時に用いられた関係情報の意味的関係と同じ種類の意味的関係を有する各関係情報に含まれる2以上の言語表現に対して共起の高い言語表現である共起言語表現とが共起する方が、前記拡張関係候補情報に含まれる2以上の言語表現のみが共起するよりも高い値となる共起スコアを取得する関係情報拡張装置。

【請求項4】
前記関係情報は、当該関係情報が有する2以上の言語表現の意味的関係の種類を識別する情報である種類識別情報をも有するものであり、
前記拡張関係候補情報生成部は、拡張関係候補情報の生成に用いる関係情報が有する種類識別情報を有する拡張関係候補情報を生成し、
種類識別情報と、当該種類識別情報に対応する、当該種類識別情報で識別される意味的関係の種類に対応する1以上の共起言語表現とを有する対応情報が1以上記憶される対応情報記憶部をさらに備え、
前記スコア取得部は、前記拡張関係候補情報に含まれる2以上の言語表現と、当該拡張関係候補情報が有する種類識別情報に対応する各共起言語表現とが共起する方が、前記拡張関係候補情報に含まれる2以上の言語表現のみが共起するよりも高い値となる共起スコアを取得する、請求項記載の関係情報拡張装置。

【請求項5】
前記スコア取得部は、2以上の言語表現の組に含まれる当該2以上の言語表現と共起する言語表現を少なくとも素性として用い、当該素性の値及び2以上の言語表現の組に対する意味的関係の有無を教師データとする機械学習を行い、前記拡張関係候補情報に含まれる2以上の言語表現を入力した場合の出力である確信度に応じた共起スコアを取得する、請求項記載の関係情報拡張装置。

【請求項6】
前記経由スコアは、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となると共に、当該拡張関係候補情報の生成時の置換における置換前の言語表現と置換後の言語表現とが類似しているほど、より高い値となるスコアである、請求項または請求項記載の関係情報拡張装置。

【請求項7】
関係情報及び拡張関係候補情報は、第1の言語表現と第2の言語表現とである2個の言語表現を有するものであり、
前記スコア取得部は、ある拡張関係候補情報について、当該拡張関係候補情報と第2の言語表現が一致する各関係情報の第1の言語表現と、当該拡張関係候補情報の第1の言語表現との類似度の和である第1の計算値と、当該拡張関係候補情報と第1の言語表現が一致する各関係情報の第2の言語表現と、当該拡張関係候補情報の第2の言語表現との類似度の和である第2の計算値と、前記関係情報記憶部で記憶されている各関係情報と当該拡張関係候補情報との第1の言語表現同士の類似度及び第2の言語表現同士の類似度の積の和である第3の計算値とのうち、任意の1以上の計算値を引数とする増加関数の値である経由スコアを取得する、請求項記載の関係情報拡張装置。

【請求項8】
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアを取得するスコア取得部と、
前記スコア取得部が取得したスコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備え、
前記関係情報は、当該関係情報が有する2以上の言語表現の意味的関係の種類を識別する情報である種類識別情報をも有するものであり、
前記類似情報記憶部では、種類識別情報と、当該種類識別情報に対応する類似情報とが記憶されており、
前記拡張関係候補情報生成部は、前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を置換する際に、当該関係情報が有する種類識別情報に対応する類似情報を用いて置換を行う関係情報拡張装置。

【請求項9】
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、拡張関係候補情報生成部と、スコア取得部と、選択部とを用いて処理される関係情報拡張方法であって、
前記拡張関係候補情報生成部が、前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成ステップと、
前記スコア取得部が、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアを取得するスコア取得ステップと、
前記選択部が、前記スコア取得ステップで取得した経由スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該経由スコアの高い拡張関係候補情報である拡張関係情報を選択する選択ステップと、を備えた関係情報拡張方法。

【請求項10】
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、拡張関係候補情報生成部と、スコア取得部と、選択部とを用いて処理される関係情報拡張方法であって、
前記拡張関係候補情報生成部が、前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成ステップと、
前記スコア取得部が、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアと、前記拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアとを取得するスコア取得ステップと、
前記選択部が、前記スコア取得ステップで取得した共起スコアと経由スコアとを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアが高く、かつ、当該経由スコアが高い拡張関係候補情報である拡張関係情報を選択する選択ステップと、を備えた関係情報拡張方法。

【請求項11】
コンピュータを、
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部で記憶されている類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を、拡張関係候補情報が記憶される拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアを取得するスコア取得部、
前記スコア取得部が取得した経由スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該経由スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部として機能させるためのプログラム。

【請求項12】
コンピュータを、
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部で記憶されている類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を、拡張関係候補情報が記憶される拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアと、前記拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアとを取得するスコア取得部、
前記スコア取得部が取得した共起スコアと経由スコアとを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアが高く、かつ、当該経由スコアが高い拡張関係候補情報である拡張関係情報を選択する選択部として機能させるためのプログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2010042938thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close