Top > Search of Japanese Patents > RELATIONAL INFORMATION EXPANSION DEVICE, RELATIONAL INFORMATION EXPANSION METHOD AND PROGRAM

RELATIONAL INFORMATION EXPANSION DEVICE, RELATIONAL INFORMATION EXPANSION METHOD AND PROGRAM commons

Patent code P140010663
File No. 09-75
Posted date Jun 17, 2014
Application number P2010-042938
Publication number P2011-180746A
Patent number P5398007
Date of filing Feb 26, 2010
Date of publication of application Sep 15, 2011
Date of registration Nov 1, 2013
Inventor
  • (In Japanese)土田 正明
  • (In Japanese)ステイン デ サーガ
  • (In Japanese)鳥澤 健太郎
  • (In Japanese)村田 真樹
  • (In Japanese)風間 淳一
  • (In Japanese)黒田 航
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title RELATIONAL INFORMATION EXPANSION DEVICE, RELATIONAL INFORMATION EXPANSION METHOD AND PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To provide a relational information expansion device acquiring a new relation based on existing relational information having two or more language expressions having semantic relations.
SOLUTION: The relational information expansion device includes: a relational information storage part 11 storing relational information; a similar information storage part 12 storing two or more pieces of similar information having two or more similar language expressions; an expanded relation candidate information generation part 13 generating expanded relation candidate information where at least one language expression included in the relational information is replaced with a language expression similar to the language expression by the use of the similar information, and accumulating it in an expanded relation candidate information storage part 14; a score acquisition part 15 acquiring a score indicating certainty that the expanded relation candidate information has the semantic relation; and a selection part 16 selecting expanded relational information that is the expanded relation candidate information having a high score out of the expanded relation candidate information by the use of the score.
Outline of related art and contending technology (In Japanese)

従来、意味的関係を有する2以上の言語表現を有する関係情報を取得することが行われていた。ここで、意味的関係とは、例えば、原因や、上位下位等の関係である。したがって、関係情報は、例えば、死亡の原因が心筋梗塞であることを示す「原因<心筋梗塞、死亡>」や、頭痛薬の上位語が薬であることを示す「上位<薬、頭痛薬>」等である。その関係情報を取得する方法として、例えば、非特許文献1で開示されている方法を用いることができる。その非特許文献1では、例えば、「XがYの原因である」という表現のパターンを手がかりとして、文書からX,Yの部分を取得することにより、関係情報を取得することができた。しかしながら、そのようなパターンを用いた方法では、その手がかりとなるパターンで書かれた関係しか取得できないという問題があった。

その問題を解決するための方法として、類推を用いて関係情報を取得する方法が、例えば、非特許文献2で開示されている。

Field of industrial application (In Japanese)

本発明は、意味的関係を有する2以上の言語表現を有する関係情報を拡張する関係情報拡張装置等に関する。

Scope of claims (In Japanese)
【請求項1】
 
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアを取得するスコア取得部と、
前記スコア取得部が取得した経由スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該経由スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備えた関係情報拡張装置。

【請求項2】
 
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアと、前記拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアとを取得するスコア取得部と、
前記スコア取得部が取得した共起スコアと経由スコアとを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアが高く、かつ、当該経由スコアが高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備えた関係情報拡張装置。

【請求項3】
 
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアを取得するスコア取得部と、
前記スコア取得部が取得した共起スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備え、
前記スコア取得部は、前記拡張関係候補情報に含まれる2以上の言語表現と、当該拡張関係候補情報の生成時に用いられた関係情報の意味的関係と同じ種類の意味的関係を有する各関係情報に含まれる2以上の言語表現に対して共起の高い言語表現である共起言語表現とが共起する方が、前記拡張関係候補情報に含まれる2以上の言語表現のみが共起するよりも高い値となる共起スコアを取得する関係情報拡張装置。

【請求項4】
 
前記関係情報は、当該関係情報が有する2以上の言語表現の意味的関係の種類を識別する情報である種類識別情報をも有するものであり、
前記拡張関係候補情報生成部は、拡張関係候補情報の生成に用いる関係情報が有する種類識別情報を有する拡張関係候補情報を生成し、
種類識別情報と、当該種類識別情報に対応する、当該種類識別情報で識別される意味的関係の種類に対応する1以上の共起言語表現とを有する対応情報が1以上記憶される対応情報記憶部をさらに備え、
前記スコア取得部は、前記拡張関係候補情報に含まれる2以上の言語表現と、当該拡張関係候補情報が有する種類識別情報に対応する各共起言語表現とが共起する方が、前記拡張関係候補情報に含まれる2以上の言語表現のみが共起するよりも高い値となる共起スコアを取得する、請求項3記載の関係情報拡張装置。

【請求項5】
 
前記スコア取得部は、2以上の言語表現の組に含まれる当該2以上の言語表現と共起する言語表現を少なくとも素性として用い、当該素性の値及び2以上の言語表現の組に対する意味的関係の有無を教師データとする機械学習を行い、前記拡張関係候補情報に含まれる2以上の言語表現を入力した場合の出力である確信度に応じた共起スコアを取得する、請求項3記載の関係情報拡張装置。

【請求項6】
 
前記経由スコアは、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となると共に、当該拡張関係候補情報の生成時の置換における置換前の言語表現と置換後の言語表現とが類似しているほど、より高い値となるスコアである、請求項1または請求項2記載の関係情報拡張装置。

【請求項7】
 
関係情報及び拡張関係候補情報は、第1の言語表現と第2の言語表現とである2個の言語表現を有するものであり、
前記スコア取得部は、ある拡張関係候補情報について、当該拡張関係候補情報と第2の言語表現が一致する各関係情報の第1の言語表現と、当該拡張関係候補情報の第1の言語表現との類似度の和である第1の計算値と、当該拡張関係候補情報と第1の言語表現が一致する各関係情報の第2の言語表現と、当該拡張関係候補情報の第2の言語表現との類似度の和である第2の計算値と、前記関係情報記憶部で記憶されている各関係情報と当該拡張関係候補情報との第1の言語表現同士の類似度及び第2の言語表現同士の類似度の積の和である第3の計算値とのうち、任意の1以上の計算値を引数とする増加関数の値である経由スコアを取得する、請求項6記載の関係情報拡張装置。

【請求項8】
 
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、
類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、
少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、
前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部と、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアを取得するスコア取得部と、
前記スコア取得部が取得したスコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部と、を備え、
前記関係情報は、当該関係情報が有する2以上の言語表現の意味的関係の種類を識別する情報である種類識別情報をも有するものであり、
前記類似情報記憶部では、種類識別情報と、当該種類識別情報に対応する類似情報とが記憶されており、
前記拡張関係候補情報生成部は、前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を置換する際に、当該関係情報が有する種類識別情報に対応する類似情報を用いて置換を行う関係情報拡張装置。

【請求項9】
 
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、拡張関係候補情報生成部と、スコア取得部と、選択部とを用いて処理される関係情報拡張方法であって、
前記拡張関係候補情報生成部が、前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成ステップと、
前記スコア取得部が、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアを取得するスコア取得ステップと、
前記選択部が、前記スコア取得ステップで取得した経由スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該経由スコアの高い拡張関係候補情報である拡張関係情報を選択する選択ステップと、を備えた関係情報拡張方法。

【請求項10】
 
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部と、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部と、少なくとも1個の言語表現が類似する言語表現に置換された関係情報である拡張関係候補情報が記憶される拡張関係候補情報記憶部と、拡張関係候補情報生成部と、スコア取得部と、選択部とを用いて処理される関係情報拡張方法であって、
前記拡張関係候補情報生成部が、前記関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、前記類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を前記拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成ステップと、
前記スコア取得部が、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアと、前記拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアとを取得するスコア取得ステップと、
前記選択部が、前記スコア取得ステップで取得した共起スコアと経由スコアとを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアが高く、かつ、当該経由スコアが高い拡張関係候補情報である拡張関係情報を選択する選択ステップと、を備えた関係情報拡張方法。

【請求項11】
 
コンピュータを、
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部で記憶されている類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を、拡張関係候補情報が記憶される拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアを取得するスコア取得部、
前記スコア取得部が取得した経由スコアを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該経由スコアの高い拡張関係候補情報である拡張関係情報を選択する選択部として機能させるためのプログラム。

【請求項12】
 
コンピュータを、
意味的関係を有する2以上の言語表現を有する関係情報が記憶される関係情報記憶部で記憶されている関係情報に含まれる少なくとも1個の言語表現を、類似する2以上の言語表現を有する類似情報が2以上記憶される類似情報記憶部で記憶されている類似情報を用いて、当該言語表現に類似する言語表現に置換した拡張関係候補情報を生成し、当該拡張関係候補情報を、拡張関係候補情報が記憶される拡張関係候補情報記憶部に蓄積する拡張関係候補情報生成部、
前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、前記拡張関係候補情報に含まれる2以上の言語表現の共起に関するスコアである共起スコアと、前記拡張関係候補情報が意味的関係を有する確からしさを示すスコアであり、拡張関係候補情報がより多くの関係情報から得られるものであるほど、より高い値となるスコアである経由スコアとを取得するスコア取得部、
前記スコア取得部が取得した共起スコアと経由スコアとを用いて、前記拡張関係候補情報記憶部で記憶されている拡張関係候補情報のうち、当該共起スコアが高く、かつ、当該経由スコアが高い拡張関係候補情報である拡張関係情報を選択する選択部として機能させるためのプログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2010042938thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close