TOP > 国内特許検索 > キーワード強調装置及びプログラム

キーワード強調装置及びプログラム コモンズ

国内特許コード P140010727
整理番号 03-08
掲載日 2014年7月7日
出願番号 特願2003-067045
公開番号 特開2004-280176
登録番号 特許第3981729号
出願日 平成15年3月12日(2003.3.12)
公開日 平成16年10月7日(2004.10.7)
登録日 平成19年7月13日(2007.7.13)
発明者
  • 村田 真樹
  • 竹内 和広
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 キーワード強調装置及びプログラム コモンズ
発明の概要 【課題】入力されたデータ中で抽出領域の説明に該当する場所を容易に見つけることができるようにすること。
【解決手段】抽出の単位を設定する抽出単位設定手段21と、強調表示する抽出表現を設定する抽出表現設定手段22と、抽出領域の場所を設定する抽出領域設定手段23と、情報を格納する格納手段3aと、抽出手段2とを備え、前記抽出手段2は、前記抽出領域より前記抽出の単位に相当するものを抽出し、そのうち、前記抽出表現に該当するものを前記格納手段3aに格納し、入力されたデータを左から調べて現在の前記抽出の単位に相当するものと同じものが、前記格納手段3aに格納されている場合は、それを強調表示する。
【選択図】 図1
従来技術、競合技術の概要



従来、タイトルは、文書の中で重要なものとされている。例えば、タイトルの部分が重要とし、そこに現れるキーワードの得点を高くすることで情報検索精度の向上を計っている(非特許文献1参照)。





【非特許文献1】

村田真樹,馬青,内元清貴,小作浩美,内山将夫,井佐原均,

位置情報と分野情報を用いた情報検索,

自然言語処理(言語処理学会誌)

2000 年 4月,7 巻,2 号, p.141 ~ p.160

産業上の利用分野



本発明は、タイトル又はユーザが指定した領域に含まれる語を重要なキーワードとし、本文においてそれらキーワードの部分を強調表示するキーワード強調装置及びプログラムに関する。

特許請求の範囲 【請求項1】
抽出の単位を設定する抽出単位設定手段と、
強調表示する抽出表現を設定する抽出表現設定手段と、
入力された1個の文書データの抽出領域の場所を設定する抽出領域設定手段と、
情報を格納する格納手段と、
抽出手段とを備え、
前記抽出手段は、前記抽出領域より前記抽出の単位に相当するものを抽出し、そのうち、前記抽出表現に該当するものを前記格納手段に格納し、前記入力された1個の文書データを調べて現在の前記抽出の単位に相当するものと同じものが、前記格納手段に格納されている場合は、それを強調表示することを特徴としたキーワード強調装置。

【請求項2】
前記入力された1個の文書データを調べて、現在の抽出の単位に相当するものと同じものが前記格納手段に格納されている場合で、一つ前の抽出の単位が強調表示されるものである場合は、前記一つ前の抽出の単位と現在の抽出の単位に相当するものを特別強調表示して表示することを特徴とした請求項1記載のキーワード強調装置。

【請求項3】
前記抽出表現設定手段で強調表示する抽出表現の設定は、少なくとも1つが名詞であることを特徴とする請求項1又は2記載のキーワード強調装置。

【請求項4】
前記抽出領域の場所として、前記入力された1個の文書データのタイトル部分とすることを特徴とした請求項1~3のいずれかに記載のキーワード強調装置。

【請求項5】
前記抽出領域の場所として、前記入力された1個の文書データのユーザが指定した部分とすることを特徴とした請求項1~3のいずれかに記載のキーワード強調装置。

【請求項6】
前記ユーザが指定した部分として、複数部分を指定し、該指定した部分により、異なる強調表示をすることを特徴とした請求項5記載のキーワード強調装置。

【請求項7】
前記入力された1個の文書データの差分を検出するために比較する領域の単位である検出領域を設定する検出領域設定手段と、
文書差分検出装置の格納手段と、
抽出手段とを有し、
前記抽出手段で、入力された1個の文書データの現在の検出領域において、前記文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを抽出し、該抽出したものを前記文書差分検出装置の格納手段に格納することを繰り返す文書差分検出装置を備え、
前記ユーザが指定した部分として、前記文書差分検出装置の前記抽出手段が抽出した前記文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを指定することを特徴とした請求項5又は6記載のキーワード強調装置。

【請求項8】
前記入力された1個の文書データの差分を検出するために比較する領域の単位である検出領域を設定する検出領域設定手段と、
文書差分検出装置の格納手段と、
抽出手段とを有し、
前記抽出手段で、前記入力された1個の文書データの現在の前記検出領域以外の領域から全ての前記抽出単位に相当するものを抽出して前記文書差分検出装置の格納手段に格納し、現在の前記検出領域において、前記文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを抽出することを、前記検出領域ごとに繰り返す文書差分検出装置を備え、
前記ユーザが指定した部分として、前記文書差分検出装置の前記抽出手段が抽出した前記文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを指定することを特徴とした請求項5又は6記載のキーワード強調装置。

【請求項9】
抽出の単位を設定する抽出単位設定手段と、
入力された1個の文書データの検出領域の場所を設定する検出領域設定手段と、
情報を格納する格納手段と、
抽出手段と、
前記抽出手段で、入力された1個の文書データの現在の検出領域において、文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力し、前記強調表示したものを前記文書差分検出装置の格納手段に格納することを、繰り返す文書差分検出装置と、
抽出領域の場所として前記文書差分検出装置が強調表示した部分を設定する抽出領域設定手段とを備え、
前記抽出手段は、前記抽出領域より前記抽出の単位に相当するものを抽出して前記格納手段に格納し、前記入力された1個の文書データを調べて現在の前記抽出の単位に相当するものと同じものが、前記格納手段に格納されている場合は、それを強調表示することを特徴としたキーワード強調装置。

【請求項10】
抽出の単位を設定する抽出単位設定手段と、
入力された1個の文書データの検出領域の場所を設定する検出領域設定手段と、
情報を格納する格納手段と、
抽出手段と、
前記抽出手段で、前記入力された1個の文書データの現在の前記検出領域以外の検出領域から全ての前記抽出単位に相当するものを抽出して文書差分検出装置の格納手段に格納し、現在の前記検出領域において、前記文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返す文書差分検出装置と、
抽出領域の場所として前記文書差分検出装置が強調表示した部分を設定する抽出領域設定手段とを備え、
前記抽出手段は、前記抽出領域より前記抽出の単位に相当するものを抽出して前記格納手段に格納し、前記入力された1個の文書データを調べて現在の前記抽出の単位に相当するものと同じものが、前記格納手段に格納されている場合は、それを強調表示することを特徴としたキーワード強調装置。

【請求項11】
抽出の単位を設定する抽出単位設定手段と、
強調表示する抽出表現を設定する抽出表現設定手段と、
入力された1個の文書データの抽出領域の場所を設定する抽出領域設定手段と、
前記抽出領域より前記抽出の単位に相当するものを抽出し、そのうち、前記抽出表現に該当するものを前記格納手段に格納し、前記入力された1個の文書データを調べて現在の前記抽出の単位に相当するものと同じものが、前記格納手段に格納されている場合は、それを強調表示する抽出手段として、
コンピュータを機能させるためのプログラム。

【請求項12】
抽出の単位を設定する抽出単位設定手段と、
入力された1個の文書データの検出領域の場所を設定する検出領域設定手段と、
抽出手段で、前記入力された1個の文書データの現在の検出領域において、文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力し、前記強調表示したものを前記文書差分検出装置の格納手段に格納することを、繰り返す文書差分検出装置と、
抽出領域の場所として、前記文書差分検出手段が強調表示した部分を設定する抽出領域設定手段と、
前記抽出領域より前記抽出の単位に相当するものを抽出して格納手段に格納し、前記入力された1個の文書データを調べて現在の前記抽出の単位に相当するものと同じものが、前記格納手段に格納されている場合は、それを強調表示する抽出手段として、
コンピュータを機能させるためのプログラム。

【請求項13】
抽出の単位を設定する抽出単位設定手段と、
入力された1個の文書データの検出領域の場所を設定する検出領域設定手段と、
抽出手段で、前記入力された1個の文書データの現在の前記検出領域以外の検出領域から全ての前記抽出単位に相当するものを抽出して文書差分検出装置の格納手段に格納し、現在の前記検出領域において、前記文書差分検出装置の格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返す文書差分検出装置と、
抽出領域の場所として前記文書差分検出装置が強調表示した部分を設定する抽出領域設定手段と、
前記抽出領域より前記抽出の単位に相当するものを抽出して格納手段に格納し、前記入力された1個の文書データを調べて現在の前記抽出の単位に相当するものと同じものが、前記格納手段に格納されている場合は、それを強調表示する抽出手段として、
コンピュータを機能させるためのプログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2003067045thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close