TOP > 国内特許検索 > タグ付与支援システム及びプログラム > 明細書

明細書 :タグ付与支援システム及びプログラム

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第5142643号 (P5142643)
公開番号 特開2009-069937 (P2009-069937A)
登録日 平成24年11月30日(2012.11.30)
発行日 平成25年2月13日(2013.2.13)
公開日 平成21年4月2日(2009.4.2)
発明の名称または考案の名称 タグ付与支援システム及びプログラム
国際特許分類 G06F  17/30        (2006.01)
FI G06F 17/30 210C
G06F 17/30 170A
請求項の数または発明の数 6
全頁数 10
出願番号 特願2007-235064 (P2007-235064)
出願日 平成19年9月11日(2007.9.11)
審査請求日 平成22年5月10日(2010.5.10)
特許権者または実用新案権者 【識別番号】305027401
【氏名又は名称】公立大学法人首都大学東京
発明者または考案者 【氏名】成田 雅彦
【氏名】戸沢 義夫
【氏名】長尾 雄行
【氏名】小澤 雄治
【氏名】酒井 辰則
【氏名】中村 敦
【氏名】八木岡 熊熊
個別代理人の代理人 【識別番号】100150876、【弁理士】、【氏名又は名称】松山 裕一郎
審査官 【審査官】吉田 誠
参考文献・文献 特開2004-164134(JP,A)
特開2006-301693(JP,A)
特開2005-182574(JP,A)
特開平10-182574(JP,A)
特開平8-221448(JP,A)
調査した分野 G06F 17/30
特許請求の範囲 【請求項1】
キーワードに、該キーワードに対応するタグ候補を関連づけて記憶する関係表と、
メッセージからキーワードを抽出するキーワード抽出手段と、
前記関係表に従って該キーワード抽出手段によって抽出されたキーワードをタグ候補に変換するタグ変換手段と、
タグ候補に、該タグ候補が過去にタグとして付与された頻度を関連づけて記憶する頻度表と、
前記タグ変換手段によって変換されたタグ候補のうち、前記頻度表における頻度の多いN個(Nは自然数)のタグ候補を表示するタグ候補表示手段と、
該タグ候補表示手段によって表示された前記N個のタグ候補からユーザが選択したタグを前記メッセージに付与するタグ付与手段と、
該タグ付与手段によって付与されたタグの前記頻度表における頻度をカウントアップするカウントアップ手段と
を備え
前記頻度表は複数の頻度表からなり、そのうちのユーザが選択した1つの頻度表が使用されることを特徴とするタグ付与支援システム。
【請求項2】
前記の複数の頻度表は、ユーザがメッセージ内容に応じて設定した複数のジャンルに適した頻度表であることを特徴とする請求項1記載のタグ付与支援システム。
【請求項3】
前記タグ候補表示手段は、表示するタグ候補とともに対応する変換元のキーワードを表示することを特徴とする請求項1又は2記載のタグ付与支援システム。
【請求項4】
前記タグ付与手段は、前記タグ候補表示手段によって表示されたタグ候補に関係なく、別途ユーザが手動でタグを付与し、該付与したタグを前記頻度表及び前記関係表に登録し、又は、更新することを特徴とする請求項1乃至3いずれかに記載のタグ付与支援システム。
【請求項5】
前記タグ付与手段は、タグによっては付与するタグとともにそのタグの属性を該タグに関連づけて付与できることを特徴とする請求項1乃至4いずれかに記載のタグ付与支援システム。
【請求項6】
コンピュータを、
キーワードに、該キーワードに対応するタグ候補を関連づけて記憶する関係表と、メッセージからキーワードを抽出するキーワード抽出手段と、前記関係表に従って該キーワード抽出手段によって抽出されたキーワードをタグ候補に変換するタグ変換手段と、タグ候補に、該タグ候補が過去にタグとして付与された頻度を関連づけて記憶する頻度表と、前記タグ変換手段によって変換されたタグ候補のうち、前記頻度表における頻度の多いN個(Nは自然数)のタグ候補を表示するタグ候補表示手段と、タグ候補表示手段によって表示された前記N個のタグ候補からユーザが選択したタグを前記メッセージに付与するタグ付与手段と、該タグ付与手段によって付与されたタグの前記頻度表における頻度をカウントアップするカウントアップ手段とを備え
前記頻度表は複数の頻度表からなり、そのうちのユーザが選択した1つの頻度表が使用されるタグ付与支援システム
として機能させるためのプログラム。
発明の詳細な説明 【技術分野】
【0001】
本発明は、電子ファイル化されたメッセージの内容検索を容易化するためにタグを付与してタグ付メッセージとするためのタグ付与支援システム及びプログラムに関するものである。
【背景技術】
【0002】
近年、インターネットの普及に伴って巨量の情報が流通し、それら情報の中から必要な情報を的確に抽出して利用するための技術の必要性が増している。
【0003】
従来、文書の本文の中から地名や人名、組織名、製品名などをいわゆる形態素解析手法などにより自動抽出して自動的にタグを付与し、これを手掛かりとして自動検索などの機械処理を容易にする文書処理装置が提案されている(例えば、特許文献1参照)。

【特許文献1】特開2007-94855号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記した文書処理装置は、全自動の機械処理には適しているが、文書の作成を行ってから直ぐにメッセージを発信して複数の受信者に同報通信したり、過去に発信された、あるいは受信した文書の中から必要なメッセージを検索したりする場合に、自動的に付与されたタグが不適当なためにメッセージのフィルタリングが不適当となって必要なメッセージを見落したり、あるいは自動的に付与されたタグの数が多すぎるので不必要なメッセージが多数混入して検索作業が煩雑だったりするという欠点がある。
【0005】
上記したタグの自動付与の欠点を嫌い、ユーザがタグ名を考えて手動でタグ付与操作を行うことにより作成したメッセージに適したタグを付与することが考えられるが、この手動によるタグ付加操作はユーザに過度な負荷を強いるので現実的ではない。
【0006】
本発明は、上記問題点に鑑み、文書を自動解析してタグ候補を選出し、このタグ候補の中から付与するタグをその都度吟味して選んで指定することにより、ユーザに過度な負荷を強いることなく、また、自動的に付与するタグが不適当なためにメッセージのフィルタリングが不適当となって必要なメッセージを見落したり、あるいは自動的に付与するタグの数が多すぎるので不必要なメッセージが多数混入して検索作業が煩雑だったりするという不都合を発生させない、確度が高いタグ付与支援システム及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明のタグ付与支援システムは、キーワードに、該キーワードに対応するタグ候補を関連づけて記憶する関係表と、メッセージからキーワードを抽出するキーワード抽出手段と、前記関係表に従って該キーワード抽出手段によって抽出されたキーワードをタグ候補に変換するタグ変換手段と、タグ候補に、該タグ候補が過去にタグとして付与された頻度を関連づけて記憶する頻度表と、前記タグ変換手段によって変換されたタグ候補のうち、前記頻度表における頻度の多いN個(Nは自然数)のタグ候補を表示するタグ候補表示手段と、タグ候補表示手段によって表示された前記N個のタグ候補からユーザが選択したタグを前記メッセージに付与するタグ付与手段と、該タグ付与手段によって付与されたタグの前記頻度表における頻度をカウントアップするカウントアップ手段とを備えることを特徴とする。
【0008】
また、前記頻度表は複数の頻度表からなり、そのうちのユーザが選択した1つの頻度表が使用されることで、例えば業務用、趣味用、組織別など、頻度表を使い分けることができる。
【0009】
また、前記タグ候補表示手段は、表示するタグ候補とともに対応する変換元のキーワードを表示することで、ユーザはタグ候補の選択に際して変換元のキーワードを知ることができるので、より的確なタグを付与することができる。
【0010】
また、前記タグ付与手段は、前記タグ候補表示手段によって表示されたタグ候補に関係なく、別途ユーザが手動でタグを付与し、該付与したタグを前記頻度表及び前記関係表に登録し、又は、更新することで、ユーザが独自にタグを決めることができるので、より的確なタグを付与することができる。
【0011】
また、前記タグ付与手段は、タグによっては付与するタグとともにそのタグの属性を該タグに関連づけて付与できることで、タグとともにタグの属性に応じた特定をすることができるので、より的確な特定をすることができる。
【0012】
また、本発明は、コンピュータを、キーワードに、該キーワードに対応するタグ候補を関連づけて記憶する関係表と、メッセージからキーワードを抽出するキーワード抽出手段と、前記関係表に従って該キーワード抽出手段によって抽出されたキーワードをタグ候補に変換するタグ変換手段と、タグ候補に、該タグ候補が過去にタグとして付与された頻度を関連づけて記憶する頻度表と、前記タグ変換手段によって変換されたタグ候補のうち、前記頻度表における頻度の多いN個(Nは自然数)のタグ候補を表示するタグ候補表示手段と、タグ候補表示手段によって表示された前記N個のタグ候補からユーザが選択したタグを前記メッセージに付与するタグ付与手段と、該タグ付与手段によって付与されたタグの前記頻度表における頻度をカウントアップするカウントアップ手段とを備えるタグ付与支援システムとして機能させるためのプログラムである。
【発明の効果】
【0013】
本発明によれば、メッセージに付与するタグをタグ候補の中からその都度吟味して選んで指定操作することにより、ユーザに過度な負荷を強いることなく、また、自動的に付与するタグが不適当なために必要なメッセージを見落したり、あるいは自動的に付与するタグの数が多すぎるので不必要なメッセージが多数混入して検索作業が煩雑だったりするという欠点のない確度が高いタグ付与支援システムを提供することができる。
【発明を実施するための最良の形態】
【0014】
以下、添付図面を参照しながら本発明を実施するための最良の形態について詳細に説明する。
【実施例】
【0015】
図1は、本発明の一実施例によるタグ付与支援システムの構成を示す図である。同図で発信装置1は、インターネット回線や携帯電話回線などの通信回線を経由してサーバ2と通信を行う通信機能11、表示画面12を備えている。ユーザ(不図示)により作成されたメッセージMは、表示画面12に表示され、通信機能11によりサーバ2に送出される。タグ指定機能13はメッセージMに付与するタグを指定する機能であり、その動作の詳細は後述する。
【0016】
サーバ2は、通信機能21が通信機能11と通信することによりメッセージMを受信してタグ化処理機能22に入力する。タグ化処理機能22はメッセージMと予め準備されたタグデータベース23(詳細は後述する)に蓄積されたデータを参照し、例えば形態素解析手法などによりメッセージMを解析して付与すべきタグを決定する。上記のタグ決定過程でn個(nは自然数)のタグt1~tnが決定される(以下、決定されたn個のタグの集合体を「タグT」と言う)。
【0017】
タグ付メッセージ生成機能24は上記決定された付与すべきタグTとメッセージMを合成してタグ付メッセージAを生成する。タグ付メッセージAはタグ付メッセージデータベース26に蓄積されると共に、スクリーン機能27a、27bに導かれる。
【0018】
スクリーン機能27a、27bは、それぞれが指定されたタグa、bをタグ付メッセージAが含んでいる場合はタグ付メッセージAを通過させ、タグa、bを含んでいない場合はタグ付メッセージAの通過を阻止する機能である。
【0019】
受信装置3a、3bはそれぞれサーバ2の通信機能28a、28bと通信する機能を有する通信機能31a、31b、及びタグ付メッセージAを記憶するメッセージメモリ32a、32b、及びスクリーン指定機能33a、33bを具備している。
【0020】
スクリーン指定機能33a、33bは、それぞれ通信機能31aと通信機能28a、通信機能31bと通信機能28bを介してそれぞれに対応するスクリーン機能27a、27bにタグ付メッセージAを通過させるか否かを決定させるタグa、bを指定する。
【0021】
したがって、タグ付メッセージAがタグaを含んでいる場合に限りタグ付メッセージAはスクリーン機能27aを通過して通信機能28a、通信機能31aを経由してメッセージメモリ32aに記憶される。同様に、タグ付メッセージAがタグbを含んでいる場合に限りタグ付メッセージAはスクリーン機能27bを通過して通信機能28b、通信機能31bを経由してメッセージメモリ32bに記憶される。
【0022】
上記で説明したように、発信装置1が受信装置3a、3bの両方に対して同一のメッセージMを含むタグ付メッセージAを同報したにも係わらず、受信装置3aの指示するタグa、受信装置3bの指示するタグbの内容によって、受信装置3aと3bの双方にこれが受信されたり、片方だけに受信されたり、双方共に受信されなかったりする。言いかえれば、受信装置3a、3bはそれぞれタグa、タグbを指示することによってそれぞれに好適なメッセージMだけを受信し、不適当なメッセージMの受信を阻止することができる。
【0023】
なお、上記で説明したスクリーン指定機能33a,33bの動作は、タグ付メッセージデータベース26に蓄積されたメッセージMを呼び出す場合にも上記と同様な機能を果たすので、受信装置3a、3bはそれぞれタグa、タグbを指示することによってタグ付メッセージデータベース26に蓄積されたメッセージMの中からそれぞれに好適なメッセージMだけを受信し、不適当なメッセージMの受信を阻止することができる。
【0024】
図2は、タグ化処理機能22の構成を示す図である。同図で、メッセージMが通信機能21に接続されている端子2200から入力されて本文メモリ221に記憶される。タグデータベース23に接続されている端子2203からタグデータベース23に蓄積されているデータの中から発信装置1に該当する関係表及び頻度表データを読み出し、関係表メモリ223に関係表を、頻度表メモリ226に頻度表を記憶する。
【0025】
図3は、関係表の例を示す図である。関係表は、予めキーワード毎のタグ例をデータとして登録した表で、同図では5個のキーワードそれぞれにつき上位4個のタグ例をタグ例1~タグ例4として示したが、通常1つのキーワードに対して0~10程度のタグ例が登録される。
【0026】
図4は頻度表の例を示す図である。頻度表は、ユーザ毎に過去に付与されたタグ名を付与された頻度順にデータとして登録した表で、同図では上位5位までのタグ名を頻度順に頻度1位~5位まで示したが、通常100~1万程度のタグ名が登録される。
【0027】
キーワード抽出手段222は本文メモリ221の記憶内容を逐次入力し、関係表メモリ223の記憶内容を参照し、例えば形態素解析手法などの文書解析手法を使用してメッセージMの内容からキーワードを抽出してタグ変換手段224に入力する。
【0028】
タグ変換手段224は、関係表メモリ223の記憶内容を参照して入力された通常は複数のキーワードをタグ例に変換する。例えば、図3のカタバミというキーワードにはタグ例1~タグ例4としてそれぞれ野草、春の花、黄色の花、植物などが登録されており、タグ変換手段224は、これらのタグ例1~タグ例4などのすべてを変換元のキーワードとともにタグ候補選定手段225に出力する。
【0029】
タグ候補選定手段225は、上記で入力したタグ例1~タグ例4などの中から、mを自然数として、上位m個であるタグ例1~タグ例mをタグ候補として選出する。通常mは10~30程度である。以下、説明の便宜上、キーワードが1つ、表示されるタグ名が3つの例につき説明する。
【0030】
タグ候補選定手段225は、上記で選出したタグ例1~タグ例3(野草、春の花、黄色の花)をキーワード(カタバミ)とともにタグ候補表示手段227、タグ決定手段228に出力する。
【0031】
タグ候補表示手段227は、上記キーワードと上記選出された3個のタグ名を端子2201から出力することにより、通信機能21、発信装置1の通信機能11を経由して表示画面12にキーワード名であるカタバミと上記選出された3個のタグ名である野草、春の花、黄色の花をタグ候補として表示する。
【0032】
発信装置1のユーザは、表示画面12の上記表示内容を見て、タグ候補が野草、春の花、黄色の花のであり、それぞれのキーワードがカタバミであることを知り、タグ指定機能13を操作して好適なタグを例えばタグ例1(野草)、タグ例3(黄色の花)であると指定する。
【0033】
上記したタグ指定機能13の操作結果は通信機能11、サーバ2の通信機能21、タグ化処理機能22の端子2202を経由してタグ決定手段228に導かれ、タグ決定手段228はタグ例1(野草)、タグ例3(黄色の花)をメッセージMに付与すべきタグt1、t2と決定する。
【0034】
通常、複数のキーワードが抽出されるので、表示画面12へのキーワードとタグ候補の表示をキーワード毎に行って、タグt1~タグtmを順次決定することによりその決定結果を総合してタグTを決定しても良いし、メッセージMから抽出される複数のキーワードとそれぞれに対応するタグ候補を同時に選出して表示し、ユーザがタグ指定機能13の指定操作を一括で行うことによりメッセージMに付与すべきタグTを一度の操作で決定しても良い。
【0035】
複数のキーワードとそれぞれに対応するタグ候補を同時に選出して表示することによりタグTを一度の操作で決定する場合、例えば縦軸上にタグ候補を一覧表表示し、横軸上にタグ候補に対応するキーワードを表示すると良い。
【0036】
上記したように、タグ候補選定手段225、タグ候補表示手段227、タグ決定手段228により、ユーザは表示画面12を見てタグ指定機能13を操作してメッセージMに好適なタグTを決定する際に、表示されるタグ候補が多すぎるのでタグ決定操作が煩雑になったり、逆に表示されるタグ候補表が少なすぎて的確なタグ候補が表示されないなどの不都合のない、好適なタグ決定操作を行うことができる。
【0037】
タグ決定手段228の出力は端子2204を経由してタグ付メッセージ生成機能24に入力される。また、タグ決定手段228の出力はカウントアップ手段229に導かれ、頻度表メモリ226に記憶されている頻度表をカウントアップする。図4に示した頻度表の例ではタグTとしてタグ例1(野草)が決定されたので、頻度表メモリ226の頻度1位(野草)の頻度欄の数値800は1を加えた数値801に更新される。頻度表の更新結果は端子2203を経由してタグデータベース23に導かれ、タグデータベース23の蓄積データを更新する。
【0038】
上記詳細に説明したように、本発明によるタグ付与支援システムによれば、自動的にタグを付与するのではく、付与するタグをタグ候補の中からその都度吟味して選んで指定操作することにより、ユーザに過度な負荷を強いることなく、また、自動的に付与するタグが不適当なためにメッセージMのフィルタリングが不適当で必要なメッセージMを見落したり、あるいは自動的に付与するタグの数が多すぎるので不必要なメッセージMが多数混入して検索作業が煩雑だったりするという欠点のない確度が高いタグ付与支援システムを提供することができる。
【0039】
なお、本発明は上記実施例に限定されるものではない。
【0040】
タグデータの保存形態として、上記実施例においては単にメッセージにタグを付与するという構造を示したが、タグを付与する際の変換元のキーワードなどのタグ属性を当該タグと関連づけて、タグとタグ属性の組合せをメッセージに付与する構造にしてもよい。その際に、タグによって、タグだけを付与するものと、タグとタグ属性との組合せを付与するものとがある構造とすることが望ましい。
【0041】
これにより、例えば、タグとして組織の単位である「グループ」を付与し、キーワードとして「X」、「Y」又は「Z」をタグと組み合わせてメッセージに付与しておくと、すべてのグループに関連するメッセージを受信したい場合には、タグの「グループ」を選択すればよいし、グループXに関連するメッセージを受信したい場合には、タグの「グループ」を選択し、そのタグに対するタグ属性であるキーワードの「X」を選択することで、特にグループXに関連するメッセージを特定して受信することができる。
【0042】
また、別の例として、タグとしてメッセージの「作成日時」を付与し、そのタグ属性として具体的な日付、例えば抽出キーワード「2007年8月31日」を日付として認識できる形式でタグと組み合わせてメッセージに付与しておくと、2007年8月1日以降に作成したメッセージを受信したい場合に、タグの「作成日時」を選択し、そのタグに対するタグ属性の比較演算「作成日時≧2007年8月1日」を行うことにより、希望するメッセージを受信することができる。
【0043】
また、ユーザが例えば植物、スポーツ、仕事などメッセージ内容に応じて複数のジャンルを設定し、それぞれのジャンルに適した頻度表を別々に使用することにより、付与するタグの確度をなお一層高めることができる。この場合、例えば植物、スポーツ、仕事に対応する複数の頻度表を設け、それぞれの頻度表にジャンル名J1~J3を付し、タグ化処理機能22は発信装置1の表示画面12にユーザがどのジャンル名の頻度表を使用するかの質問画面を表示し、この質問画面を見たユーザがタグ指定機能13を操作してジャンル名J1~J3の中から使用するジャンル名を指示する。タグ化処理機能22はこの指示に従った頻度表をタグデータベース23から読み出して頻度表メモリ226に記憶し、その後に図2~図4を用いて説明した機能動作を行えばよい。
【0044】
また、上記でタグ指定機能13の操作でユーザがジャンルを指示する代わりにメッセージMの中にジャンルを指示する単語や文章を挿入し、タグ化処理機能22がメッセージを解析して対応するジャンルに相当する頻度表をタグデータベース23から読み出してもよい。
【0045】
なお、図2~図4を用いたタグ化処理機能22の説明で、発信装置1のユーザは表示画面12の表示内容を見てタグ候補を知り、タグ指定機能13を操作してタグ候補の中から好適なタグ名を指定するとしたが、表示画面12に表示されるタグ候補に好適なタグ名が見出せないか、あるいはタグ候補には含まれていないタグ名を指示したい場合は手動でタグ名を直接入力することができる。この直接入力されたタグ名はタグ決定手段228でメッセージMに付与されると共に、タグ決定手段228がカウントアップ手段229を介してこのタグ名を頻度表及び関係表に登録(タグは存在しない場合)又は更新(タグは存在するが頻度が少なくて表示されなかった場合)することができる。
【0046】
また、本発明のタグ付与支援システムは、コンピュータを本タグ付与支援システムとして機能させるためのプログラムでも実現される。このプログラムは、コンピュータで読み取り可能な記録媒体に格納されていてもよい。
【0047】
このプログラムを記録した記録媒体は、図1に示されるサーバ2のROMそのものであってもよいし、また、外部記憶装置としてCD-ROMドライブ等のプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なCD-ROM等であってもよい。
【0048】
また、上記記録媒体は、磁気テープ、カセットテープ、フレキシブルディスク、ハードディスク、MO/MD/DVD等、又は半導体メモリであってもよい。
【図面の簡単な説明】
【0049】
【図1】本発明の一実施例によるタグ付与支援システムの構成を示す図である。
【図2】本発明のタグ化処理機能の構成を示す図である。
【図3】本発明の関係表の例を示す図である。
【図4】本発明の頻度表の例を示す図である。
【符号の説明】
【0050】
1 発信装置
2 サーバ
3 受信装置
11 通信機能
12 表示画面
13 タグ指定機能
21 通信機能
22 タグ化処理機能
23 タグデータベース
24 タグ付メッセージ生成機能
26 タグ付メッセージデータベース
27 スクリーン機能
28 通信機能
31 通信機能
32 メッセージメモリ
33 スクリーン指定機能
221 本文メモリ
222 キーワード抽出手段
223 関係表メモリ
224 タグ変換手段
225 タグ候補選定手段
226 頻度表メモリ
227 タグ候補表示手段
228 タグ決定手段
229 カウントアップ手段
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3