TOP > 国内特許検索 > メールフィルタリングシステム、そのコンピュータプログラム、情報生成方法

メールフィルタリングシステム、そのコンピュータプログラム、情報生成方法

国内特許コード P110002424
整理番号 S2009-0922-N0
掲載日 2011年4月18日
出願番号 特願2009-168408
公開番号 特開2011-022876
登録番号 特許第5366204号
出願日 平成21年7月17日(2009.7.17)
公開日 平成23年2月3日(2011.2.3)
登録日 平成25年9月20日(2013.9.20)
発明者
  • 和田 俊和
出願人
  • 国立大学法人 和歌山大学
発明の名称 メールフィルタリングシステム、そのコンピュータプログラム、情報生成方法
発明の概要

【課題】広告型メールのメール配信方法の適切さの判断に利用可能な情報を得る。
【解決手段】広告型メールの送信元のIPアドレス集合を登録するための広告型メール送信元データベース13eと、非広告型メールの送信元のIPアドレス集合を登録するための非広告型メール送信元データベース13a~13dと、を含む分類用データベース13を備えている。メールヘッダの送信元IPアドレスに対する最近傍探索を広告型メール送信元データベース及び非広告型メール送信元データベースそれぞれに対して行い、当該最近傍探索によって得られた前記最近傍アドレスから広告型メールらしさを示す弁別度を求める。広告型メールの送信元IPアドレス集合は広告型メールのメール配信方法の適切さの判断に利用可能な情報として出力される。
【選択図】図3

従来技術、競合技術の概要


近年、電子メールの利用を妨げる問題として迷惑メール(スパムメール)が挙げられる。不特定多数に大量に送信される迷惑メールは、メールトラフィックの増大やウィルスメールの拡散などを招き、経済的な損失まで引き起こしている。このため、迷惑メールを適切に検出できるメールフィルタリングシステムが求められている。



メールフィルタリングシステムとしては、メールの内容となる本文・タイトルなどの文章(コンテンツ)を解析して迷惑メール(スパムメール)を検出するコンテンツ分析型のシステムが一般的である。



ここで、迷惑メール(広義の迷惑メール)には、有害な情報やウイルスを含むなどしてほとんどの人々にとって迷惑であると感じられるメール(狭義の迷惑メール)と、一般の企業が宣伝広告のために送信するメールであって、その情報を必要としない人々には有益でないものの、その情報を必要とする人々には有益であるメール(広告用のメール、メールマガジンなど)と、が存在する。



後者のメール(以下、「広告型メール」という)は、企業等の正常な宣伝広告活動の一環として行われているものであり、狭義の迷惑メールとは区別して考えることができるが、これまで、前者と後者のメールを区別してフィルタリングするという発想はなかった。



ここで、本発明者は、NNIPF(Nearest Neighbor IP address based mail Filter)とよばれるメールフィルタリングシステムを開発・運用している(非特許文献1参照)。
このNNIPFでは、ユーザが、組織外部からメールを受け取るときに使用するMTA(Mail Transfer Agent)をシステムに予め登録されている。また、NNIPFでは、正常な送信者のIPアドレス集合と迷惑メールの送信者のIPアドレス集合を予め登録している。



NNIPFは、ユーザがシステムに登録したMTA(MTAOB;MTA On Border)が外部からメールを受信したときに生成してメールヘッダに付加したReceived行から、メール送信元のIPアドレスを割り出す。



そして、NNIPFは、割り出したIPアドレスに関する最近傍探索を、予め登録されている正常な送信者のIPアドレス集合及び迷惑メールの送信者のIPアドレス集合に対して行う。これにより、予め登録されている正常な送信者のIPアドレス集合のうち、割り出したIPアドレスに最も近い値を持つIPアドレス(最近傍アドレス)が検出されるとともに、予め登録されている迷惑メールの送信者のIPアドレス集合のうち、割り出したIPアドレスに最も近い値を持つIPアドレス(最近傍アドレス)が検出される。



さらに、NNIPFは、割り出したIPアドレスと、正常な送信者の最近傍アドレス及び迷惑メール送信者の最近傍アドレスそれぞれとの距離(アドレス空間内での距離)を求め、これらの距離に基づいて、迷惑メールらしさを示す「弁別度」(0~1の値)を求める。この弁別度が0であれば、ほぼ確実に正常なメールであり、逆に1であれば、ほぼ確実に迷惑メールであると判断される。また、0から1の間の中間値は、1に近いほど、迷惑メールらしさが高いことを示す。



ここで、NNIPFは、受信したメールの送信元IPアドレスが、ブラックリスト(迷惑メールIPアドレスのリスト)又はホワイトリスト(正常メールIPアドレスのリスト)と一致するか一致しないかという「ブラックリスト/ホワイトリスト」型の分類とは異なるものである。



送信元IPアドレスを「ブラックリスト/ホワイトリスト」で確認する場合、送信元IPアドレスが、「ブラックリスト/ホワイトリスト」に含まれるアドレスと1ビットでも異なると、「一致しない」と判定してしまい、迷惑メールを確実に検出しようとすると、迷惑メールが発信される可能性のある全てのサーバのIPアドレス集合がブラックリストに登録されている必要があるが、これは運用上不可能である。



これに対し、NNIPFは、正常な送信者の最近傍アドレス及び迷惑メール送信者の最近傍アドレスそれぞれとの距離を求め、これらの距離に基づいて、迷惑メールらしさを示す「弁別度」を求めるため、迷惑メール送信者や正常な送信者のIPアドレス全てが予め登録されていなくても、迷惑メールを識別することができる。



しかも、NNIPFでは、正しく運用した場合、98%以上の精度で分類が行えることが確認されている。これは、迷惑メールは、過去に迷惑メールを送信したことのあるサーバのIPアドレスと似たアドレス値のIPアドレスのサーバから送信されることが多く、正常なメールは、以前から受信し続けている送信元サーバのIPアドレスと似たアドレス値のIPアドレスから送信されることが多いという事実に基づいている。



このような傾向が現れる理由は、IPアドレスが、国別、組織別に系統立って割り当てられており、迷惑メール送信元のIPアドレス集合には、IPアドレスの全空間において偏りが見られるからである。例えば、ある著名な優良企業から迷惑メールが来ることはほとんど無く、一方で、外国の格安プロバイダに割り当てられているIPアドレスから迷惑メールが来る可能性は、著名な優良企業からよりも高い。
この傾向は、IPアドレスの割り当てルールが変更にならない限り普遍であるため、迷惑メールを送信するサーバのIPアドレスは、決して均一に分布することはなく、統計的に有意な偏りを持ち続けるため、継続的に分類することが可能である。

産業上の利用分野


本発明は、メールフィルタリングシステム、そのコンピュータプログラム、情報生成方法に関するものである。

特許請求の範囲 【請求項1】
メール分類用のIPアドレス集合を登録するための分類用データベースと、
受信メールのメールヘッダに含まれるメール送信元のIPアドレスを抽出し、抽出されたIPアドレスに最も近似する最近傍アドレスを、最近傍探索によって前記分類用データベースから求めて、前記最近傍アドレスから受信したメールを分類するための弁別度を算出し、当該弁別度に基づいて前記受信メールを分類する分類部と、
を備えたメールフィルタリングシステムにおいて、
前記分類用データベースは、広告型メールの送信元のIPアドレス集合を登録するための広告型メール送信元データベースと、非広告型メールの送信元のIPアドレス集合を登録するための非広告型メール送信元データベースと、を含み、
前記分類部は、前記最近傍探索を前記広告型メール送信元データベース及び非広告型メール送信元データベースそれぞれに対して行い、当該最近傍探索によって得られた前記最近傍アドレスから広告型メールらしさを示す弁別度を求め、受信メールから抽出された前記IPアドレスを当該弁別度に応じて前記広告型メール送信元データベース及び非広告型メール送信元データベースのいずれかに分類して登録するよう構成され、
前記広告型メール送信元データベースに登録されたIPアドレス集合を、ユーザデータと関連づけて出力する出力手段と、
を備えていることを特徴とするメールフィルタリングシステム。

【請求項2】
前記分類用IPデータベースは、非広告型メールを送信した送信元サーバのIPアドレス集合を登録するための非広告型メール送信元データベースとして、前記広告型メール以外の迷惑メールを送信した送信元サーバのIPアドレス集合を登録するための迷惑メール送信元データベースと、正常なメールを送信した送信元サーバのIPアドレス集合を登録するための正常メール送信元データベースと、を含み、
前記分類部は、前記最近傍探索を前記広告型メール送信元データベース、前記迷惑メール送信元データベース及び正常メール送信元データベースそれぞれに対して行い、当該最近傍探索によって得られた前記最近傍アドレスから広告型メールらしさを示す弁別度を求めるよう構成されている
請求項1記載のメールフィルタリングシステム。

【請求項3】
メール分類用のIPアドレス集合を登録するための分類用データベースと、
受信メールのメールヘッダに含まれるメール送信元のIPアドレスを抽出し、抽出されたIPアドレスに最も近似する最近傍アドレスを、最近傍探索によって前記分類用データベースから求めて、前記最近傍アドレスから受信したメールを分類するための弁別度を算出し、当該弁別度に基づいて前記受信メールを分類する分類部と、
を備えたメールフィルタリングシステムにおいて、
前記分類用データベースは、広告型メールの送信元のIPアドレス集合を登録するための広告型メール送信元データベースと、非広告型メールの送信元のIPアドレス集合を登録するための非広告型メール送信元データベースと、を含み、
前記分類部は、前記最近傍探索を前記広告型メール送信元データベース及び非広告型メール送信元データベースそれぞれに対して行い、当該最近傍探索によって得られた前記最近傍アドレスから広告型メールらしさを示す弁別度を求め、受信メールから抽出された前記IPアドレスを当該弁別度に応じて前記広告型メール送信元データベース及び非広告型メール送信元データベースのいずれかに分類して登録するよう構成され、
前記広告型メール送信元データベースに登録されたIPアドレス集合を、広告型メールのメール配信方法の適切さの判断に利用可能な情報として出力する出力手段とを備え、
記広告メール送信元IPアドレスデータベースは、ユーザ毎にIPアドレス集合を分けて登録するよう構成されている
ールフィルタリングシステム。

【請求項4】
前記広告型メール送信元アドレスは、広告型メールに分類されたメールの送信元IPアドレスと当該メールの宛先であるユーザのユーザデータとを関連付けて保存する
請求項1~3のいずれか1項に記載のメールフィルタリングシステム。

【請求項5】
指定されたIPアドレスが送信元アドレスであるメールが、前記分類部において広告型メールに分類された件数及び/又は非広告型メールに分類された件数を集計する手段を更に備えている
請求項1~4のいずれか1項に記載のメールフィルタリングシステム。

【請求項6】
コンピュータを、請求項1~5のいずれか1項に記載のメールフィルタリングシステムとして機能させるためのコンピュータプログラム。

【請求項7】
受信メールのメールヘッダに含まれるメール送信元のIPアドレスを抽出し、抽出されたIPアドレスに最も近似する最近傍アドレスを、最近傍探索によって、メール分類用のIPアドレス集合を登録するための分類用データベースから求めて、前記最近傍アドレスから受信したメールを分類するための弁別度を算出し、当該弁別度に基づいて前記受信メールを分類するメールフィルタリングシステムにおいて、広告型メールのメール配信方法の適切さの判断に利用可能な情報を生成する情報生成方法であって、
前記分類用データベースは、広告型メールの送信元のIPアドレス集合を登録するための広告型メール送信元データベースと、非広告型メールの送信元のIPアドレス集合を登録するための非広告型メール送信元データベースと、を含み、
前記情報生成方法は、
前記最近傍探索を前記広告型メール送信元データベース及び非広告型メール送信元データベースそれぞれに対して行うステップと、
当該最近傍探索によって得られた前記最近傍アドレスから広告型メールらしさを示す弁別度を求めるステップと、
受信メールから抽出された前記IPアドレスを当該弁別度に応じて前記広告型メール送信元データベース及び非広告型メール送信元データベースのいずれかに分類して登録するステップと、
前記広告型メール送信元データベースに登録されたIPアドレスを、ユーザデータと関連づけて出力するステップと、
を含む情報生成方法。

【請求項8】
受信メールのメールヘッダに含まれるメール送信元のIPアドレスを抽出し、抽出されたIPアドレスに最も近似する最近傍アドレスを、最近傍探索によって、メール分類用のIPアドレス集合を登録するための分類用データベースから求めて、前記最近傍アドレスから受信したメールを分類するための弁別度を算出し、当該弁別度に基づいて前記受信メールを分類するメールフィルタリングシステムにおいて、広告型メールのメール配信方法の適切さの判断に利用可能な情報を生成する情報生成方法であって、
前記分類用データベースは、広告型メールの送信元のIPアドレス集合を登録するための広告型メール送信元データベースと、非広告型メールの送信元のIPアドレス集合を登録するための非広告型メール送信元データベースと、を含み、
前記情報生成方法は、
前記広告メール送信元IPアドレスデータベースを、ユーザ毎にIPアドレス集合を分けて登録するステップと、
前記最近傍探索を前記広告型メール送信元データベース及び非広告型メール送信元データベースそれぞれに対して行うステップと、
当該最近傍探索によって得られた前記最近傍アドレスから広告型メールらしさを示す弁別度を求めるステップと、
受信メールから抽出された前記IPアドレスを当該弁別度に応じて前記広告型メール送信元データベース及び非広告型メール送信元データベースのいずれかに分類して登録するステップと、
前記広告型メール送信元データベースに登録されたIPアドレス集合を、広告型メールのメール配信方法の適切さの判断に利用可能な情報として出力するステップと、
を含む情報生成方法。
産業区分
  • 記憶装置
  • 電信
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2009168408thum.jpg
出願権利状態 権利存続中
ライセンスをご希望の方、特許の内容に興味を持たれた方は、下記までご連絡ください


PAGE TOP

close
close
close
close
close
close
close