モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

スパムが出されやすいIPアドレスを判定するスパムフィルタ

スラッシュドット ジャパン | IPアドレスの最近傍識別を行うSPAM Filter より

NNIPF

スパムが出されるIPの近くからはスパムが出される可能性が高く、正しいメールが出されるIPの近くからは正しいメールが出される可能性が高い、ということをIPの距離から測ってスパムの可能性を割り出すという手法。
これはなかなか良さそう。
これはある意味で、S25Rとかと近いコンセプトだと思う。
S25Rはスパムが出されることが多いFQDNのパターンを人間が経験的に導き出したわけですが、NNIPFではIP間の距離から計算でスパムが出されることが多いIPを導き出している、ということで。


和田先生の説明中では誤検出はほとんど無い、とのことだけども、Rgreyとかと同程度の誤検出はあるのではないかと思う。
特に海外、中国やら韓国からのメールで誤検出しやすいんじゃないだろうか。
つまり、たまにしか中国とかからメールが来ない場合、その近傍にたくさんあるスパムIPに引きずられてしまうのではないか、ということです。


ただ、スパムらしさが確率で得られるため、SpamAssassinから利用できるようにするとさらに良いんではないかと思う。
というか書こうかな。