スラッシュドット ジャパン | IPアドレスの最近傍識別を行うSPAM Filter より
スパムが出されるIPの近くからはスパムが出される可能性が高く、正しいメールが出されるIPの近くからは正しいメールが出される可能性が高い、ということをIPの距離から測ってスパムの可能性を割り出すという手法。
これはなかなか良さそう。
これはある意味で、S25Rとかと近いコンセプトだと思う。
S25Rはスパムが出されることが多いFQDNのパターンを人間が経験的に導き出したわけですが、NNIPFではIP間の距離から計算でスパムが出されることが多いIPを導き出している、ということで。
和田先生の説明中では誤検出はほとんど無い、とのことだけども、Rgreyとかと同程度の誤検出はあるのではないかと思う。
特に海外、中国やら韓国からのメールで誤検出しやすいんじゃないだろうか。
つまり、たまにしか中国とかからメールが来ない場合、その近傍にたくさんあるスパムIPに引きずられてしまうのではないか、ということです。
ただ、スパムらしさが確率で得られるため、SpamAssassinから利用できるようにするとさらに良いんではないかと思う。
というか書こうかな。