モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

コラボレーションフィルタと誤検出

PyzorやRazorのように、利用者がスパム判定を行い、そのスパムメールシグニチャ(チェックサムみたいなもの)を共有DBに上げて、そのシグニチャでスパムを判定するものを、コラボレーションフィルタと呼びます。


コラボレーションフィルタは、人間が判定するものなので原理的にほぼfalse positiveが無いと言われているのですが、ふと、それはほんとかな?と思いました。
というのもSpamAssassinでRazorとか使うと、SpamAssassin(など)でスパム判定されたものを自動的に共有DBに上げることが出来るので、もしそうやって使ってる人が多い場合には、結局SpamAssassinの判定率に近くなってしまうのではないか、と思ったんですが、どうなんでしょう。
コラボレーションフィルタ系はあまり詳しくないので、認識間違ってるかもしれませんが。