「みんなの評価」はあてにならない - モーグルとカバとパウダーの日記

スパム対策の手法として、コラボレーションフィルタと呼ばれる、利用者からのスパム報告を元にスパム判定を行う仕組みがあります。
人間がスパムを判定して、それをみなで共有するわけですから、基本誤検出は起きない、と思いません？
ところが実際にはそう理想通りにはいかないようです。

Hotmailのスパム対策で使われているコラボレーションフィルタでは『ユーザーが「迷惑メール」と判断しているメールの 75% が、昔に購読したメールマガジンやダイレクトメール、サービス通知など、「いらないメール」だった』とのことなのです。

Hotmailでは、そういう本当の意味ではスパムではないけれど、ユーザーから不要と思われているメールは「グレーなメール」と呼んで、それ用に分類していくなどの対処をしていくそうです。
スパム対策ソフトではPopFileなどを使えば同じようなことが出来ます。

自分は元々コラボレーションフィルタも万能ではない、という見方をしていて以前そういうエントリーも書きました。

twitterのスパム報告に思うコラボレーションフィルタの限界 - モーグルとカバとパウダーの日記
http://d.hatena.ne.jp/stealthinu/20110510/p1

が、75%がスパムじゃないメールに対してのスパム報告だというのは、ちょっと想像以上でした。
ユーザーからの情報を集約して利用するようなものは、ユーザが設計者の意図通りの使い方をしてくれるとは限らない、というよりも、想定を超えた使い方をしてくる、と考えてものを作らないとダメだと感じました。