モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

「みんなの評価」はあてにならない

スパム対策の手法として、コラボレーションフィルタと呼ばれる、利用者からのスパム報告を元にスパム判定を行う仕組みがあります。
人間がスパムを判定して、それをみなで共有するわけですから、基本誤検出は起きない、と思いません?
ところが実際にはそう理想通りにはいかないようです。


Hotmailのスパム対策で使われているコラボレーションフィルタでは『ユーザーが「迷惑メール」と判断しているメールの 75% が、昔に購読したメール マガジンやダイレクト メール、サービス通知など、「いらないメール」だった』とのことなのです。


Hotmail の「グレーなメール」対策について - Windows 開発統括部 Blog - Site Home - MSDN Blogs
http://blogs.msdn.com/b/jpwin/archive/2011/10/19/hotmail-declares-war-on-graymail.aspx


Hotmailでは、そういう本当の意味ではスパムではないけれど、ユーザーから不要と思われているメールは「グレーなメール」と呼んで、それ用に分類していくなどの対処をしていくそうです。
スパム対策ソフトではPopFileなどを使えば同じようなことが出来ます。


自分は元々コラボレーションフィルタも万能ではない、という見方をしていて以前そういうエントリーも書きました。


twitterのスパム報告に思うコラボレーションフィルタの限界 - モーグルとカバとパウダーの日記
http://d.hatena.ne.jp/stealthinu/20110510/p1


が、75%がスパムじゃないメールに対してのスパム報告だというのは、ちょっと想像以上でした。
ユーザーからの情報を集約して利用するようなものは、ユーザが設計者の意図通りの使い方をしてくれるとは限らない、というよりも、想定を超えた使い方をしてくる、と考えてものを作らないとダメだと感じました。