モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

人件費の安い国から人間が書き込んでくる掲示板・コメントスパムへの対策

いくつかのコメントスパム対策手法を組み合わせることで、CAPTCHAを使わなくてもほぼ100%近くの掲示板への迷惑投稿やコメントスパムが排除できることがわかった。
特に、javascriptを利用したものは、少なくともそれ専用の対策をスパマー側が施してこない限りは抜けてこないと思う。


しかし、やはり穴はあるもので、ごく一部抜けてくるものもある。
それは人が手でちまちまとスパムコメントを書いてくる場合である。
これはもう、javascript使おうが、captcha使おうが、抜けてきてしまう。
メールのスパム対策で、なんの最適化も施されていない普通のMTAを使われていると、greylistingtarpittingは抜けてきてしまうのと同様に、なんのツールも使わずに力業でこられると、いろいろな手法を利用したところで意味をなさないのだ。


そんな例ってそんなに無いでしょ、と思ってたのだが、コメントスパム対策をしてると、抜けてくるスパムが無くなるために、逆にそういう例が目立ってくるので、なんとかしたくなってくる。


www.ok3e.com(やwww.ok10000.com)という漢方の精力剤の宣伝をしてくるスパムの例では、まずメールアドレスが書かれていなかったので拒否された後、投稿の削除用パスワードが入っていなくて拒否、その後さらにパスワードも埋めて投稿が試されていたログがあった。
その時間の間隔などから見ても、人がオペレートしているというのがわかる。
以前書いた biglobe-ne.com の例だとかも人がちまちまやってると思われる。
これらはすべて、中国にサーバがあり、中国のISPの接続から書き込まれているものだった。


だが、こういう手法が使えるのは、人が非常に安い賃金で利用できるからに他ならないだろう。
スパムを送るためのコストのほうが高く付いてしまうのなら、スパマーもスパムを送らない。
というわけで、やはりこの手のスパムに対しては、クライアントIPからどの国からの接続かを見るフィルタを使うのが良いと思う。
URLが書かれている場合だけ、接続元の国コードを調べて、例えばこの場合だったらIPが中国への割当てだったら拒否、とか、「HTTP_ACCEPT_LANGUAGE」に「cn」が含まれている場合だけ拒否*1、としてしまう。
これなら、URLが書かれていなければとりあえず投稿可能だから、掲示板を用いてfalse positiveを連絡する手段は確保されている。


(関連)

モーグルとカバとパウダーの日記 - PukiWikiのURL書き換えスパマーは中国からの反日ROのキャラ取得とRMT目的らしい
モーグルとカバとパウダーの日記 - PukiWikiの飛び先URL書き換えスパム

*1:HTTP_ACCEPT_LANGUAGEでのフィルタについてはROサイト管理者連絡会にて教えていただきました