モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

根本的なスパムブログ対策

スパムブログと呼ばれるようなブログがある。


これは適当なタイトル、例えば「派遣業」だとかを付けて*1、それに関連する記事を検索して単に貼っただけのようなブログで、記述があるためトラックバックスパム対策も抜けてきてしまう場合が多い。
こういうものは、手でちまちまやってる人もいると思われるが、システム化して自動的にやるものもあるようだ。


では、なんでこんな意味無いことをするのかというと、なんらかのアフィリエイトが貼ってあって、それで小銭を儲けよう、というのが理由だ。


トラックバックスパムやランキングスパムなど、とにかく無料のサービスはなんでもスパムの標的となっており、いろんな対策があるのだが、根本的解決は難しく結局はいたちごっこになってしまう。
だが、トラックバックスパムにせよ、ランキングスパムにせよ、最終的な目的は大抵金儲けであり、根本的な解決をするためには、その金儲けをさせなければ、自然にやる人もいなくなるはず、だと考えられる。


つまり、アフィリエイトが無くなれば、スパムブログも無くなるはずだ。
だから、アフィリエイトを提供しているAmazonなりGoogleなり楽天なりは、そういうスパムブログで利用されたアカウントは、即アカウント停止に出来る窓口を広く公開しておくべきなのだと思う。
少なくとも、疑わしい行動をしたアカウントについては、一定期間停止とかの処置がされるべきで、そういう通報が簡単に受け付けられるような仕組みを用意しておくべきだろう。


って、アフィリエイト提供してるところはそんなことはもうとうの昔に気がついてて、やってるんだろうか?
もしそうなら、はてなには、トラックバックスパムを受けたら、そのトラックバック元のページにあるアフィリエイトを解析して、その会社へアフィリエイトIDとページURLを送りつけることが出来るインターフェイスを用意して欲しい。
それが一番効果的なトラックバックスパムとかの対策方法になるんでないのかな。


そこまでアグレッシブでなくても、トラックバック元ページを解析してアフィリエイトIDを抽出し、アフィリエイトIDでのブラックリストが指定できるようにして欲しいものだ。


(追記)

トラックバックスパムが来ていた。

PLAMO WEBで完全自動でアフィリエイトサイトを量産 | 物販で販売しやすいキーワードの選び方とは・・
http://plamoweb200.blog108.fc2.com/blog-entry-606.html

これはまさに、スパムブログを「システム化して自動的にやるもの」だ。
これ、わざとやってるんだったらすごいんだけどね。


もう一つスパムトラックバックが来てるけど、これもちょうどいい例になるのでそのままにしておきます。


(さらに追記)

ワードサラダというスパムを知っていますか? (ブログウォッチャー編集長日記)

というようなエントリーがつい最近、話題になってたんですね。
ここでもスパムブログ(こちらのエントリーではワードサラダと紹介されています)が小銭を稼ぐために使われていることを説明されています。


自分は、ワードサラダという名前は、スパマーがフィルタを抜けるために使う技法と思ってたので、ワードサラダという呼び方はちょっと違和感がありました。
これは、正当な検索語に引っかかりやすくするという、スパムメールで言うワードサラダを逆に使った手法だからワードサラダ、と呼ぶのかな?


ワードサラダ、こまったなあ。 - iRSSの日記#1183693687 経由で
「ワードサラダ」とRSS取得による自動生成ページ&トラバなスパムたち:Garbagenews.com

具体例ページのソースコードを確認すると、楽天市場のクッキーを強制的に食わせている。楽天市場のクッキーは一度ブラウザに記録されると使用されるまで30日間は生きる仕様である。そこでこのページを何も知らずに見た読者が他のページに移り、楽天市場で買いものをすると、このサイトの運営者にマージンが入るという仕組みだ。つまり、これらのページは「強制クッキー食わせページ」のための「まきえさ」なのである。

ということで、強制クッキーという手法が使われているらしい。
で、この手法は楽天アフィリエイト規約違反になるから、それで通報出来るはず。


IFRAMEとか使われてるとその先まで追わないといけないから、トラックバックとかのフィルタ側でアフィリエイトIDの抽出するのは結構面倒かな?
というか、そういう怪しげな内容があった場合は、それだけで怪しいと判断してしまえば良いか。
しかしまず、強制クッキーを排除すること自体出来ないのだろうかね。


(関連)

モーグルとカバとパウダーの日記 - ベイジアンフィルタ回避でダミーの文書を張る手法はワードサラダ(Word Salad)と言う

*1:この例はさっき来てたトラックバックスパムのものをそのまま使ってみた