モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

PukiWiki Plus!用のスパムフィルタ spam_filter.php

自分が運用関わってる美麻Wiki(PukiWiki Plus!)に対するスパム対策をいろいろしていて、そのための改造を公開しています。
自分や、他の人のスパムの状況から、だいぶいろいろなフィルタがそろってきましたので、日記にエントリー上げてみます。

spam_filter.php - 美麻Wikiでシステム的に修正している点 - 美麻Wiki
http://miasa.info/index.php?%C8%FE%CB%E3Wiki%A4%C7%A5%B7%A5%B9%A5%C6%A5%E0%C5%AA%A4%CB%BD%A4%C0%B5%A4%B7%A4%C6%A4%A4%A4%EB%C5%C0#ofa18e88


(追記)

モーグルとカバとパウダーの日記 - PukiWikiでreCAPTCHAでのスパム対策

怪しい場合にはCAPTCHAでのチェックを掛ける、ということも出来るようになりました。


このスパムフィルタは、いろいろな種類のスパム対策フィルタを準備してあり、そのフィルタを複合条件を指定して掛けてやることで、サイトの条件にカスタマイズされたフィルタを利用出来る、ということが特徴です。
これにより、余計な負荷増や誤検出の可能性を極力減らすことが出来ます。


本家PukiWikiでは独自リストのURLによるフィルタ、Plus!ではIPとURLでのDNSBLを利用したフィルタ、が利用できるようになっていますが、たぶんこれだけだとすり抜けてくるものがあったり、また独自リストをこまめにアップデートしなければならないという手間があったりすると思います。


spam_filter.phpでは、いろいろな良くあるフィルタ、例えば「書き込み内容に日本語が含まれない」「URLが多数含まれる」といったものや、本家やPlus!と同じようなURLBLとDNSBL、またIPの国別フィルタや、URLのNSでのフィルタ、UserAgent情報でのフィルタなど、いろいろなフィルタが用意されています。
そして、それらをWiki管理者が自由に組み合わせて利用できるようになっています。
例えば、「書き込み内容に日本語が含まれない」でかつ「URLが3件以上含まれる」の「コメント」の場合は拒否とか、「中国韓国からの書き込み」でかつ「UserAgentの内容が特定のもの」を拒否、といった感じです。

サイトによっては英語のみでの書き込みは無い、と言えるところもあるでしょうし、海外からの書き込みも想定していないところもあるでしょう。
そういったサイトの状況に合わせてフィルタを設定できる、というわけです。

続きを読む