モーグルとカバとパウダーの日記

モーグルやカバ(EXカービング)山スキー(BC)などがメインの日記でした。今は仕事のコンピュータ系のネタが主になっています。以前はスパム対策関連が多かったのですが最近はディープラーニング関連が多めです。

ベイシアンフィルタで修正したい点

  • テキストとHTMLだけを見るように

CRM114を使っていて、大きな添付を付けたメールでタイムアウトが起ったりと、ちょっとだけトラブルがあった。
ソース見てないから嘘言ってるかもしれないけど、少なくともCRM114はメールの全文をなめてるように見える。
テキストとHTMLだけベイシアンフィルタでなめればよいので、MIMEの情報見て必要ないところは参照しない、あと最大でも先頭10Kまで、とかの修正を加えたほうが良いのではないか。

Receivedヘッダ見て、エンドユーザー用回線らしいFQDNや、プライベートIPなどをラベリングして、それをベイシアンフィルタでも参考に出来るようにする。
その際、Receivedヘッダの並び順を上下逆にしたほうが良いように思う。

例えばこんな感じのヘッダを、

Received: from mailproxy.spammer (ppp01234.provider.ne.jp [10.20.30.40]) by mx.provider.jp
Received: from clientpc ([192.168.0.10]) by mailproxy.spammer

こんな感じに変換してベイシアンフィルタに渡してあげる。

Received privateip greyip