Spamassassin Training und Cyrus

Wenn man nun erfolgreich Spamassassin installiert hat, will man natürlich auch die Trefferquote erhöhen. Heute soll es mir darum gehen, wie man Spamassassin recht autonom trainieren kann. Ich beziehe mich dabei auf meine Anleitungen – wie man Spamassassin mit Postfix auf einem Debiansystem aufsetzt.

Letztendlich geht es darum, Mailservern mit vielen Usern so zu konfigurieren, dass alle User einen „Beitrag“ zur Verbesserung der Trefferquote leisten können und allen Usern diese Leistung auch zur Verfügungsteht. Damit dies funktioniert, muss man in der /etc/spamassassin/local.cf den Paramater <strong>bayes_path</strong> konfigurieren.

Bayes_path veranlasst spamassassin im angegebenen Verzeichnis nach Informationen zu erlerntem Spam zu suchen. Ist dieser Parameter nicht konfiguriert legt spamassassin für jeden User unter ~/.spamassassin eine seperate Bayes Datenbank an. Dann muss jeder User spamassassin selber trainieren.

Als nächstes lege ich standardmässig Mailverzeichnisse für jeden User in Cyrus Imapd an. Einen Ordner Spam und einen Ordner SpamMiss. In ersteren entsorgt Sieve alle bereits als Spam erkannten Mail. In den Ordner SpamMiss werden alle nicht als Spam erkannten Mails durch den jeweiligen User abgelegt. Ebenso wäre ein Ordner SpamFail denkbar, in denen Mails abgelegt werden können, die fälschlich als Spam markiert wurden.

Mittels des Tools http://www.pollux.franken.de/hjb/mail-server/index.html werden nun via cron alle Mails an spamassassin verfüttert.

Ausführlichere Informationen zur Implementierung >>hier<<