"Z toho plyne, že pokud si poštu stahujete z cizího serveru přímo do svého mailového klienta, nebude vám SpamAssassin nic platný."
Používám na stahování pošty Kmail ze vzdáleného POP3. Kmail umí přijatou poštu protlačit přes externí program a dál pracovat s výsledkem. Nic mi tedy nebrání vytvořit filtr, který vezme příchozí poštu, prožene ji přes SA, který doplní hlavičku. Dalším filtrem si to podle obsahu hlavičky přesunu do složky se spamem. Takže Spamassasin je velmi platný i při stahování pošty z cizího serveru! Bohužel proklamované úspěšnosti nedosahuje a to ho učím :-/, zatím tak 75% ale i to mi hodně pomáhá. Co je pravda, že se ještě ani jednou nesekl.
Ja pouzivam SA cca dva roky (mozna dele) a drive mel uspesnost obrovskou, urcite 98%, spis vic. Ted se ale roztrhl pytel s tim falesnym Microsoftem (jeste horsi nez skutecny :-)) a podobnou haveti, kterou naprosto nezvlada, takze mam denne cca deset spamu nerozpoznanych (drive to byl jeden za mesic apod.), proto se chci zeptat: jak ho muzu "ucit"?
Mozna to zkombinovat s veci jako Messagewall apod. Messagewall muz byt naprosto striktni pri dodrzovani RFC (coz standardni maily jsou, spamy casto nikoliv), muze kontrolovat existenci domen a ma taktez vybornou funkci a to je moznost vyzadovat funkcni reverzni DNS zaznam. Mne to (ve spolupraci s primitivni kontrolou na klicova slova typu penis, viagra, loan apod.) zachyti vetsinu spamu.
Ucit tzv. bayes modul muzes tak, ze hodis spam do slozky napr. /root/spam a ham (tj. maily, ktere nejsou spamy) do slozky napr. /root/ham. Pak spustis:
sa-learn --spam --showdots --dir /root/spam
sa-learn --ham --showdots --dir /root/ham
(viz man sa-learn)
Bayes modul zacne fungovat, az zna aspon 200 spamu/hamu. Optimalni velikost databaze je 5000. Funkcnost spamassassinu a bayesu (vcetne stavu databaze) zjistis prikazem
spamassassin -D --lint
Dulezite je Bayes naucit nejen co je spam, ale i co spam neni.
Bayes ohodnoti pravdepodobnost, ze mail je spam a v hlavicce mailu se to ukaze jako jeden tag spamassassinu s nazvem BAYES_xx, kde xx vyjadruje pravdepodobnost, ze mail je spam. Napr. ve vypisu uvedenem nize BAYES_90 vyjadruje pravdepodobnost 90% az 99% a ve spamassassinu je pro tag BAYES_90 nastaveno score 3.00.
Sep 25 09:46:09 agneta MailScanner[4210]: Message h8P7k3PE004815 from 198.208.105.137 (nhev652swp@insurer.com) to mydomain.cz is spam, ORDB-RBL, SpamAssassin (score=5.6, required 4.9, BAYES_90 3.00, DATE_IN_PAST_03_06 0.27, FORGED_MUA_OUTLOOK 2.17, MISSING_MIMEOLE 0.10)
ntw
Poctivě jsem všechy ty viry "od Mrkvosoftu" nahraval zpatky na server a spamassassina je učil. Udělal jsem to asi s šedesáti různýma kopiema toho viru. Ale nebylo to nic platný, spamassassin to pořád nechápal jako spam. (Jak je to možný??) Nakonec jsem to vyřešil. Jednoduše jsem přidal do blacklistu slovo Microsoft a msn.com. Funguje cca na 95%, což je pohoda oproti předchozímu stavu.
Nachapu, jak to tenhle virus dela, ale opravdu se mu dari SpamAssassin totalne obejit. I kdyz jsem mu rucne pridal par pravidel typu "SECURITY_UPDATE", "ALL_KNOWN_SECURITY_VULNERABILITIES", "NOT_REPLY_THIS_MESSAGE", apod., tak z neznamyho duvodu tenhle mail naproso ignoruje, akorat najde MICROSOFT_EXECUTABLE a MIME_HTML_NO_CHARSET.
Ale uz se s tim nehodlam s#at, nastavil jsem score MICROSOFT_EXECUTABLE na 5 a vsechny soucasny i budouci viry timto odkazuji do /dev/null :-)).