Mě se lokální Bogofilter ani Spamassasin na serveru zatím moc nechytá, i když ten aspoň něco zachytí přes Razor a blacklisty...
Není na to už nějaký plugin do Spamassassinu? Dost z těch mailů mají v PDF normální text. A z těch obrázkových ten obrázek určitě nějak půjde vytáhnout a předhodit FuzzyOCR.
Potvrdzujem, ze greylisting je skvela antispamova (a ciastocne aj antivirova) technika. Pouzivam ju spolu s restriktivnym nastavenim postfixu. Tato ochrana, ktora sa dostane na radu ako prva z antispamovych technik mi odfiltruje radovo tisicku spamov denne. Dolezite je, ze to zmensuje zatazenie servera, ktore by sposobil napr. spamassassin, keby mal prefiltrovat cele toto mnozstvo sprav. Zaroven spamassassin pracuje omnoho lepsie a spolahlivejsie, ked sa mu dostava uz takyto ciastocne prefiltrovany prud mailov.
Nemyslim si, ze by sa spamari naucili obchadzat tuto techniku v dohladnej dobe. Museli by totiz na odosielanie sprav pouzivat spravne pracujuci postovy server (s radou cakajucich sprav, ktore neboli odoslate na prvykrat) a to nie je mozne ak potrebuju chrlit miliony sprav denne.
Ak by sa stalo, ze kazdy server na svete by mal implementovany greylisting a spamari by boli nuteni ho takymto sposobom obchadzat, tak stale by to bola vyborna technika na boj proti spamu. Spamari by totiz na odoslanie rovnakeho mnozstva sprav museli vynalozit omnoho vacsie investicie do serverov. Alebo ak by investicie nezvysili, boli by schopny odoslat len zlomok toho, co doteraz.
Greylisting obcházejí jednoduše: posílají spamy přes sekundární mailserver, na kterém greylisting není, a není pod mojí správou, takže ho tam nemůžu nasadit :-(
The spams are changing every day to get through our defense.
To pass the Bayes filters there's the text that makes no sense.
Misspellings foil the keyword scan, and there's the trick most vile,
Sending a graphics attachment, text as a picture file.
The spams are changing every day to get through our defense.
To pass the Bayes filters there's the text that makes no sense.
Misspellings foil the keyword scan, and there's the trick most vile,
Sending a graphics attachment, text as a picture file.
Zajímalo by mě jestli taky používají OCR... Mají dobré OCR vyvinuté pro Google Books, a pokud budou ukládat MD5 zkontrolovaných obrázků, tak je to zvládnutelná zátěž (pro Google určitě).
Neco podobneho jsme vymysleli u jednoho nejmenovaneho ISP, nakonec to nebylo z duvodu vypocetni zateze realizovano.
Nebylo to urceno pro filtrovani mailu, ale pro kontrolu free webhostingu na nelegalni pornografii. Problem, ktery brzy nastane je, ze prosta MD5 obrazku nestaci, jelikoz staci obrazek nepatrne upravit a jeho MD5 je zcela odlisna. Je tedy nutne provadet duslednejsi analyzu, napr. vypocet Euklidovske vzdalenosti mezi vektory charakteristickych casti obrazku.