O bayesovské analýze vědí spameři mnohem více než běžní uživatelé. Nestalo se vám, že zpráva vypadající jako jasný spam byla filtrem propuštěna jako jasný HAM?.... a pak jste někde ve zdroji zprávy našli neviditelně opsán kus díla Hemingwaye....
Podle mých zkušeností potřebujete škálu prostředků, které otaxují všechny informace, které sebou zpráva nese. Jako třeba odesilatele (milter-sender), jeho úpornost v odeslání (grey list), nástražné schránky (pyzor), zkušenosti ostatních (razor,dcc,rbl ..) a stejně to není stoprocentní.
Hm, nestalo. Pokud je Bayes napsanej dobre, tak zaregistruje i tag pro neviditelny text. Nevim, jak u vas, ale u me je to 100% giveaway spamu. Neviditelny text mi proste nikdo neposila...
Na pracovnim mailu mi chodi zhruba 60% spamu, 40% hamu (snazim se adresu moc nerozdavat :-)) a spambayes ma v podstate 100% ucinnost. Mam 0 false positives, mam 0 false negatives. Jednou do tydne mi neco pristane v "suspect" (skore bayesovskeho filtru mezi 15% a 90%) a vetsinou to jsou slinty naseho generalniho, ktere je od spamu opravdu tezke odlisit :-)
Ja mam Bayese pouziteho asi na spatnem miste. Snazim se tagovat postu, ktera filtrem prochazi asi pro 500 uzivatelu. Delim je do kategorii typu marketing, financni, reklamacni ... v blahove vire, ze mnozsvi informaci bude vlastnosti filtru vylepsovat. Zpetnou vazbu meli zajistovat uzivatele, jejichz prispevky mely filtr ucit. Bohuzel nejspis vyse uvedene pripady mi zacaly fitr otravovat az z toho totalne zblbnul .. na druhou stranu, kdyz jsem prohlizel vyukovy material, ani jsem se mu nedivil.
Mila