Názory k článku
Jak funguje antispam Bogofilter
uživatel si přál zůstat v anonymitě
22. 12. 2006 13:19
Nový
Re: Chybička
celé vlákno
Já myslel, že už máte vánoční volno, protože mj. i chybí čárka v poslední větě.
22. 12. 2006 13:53
Nový
Re: Chybička
celé vlákno
Ano, taky jsem si všimla (a opravila), ale stejně děkuju za ostražitost.
Jirka (neregistrovaný)
22. 12. 2006 11:18
Nový
Rozdil od Spamassassinu?
celé vlákno
V cem se tedy Bogofiltr lisi od Spamassassinu?
Ma jeho pouzivani nejake vyhody? Treba se SA, kmail pri posuzovani na par chvilek zamrza, tohle se Bogofiltrem nehrozi?
Ma jeho pouzivani nejake vyhody? Treba se SA, kmail pri posuzovani na par chvilek zamrza, tohle se Bogofiltrem nehrozi?
Zdenek (neregistrovaný)
22. 12. 2006 11:27
Nový
Re: Rozdil od Spamassassinu?
celé vlákno
Bogofilter je jednoucelovy program, napsany v cistem C, je proto velmi rychly, takze zamrzat kmail nebude. Oproti tomu je SA opravdovy pomaly moloch, ale zase zvlada mnohem vice ruznych testu.
Michal Kára (neregistrovaný)
22. 12. 2006 12:27
Nový
Re: Rozdil od Spamassassinu?
celé vlákno
Lisi se tim, ze zatimco SpamAssassin zmrsi vysledek Bayesianskeho filtru dalsimi "kriterii", Bogofilter to nedela :-)
IGL Design (neregistrovaný)
22. 12. 2006 12:19
Nový
Thunderbird
celé vlákno
Myslím, že ten kdo používá Thunderbird mi dá za pravdu, že spam je pro něj minulost. Můj filtr má téměř stoprocentní účinnost. Kdy mi naposled prošel spam ani nepamatuju.
uživatel si přál zůstat v anonymitě
22. 12. 2006 13:21
Nový
Re: Thunderbird
celé vlákno
Nedám. Používám Thunderbird asi 3 roky, takže učit se měl opravdu na čem, ale projde toho na můj vkus stále dost. Možná mu dělají problém stupidní newslettery v angličtině od zahraniční pobočky, které spamy nejsou, ale obecně projde tak jeden z pěti spamů. Doma na soukromé poště opravdu funguje skvěle, ale dle mně i proto, že většina soukromé korespondence je v češtině a většina spamů zase anglická.
22. 12. 2006 22:16
Nový
Re: Thunderbird
celé vlákno
Účinnost v Thunderbirdu je jakž takž slušná, ale 99% ani zdaleka nedosahuje, ale klidně bych odpustil i úspěšnost jen 90% kdyby byla jistota 0% false positives, teď jsem neměl nějaký čas nálady kontrolovat, takže tu na mě čeká přes 2000 spamů a denně přibývá skoro stovka.
Michal Kára (neregistrovaný)
22. 12. 2006 12:26
Nový
Podrobnejsi popis
celé vlákno
Pokud by nekoho zajimal popis vice do hloubky, tak se da nalezt na sesterske Lupe:
http://www.lupa.cz/clanky/jak-funguje-bayesovsky-antispamovy-filtr-1/
http://www.lupa.cz/clanky/jak-funguje-bayesovsky-antispamovy-filtr-2/
http://www.lupa.cz/clanky/jak-funguje-bayesovsky-antispamovy-filtr-1/
http://www.lupa.cz/clanky/jak-funguje-bayesovsky-antispamovy-filtr-2/
mys (neregistrovaný)
22. 12. 2006 13:30
Nový
Re: Podrobnejsi popis
celé vlákno
diky, mnohem lepsi...
22. 12. 2006 12:43
Nový
Nepravdive tvrzeni
celé vlákno
Autor se dopustil male nepresnosti. SPAM mu pochopitelne DOJDE. Nachazi se v jine slozce a i teto slozce se nakonec musite venovat.
Nebo je tu nekdo, kdo slozku SPAM maze bez toho, ze by se podival, esli mu tam nevisi nejaky korektni e-mail?
matej (neregistrovaný)
22. 12. 2006 13:09
Nový
Re: Nepravdive tvrzeni
celé vlákno
jo pouzivam gmail a vetsinou se tam nekoukam, ale je fakt ze ty spamy nemazu :))) denne mi chodi cca 200 mailu a z toho se zatoula spam tak 1x za 14 dnu.
Pavel Čejka (neregistrovaný)
22. 12. 2006 13:12
Nový
Re: Nepravdive tvrzeni
celé vlákno
Denně mi dojde na určitých mailových účtech cca 50 - 100 spamů plus cca okolo 10 - 20 důležitých emailů.
Spam mi třídí spamassasin ještě před doručením do Maildiru k němuž přistupuju přes Imap, co projde spamassasinem filtruje Thunderbird (max 5%). Tj. mám dvě složky se spamem, cca jednou za dva dny je v rychlosti proscrolluju, občas když mám náladu, tak zkusím vyhledat klíčová slova, která by se mohla vyskytovat v pro mne důležitých mailech a hromadně označím jako přečtené, přečtené se už nezobrazují, po 30 dnech se maže samo (ta prodleva pro případ, že by se někdo ozval a mail nebyl k nalezení). Činnost celkem na max několik málo minut.
Takže ano, kontroluju spam před mazáním, ale jen zběžně a tato činnost mi zabere nepatrný zlomek času, který bych bez filtrů musel věnovat jejich osobnímu rozpoznávání, mazání ... přičemž se mi za poslední měsíc nestalo, aby byl nějaký mail vytříděn špatně. Nebo o tom alespoň nevím.
Jinak KMail používám taky a v kombinaci se spamassasinem je vážně nepoužitelný, určitě vyzkouším Bogofiltr.
Spam mi třídí spamassasin ještě před doručením do Maildiru k němuž přistupuju přes Imap, co projde spamassasinem filtruje Thunderbird (max 5%). Tj. mám dvě složky se spamem, cca jednou za dva dny je v rychlosti proscrolluju, občas když mám náladu, tak zkusím vyhledat klíčová slova, která by se mohla vyskytovat v pro mne důležitých mailech a hromadně označím jako přečtené, přečtené se už nezobrazují, po 30 dnech se maže samo (ta prodleva pro případ, že by se někdo ozval a mail nebyl k nalezení). Činnost celkem na max několik málo minut.
Takže ano, kontroluju spam před mazáním, ale jen zběžně a tato činnost mi zabere nepatrný zlomek času, který bych bez filtrů musel věnovat jejich osobnímu rozpoznávání, mazání ... přičemž se mi za poslední měsíc nestalo, aby byl nějaký mail vytříděn špatně. Nebo o tom alespoň nevím.
Jinak KMail používám taky a v kombinaci se spamassasinem je vážně nepoužitelný, určitě vyzkouším Bogofiltr.
Zdenek (neregistrovaný)
22. 12. 2006 14:13
Nový
Re: Nepravdive tvrzeni
celé vlákno
Ja spam nemazu, odmitam ho pres milter uz na MTA :-)
Yenya (neregistrovaný)
22. 12. 2006 15:14
Nový
Re: Nepravdive tvrzeni
celé vlákno
"Nebo je tu nekdo, kdo slozku SPAM maze bez toho, ze by se podival, esli mu tam nevisi nejaky korektni e-mail?"
Jaaaaaa :-)
Mesicne mi chodi pres 100_000 spamu, to je jeden spam za pul
minuty. Spambox nectu (ale kdyz ocekavam nejaky "divny" mail, napriklad e-mailove potvrzeni registrace na nejaky WWW server, tak se tam podivam). Jinak ano, spamovou slozku planovane neprochazim. Ponechavam ji ale 2 mesice (ted pres 1GB mesicne), abych pripadne problemy byl schopen dohledat.
-Yenya, http://www.fi.muni.cz/~kas/blog/
Jaaaaaa :-)
Mesicne mi chodi pres 100_000 spamu, to je jeden spam za pul
minuty. Spambox nectu (ale kdyz ocekavam nejaky "divny" mail, napriklad e-mailove potvrzeni registrace na nejaky WWW server, tak se tam podivam). Jinak ano, spamovou slozku planovane neprochazim. Ponechavam ji ale 2 mesice (ted pres 1GB mesicne), abych pripadne problemy byl schopen dohledat.
-Yenya, http://www.fi.muni.cz/~kas/blog/
27. 12. 2006 13:11
Nový
Re: Nepravdive tvrzeni
celé vlákno
Chapu, ze pri 100.000 spamech mesicne spamfolder neprochazis :-)
Neni Ti ale lito tech dratu a krabic po ceste, ktere se museji s 1GB dat potykat? Ja radeji necham pocitat ty masiny nejaky distribuovany vypocet.
Neni Ti ale lito tech dratu a krabic po ceste, ktere se museji s 1GB dat potykat? Ja radeji necham pocitat ty masiny nejaky distribuovany vypocet.
22. 12. 2006 15:49
Nový
Re: Nepravdive tvrzeni
celé vlákno
Vetsinu spamu si automaticky mazu uz na serveru, aniz bych ho spatril.
Co projde je protrideno dle dalsich pravidel a co je vyhodnoceno jako spam stejne nectu, oznacim cely obsah folderu a smazu ... (s vyjimkou situace, kdy se prihlasim na nejakou obskurni konferu, nebo cekam mail z obskurniho zdroje, ktery jeste nemam zatrideny ... pak pred tim smazanim preletnu hlavicky pohledem a stejne to smazu)
Co projde je protrideno dle dalsich pravidel a co je vyhodnoceno jako spam stejne nectu, oznacim cely obsah folderu a smazu ... (s vyjimkou situace, kdy se prihlasim na nejakou obskurni konferu, nebo cekam mail z obskurniho zdroje, ktery jeste nemam zatrideny ... pak pred tim smazanim preletnu hlavicky pohledem a stejne to smazu)
mmmmm (neregistrovaný)
23. 12. 2006 10:48
Nový
Greylisting
celé vlákno
Od te doby co jsem nasadil greylisting nemam se spamem absolutne zadne potize. Ke vsemu vyhoda je ze se temer vubec nevytezuje server slozitou filtrovaci logikou a zatim jsem za celou dobu podle logu nenasel jediny pripad chybneho vyhodnoceni spamu.
Filip N. (neregistrovaný)
30. 12. 2006 1:17
Nový
Re: Greylisting
celé vlákno
Ano Greylisting nam hodne pomohl...nasadili jsme Merak Mail Server pro Linux a ten ho uz obsahoval..zprvu ponekud slozitejsi nastaveni ale da se to uchodit.
Filip N. (neregistrovaný)
30. 12. 2006 1:18
Nový
Re: Greylisting
celé vlákno
Ano Greylisting nam hodne pomohl...nasadili jsme Merak Mail Server pro Linux a ten ho uz obsahoval..zprvu ponekud slozitejsi nastaveni ale da se
miner (neregistrovaný)
26. 12. 2006 21:45
Nový
Spoléhat jen na Bayese se nevyplatí
celé vlákno
O bayesovské analýze vědí spameři mnohem více než běžní uživatelé. Nestalo se vám, že zpráva vypadající jako jasný spam byla filtrem propuštěna jako jasný HAM?.... a pak jste někde ve zdroji zprávy našli neviditelně opsán kus díla Hemingwaye....
Podle mých zkušeností potřebujete škálu prostředků, které otaxují všechny informace, které sebou zpráva nese. Jako třeba odesilatele (milter-sender), jeho úpornost v odeslání (grey list), nástražné schránky (pyzor), zkušenosti ostatních (razor,dcc,rbl ..) a stejně to není stoprocentní.
Podle mých zkušeností potřebujete škálu prostředků, které otaxují všechny informace, které sebou zpráva nese. Jako třeba odesilatele (milter-sender), jeho úpornost v odeslání (grey list), nástražné schránky (pyzor), zkušenosti ostatních (razor,dcc,rbl ..) a stejně to není stoprocentní.
Petr (neregistrovaný)
27. 12. 2006 19:32
Nový
Re: Spoléhat jen na Bayese se nevyplatí
celé vlákno
Hm, nestalo. Pokud je Bayes napsanej dobre, tak zaregistruje i tag pro neviditelny text. Nevim, jak u vas, ale u me je to 100% giveaway spamu. Neviditelny text mi proste nikdo neposila...
Na pracovnim mailu mi chodi zhruba 60% spamu, 40% hamu (snazim se adresu moc nerozdavat :-)) a spambayes ma v podstate 100% ucinnost. Mam 0 false positives, mam 0 false negatives. Jednou do tydne mi neco pristane v "suspect" (skore bayesovskeho filtru mezi 15% a 90%) a vetsinou to jsou slinty naseho generalniho, ktere je od spamu opravdu tezke odlisit :-)
Na pracovnim mailu mi chodi zhruba 60% spamu, 40% hamu (snazim se adresu moc nerozdavat :-)) a spambayes ma v podstate 100% ucinnost. Mam 0 false positives, mam 0 false negatives. Jednou do tydne mi neco pristane v "suspect" (skore bayesovskeho filtru mezi 15% a 90%) a vetsinou to jsou slinty naseho generalniho, ktere je od spamu opravdu tezke odlisit :-)
mila (neregistrovaný)
30. 12. 2006 19:15
Nový
Re: Spoléhat jen na Bayese se nevyplatí
celé vlákno
Ja mam Bayese pouziteho asi na spatnem miste. Snazim se tagovat postu, ktera filtrem prochazi asi pro 500 uzivatelu. Delim je do kategorii typu marketing, financni, reklamacni ... v blahove vire, ze mnozsvi informaci bude vlastnosti filtru vylepsovat. Zpetnou vazbu meli zajistovat uzivatele, jejichz prispevky mely filtr ucit. Bohuzel nejspis vyse uvedene pripady mi zacaly fitr otravovat az z toho totalne zblbnul .. na druhou stranu, kdyz jsem prohlizel vyukovy material, ani jsem se mu nedivil.
Mila
Mila

