Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia Tuesday TopDrive KupDnes Navrcholu Bomba NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Odpověď na názor

Odpovídáte na názor ke zprávičce Král spamerů se přiznal: hrozí mu 26 let.

\.~^+. TUKAN .+^~./
19. 3. 2008 23:25

Re: 26 let za podvody...

celé vlákno
Spamassasin stojí na "tréninku" jen částečně. To trénování krmí mozek Bayes filtru, ale jeho hodnocení má relativně malou váhu v celkovém rozsudku (záleží samozřejmě na nastavení). SA dělá mnohem víc checků a ideální je, když má přístup na Internet. Pak kromě "statického" vyhodnocování obsahu hlaviček mailů (trasa, relaye, konformance SMTP, identifikátory, etc) ještě komunikuje s kolaborativními on-line projekty a to pak teprv jede.

Já Bayes filtr netrénoval, takže v podstatě nic neuměl (vaše situace) a už tenkrát mi SA z cca 250-320 spamů denně (do jedné schránky) bezpečně vyeliminovat vše až na jeden (za den). Nikdy neoznačil regulérní mail za spam a to cca polovinu mojí schránky tvoří anglické maily z ciziny a stovek domén. Byl jsem spokojený, protože účinnost 99.6667% a chybovost 0% mi bohatě stačila.

Pak jsem si řekl proč ne a zkusil celou svoji schránku nacpat Bayesu najednou jako ham (regulérní poštu) a obsah složky JUNK (jen za posledních pár dní) jako spam. Vzhledem k tomu na jakém principu Bayes funguje a taky kvůli faktu, že spammeři svoje maily statisticky "vyvažují" normál slovy, čekal jsem, že se účinnost nezlepší (krom toho jednoho ruského textového spamu neměla ani kam) a že SA možná i začne označovat regulérní maily jako spam.

Mýlil jsem se - od té doby stále žádné falešné pozitivum a už mi to filtruje i ten ruský neřád, který díky šikovnému a korektnímu odesílání přes legitimní a čisté relaye dřív penetroval vše. Stačilo jedno učení spam/ham ~ 1000/600.

Takže vážený, na SA já nedám dopustit. Léta prakticky nevím co to spam je.

Než něco zavrhnete, zkuste se s tím nejdřív naučit zacházet. Pokud jste ho netrénoval a měl všechny ostatní checky vypnuté jako v defaultu, nemůžete se divit. Od vypnutého spam filtru těžko můžete čekat výsledky. A to ani nemluvím o extra rozšířeních jako je OCR "nového" typu spamů v podobě jediného obrázku, v němž je reklama vyrenderovaná. Ostatně i tento typ dokáže SA odchytit bez podobně krkolomného a CPU náročného procesu pomocí heuristiky a vyššího bodování mailů s jedním obrázkem o určitých parametrech.

SA + 2sec gray + Bayes + Razor, atp + custom úpravy některých skóre = SPAM free :)
   
Chcete přispět jako registrovaný uživatel? Přihlaste se ke svému účtu.
Ochrana proti spamovacím robotům. Odpovězte prosím na následující otázku: Jaký je letos rok?
 

Pravidla pro diskutující

Přidáním čtenářského příspěvku do diskusí či fóra souhlasíte s tím, že budete dodržovat následující pravidla. Při jejich hrubém porušení se vystavujete riziku smazání příspěvku, jeho modifikaci, v krajním případě i zablokování přístupu do diskusí.

Redakce ze zásady nezasahuje do čtenářských diskusí a zavazuje se, že nebude mazat ani modifikovat příspěvky, kromě případů, kdy tyto porušují některé z následujících pravidel. V takové situaci je na zvážení redakce, zda příspěvek modifikuje s viditelným upozorněním, či přímo smaže. Redakce nikdy nemaže „nesouhlasné komentáře“ jen proto, že jsou nesouhlasné. Vítáme střet názorů, ale vždy v rámci slušné a kultivované debaty.

Příspěvky nesmí obsahovat:

  1. Vulgární či hrubé výrazy.
  2. Urážlivé výroky na adresu druhé osoby či skupiny osob.
  3. Texty, které mají za cíl jen vyprovokovat emotivní reakci (trolling).
  4. Rasové útoky či útoky na jakoukoliv jinou menšinu či skupinu obyvatel.
  5. Komerční nabídky a affiliate odkazy.
  6. Odkazy na warez, sériová čísla, licenční kódy, pornografii a další nevhodný materiál stejně jako žádosti o poskytnutí tohoto obsahu.
  7. Prokazatelně protiprávní obsah.

Informace o soukromí: U všech přidaných komentářů provozovatel ukládá IP adresu a hostname odesílatele. U neregistrovaných uživatelů se na webu zobrazuje část hostname, případně IP adresy, neumožňující identifikovat konkrétní počítač.

Povolené značky XHTML: a, br, code, em, li, ol, p, pre, strong, sub, sup, ul