Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Hlavní navigace

Techniky boje proti nevyžádané poště

V dnešní době, kdy se rozesílatelé nevyžádané pošty stávají více a více agresivními a počet nevyžádaných zpráv čekajících na smazaní ve vaší schránce se každým měsícem zvyšuje, se ochrana proti nevyžádaným zprávám stává stále důležitější.

Tweetni to Twitter Jaggni to! Jagg Del.icio.us Delicious

V tomto článku bych se chtěl zaměřit na různé metody ochrany:

  1. whitelist/blacklist
  2. challenge-response
  3. tagged message delivery
  4. rozpoznávání obsahu
  5. bayesianská statistická metoda

Metody založené na seznamech (whitelist, blacklist) fungují tak, že si udržují seznamy řetězců, které porovnávají s emailovou adresou odesílatele, a na základě příslušnosti k seznamu povolených nebo zakázaných adres poštu buď doručí, nebo odmítnou (případně zahodí). U této metody je nutné poznamenat, že je v podstatě nepoužitelná, protože velká část spamu chodí buď z velkých domén typu hotmail.com nebo yahoo.com, případně jsou adresy odesílatelů náhodně voleny ze seznamu, který mají spammeři k dispozici.

Challenge-Response metody využívají toho faktu, že za většinou legitimních emailů sedí člověk, který zvládne reagovat na podnět ze strany příjemce. Na základě příchozího emailu je systémem vygenerován email, ve kterém je po odesílateli žádáno potvrzení původního emailu. Tyto systémy jsou většinou kombinovány s whitelist/blac­klist metodou – po úspěšném potvrzení prvního emailu je odesílatel přidán do whitelistu a při další komunikaci již po něm ověření není požadováno. Tato metoda však trpí falšováním hlaviček odesílatele, kde dochází k sekundárnímu obtěžování nezúčastněných třetích stran ve chvíli, kdy si jejich adresu spammer uvede jako zdroj hromadných emailů.

Metody označkované adresy (tagged address) používají formát adresy, který obsahuje speciální značku, na základě níž je určena legitimnost emailu. Značky mohou záviset na:

  • čase – email má platnost jen po určitou dobu
  • odesílateli – jen určený odesílatel může na tuto adresu zasílat poštu, vhodné pro emailové konference
  • klíčovém slově – fungují, dokud chcete, vhodné pro adresy zadávané do webových formulářů. Ve chvíli, kdy na tuto adresu začnete dostávat spam, ji jednoduše zahodíte.

Metody založené na rozpoznáváním obsahu využívají toho, že spammeři potřebují světu sdělit nějaký, většinou velmi podobný obsah. Pokud byste k vaší poště posadili živého člověka, aby odmazával nevyžádané zprávy, neměl by s tím větší problémy. Zautomatizovat tuto činnost už tak snadné není. Jednoduchá varianta této metody je sada pravidel ve vašem poštovním programu, na základě kterých se například odmazávají zprávy, jež mají ruské kódování nebo obsahují slova „Dear Friend“. Složitější metody mají takovéto pravidla již nadefinována v sobě. Pracují na základě ohodnocení jednotlivých příznaků číselnou hodnotou. Jako spam jsou označeny pouze zprávy, jejichž ohodnocení překročí určitou mez. Tak se stane, že vás může např. vaše anglická kamarádka oslovovat „Drahý příteli“ a vy přesto takovou zprávu dostanete.

Bayesianská statistika je v současnosti nejoblíbenější a zároveň nejúspěšnější používanou metodou boje proti nevyžádaným zprávám. Tuto statistickou metodu navrhl v 18. století Thomas Bayes a slouží k určení pravděpodobnosti budoucích jevů na základě již shromážděných vzorků s tím, že každý další vzorek přispívá k bližšímu učení. Výsledky metody se tak na základě vzrůstajícího množství vzorků vylepšují. Implementace pro klasifikaci pošty fungují tak, že se na základě slov z existujícího vzorku normálních a nevyžádaných emailů vytvoří databáze pravděpodobností, že email obsahující toto slovo je spam. Když přijde nový email, tak se rozdělí na slova a na základě těchto slov se určí, zdali je email vyžádaný, či ne (spam). Po určení skupiny jsou na základě nového emailu poopraveny hodnoty pravděpodobností v databázi a další podobný email bude lépe kategorizován. Díky tomu nemusíte ručně procházet nevyžádané emaily a pozorovat jejich vlastnosti. Bayesianský filtr si sám povšimne, že slovo ‚cash‘ se často vyskytuje v nevyžádaných emailech, což vám jistě přijde samozřejmé, ale slova jako ‚modalities‘ (vyskytuje se ve velké části nigerijských spamů) nebo ‚ff0000‘ (html barva pro jasně červenou) již snadno přehlédnete. Filtry používající tuto metodu jsou velmi efektivní, ukazuje se, že i nejjednodušší statistické filtry dokážou po zaučení odchytávat 99 % veškerého spamu, ty lepší se dostávají až na 99.8 %. Vzhledem k tomu, že tato metoda se nezaměřuje pouze na analýzu špatných slov, ale i těch dobrých, dosahuje výborných výsledků i na poli falešných poplachů, tedy zpráv, které jsou legitimní, ale jsou označeny jako nevyžádané. Toto je pro uživatele mnohem horší, než když mu do schránky dorazí nevyžádaný email, proto je potřeba této problematice věnovat velkou pozornost.

Použitím statistických filtrů (a samozřejmě přísnou politikou správců poštovních serverů) by se časem mohlo podařit tento nešvar současného internetu omezit, případně vymýtit. Co spammery hlavně zajímá, je počet reakcí na jejich emaily. Pokud se podaří snížit na minimum počet nevyžádaných emailů, které budou doručeny do uživatelovy schránky, klesne i počet reakcí na tyto emaily. Pak pro spammery přestane být jejich obchod výnosný a časem od něj možná upustí.

V dalším dílu se zaměříme na praktické ukázky konfigurace antispamových prostředků.

Zajímavé čtení k tématu boje proti nevyžádané poště (anglicky):

Software používající metodu označkované adresy:

TIB2012

       

Software používající metodu rozpoznávání obsahu:

Software používající bayesianskou statistickou metodu:

Ondřej Surý

Ondřej Surý

Autor je vedoucím výzkumu Laboratoří CZ.NIC, z.s.p.o. a studentem FSS MU. Zajímá se o DNS, DNSSEC, Linux.

Školení: TCP/IP na Linuxu I.

V tomto kurzu se seznámíte se síťováním v Linuxu na všech vrstvách. Ujasníte si možnosti použití Linuxu v roli klienta, serveru i routeru.

  • Počítačové sítě
  • Architektura TCP/IP
  • Ethernet
  • Protokol PPP
  • Protokoly IPv4 a IPv6
  • IP na ethernetu
  • IP routing
  • Chybové a řídící zprávy
  • Transportní protokoly
  • Překlady jmen a adres
  • Aplikace
  • Překlady síťových adres a proxying
  • Testování sítě
  • Aktuální situace na poli TCP/IP

Podrobnější informace a přihláška  

Ohodnoťte jako ve škole:
Průměrná známka 2,86

Přehled názorů

Spam
Milan Beneš 1. 10. 2003 00:23
Nový
└ 
Re: Spam
Milan Beneš 1. 10. 2003 00:24
Nový
 
└ 
Re: Spam
krtek 1. 10. 2003 02:04
Nový
 
 
└ 
Re: Spam
MarSark 1. 10. 2003 17:48
Nový
filtry
opio 1. 10. 2003 03:49
Nový
Bayesovska statistika
Tomas 1. 10. 2003 08:07
Nový
└ 
Re: Bayesovska statistika
x 1. 10. 2003 08:32
Nový
 
└ 
Re: Bayesovska statistika
Tom 6. 10. 2003 18:33
Nový
Ještě tři způsoby boje
LK 1. 10. 2003 08:12
Nový
├ 
Re: Ještě tři způsoby boje
Lampa 1. 10. 2003 08:24
Nový
│
└ 
Re: Ještě tři způsoby boje
LK 1. 10. 2003 11:22
Nový
├ 
Re: Ještě tři způsoby boje
Frn 1. 10. 2003 08:36
Nový
│
└ 
Re: Ještě tři způsoby boje
Pedro 1. 10. 2003 08:51
Nový
├ 
Re: Ještě tři způsoby boje
lukas 1. 10. 2003 08:40
Nový
│
└ 
Re: Ještě tři způsoby boje
LK 1. 10. 2003 11:24
Nový
└ 
Re: Ještě tři způsoby boje
Marcel Semancik 1. 10. 2003 11:08
Nový
 
└ 
Re: Ještě tři způsoby boje
jk 2. 10. 2003 08:37
Nový
ceska posta
Ondrej Skutka 1. 10. 2003 09:07
Nový
└ 
Re: ceska posta
Josef Novak 1. 10. 2003 09:54
Nový
 
└ 
Re: ceska posta
Ondrej Skutka 1. 10. 2003 12:02
Nový
 
 
└ 
Re: ceska posta
Dusan 1. 10. 2003 18:58
Nový
PREVENCE
Yokotashi 1. 10. 2003 11:51
Nový
└ 
Re: PREVENCE
Radek 1. 10. 2003 15:35
Nový
 
└ 
Re: PREVENCE
remet 1. 10. 2003 22:06
Nový
Zablokovana schranka
HKou 1. 10. 2003 14:42
Nový
└ 
Re: Zablokovana schranka
LK 1. 10. 2003 15:14
Nový
Takova hloupost
TC 1. 10. 2003 20:59
Nový
├ 
Re: Takova hloupost
Marián Čavojský 2. 10. 2003 10:35
Nový
└ 
Re: Takova hloupost
binary_runner 3. 10. 2003 17:28
Nový
prevence
Pavel Čejka 1. 10. 2003 22:41
Nový
└ 
Re: prevence - SpamAssassin
Milan Beneš 1. 10. 2003 23:33
Nový
 
└ 
Re: prevence - SpamAssassin
Pavel Čejka 2. 10. 2003 11:53
Nový
JA OBCAS NA NEJAKY TEN SPAM AJ ODPOVIEM :))
dochodca 2. 10. 2003 11:13
Nový
Vícenásobná ochrana
Stanislav Brabec 2. 10. 2003 18:51
Nový
S klicovymi slovy to zacina byt horsi...
Martin 3. 10. 2003 16:41
Nový
└ 
Re: S klicovymi slovy to zacina byt horsi...
Ondřej Surý 3. 10. 2003 16:57
Nový
 
└ 
Re: S klicovymi slovy to zacina byt horsi...
binary_runner 3. 10. 2003 17:32
Nový
       

Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.

Zasílat nově přidané příspěvky e-mailem