Vlákno názorů k článku SIEVE: algoritmus pro kešování lepší než LRU? od [object Object] - > .. kvůli odstranění čištění keše založeného na...

Článek je starý, nové názory již nelze přidávat.

3. 4. 2025 7:48

[object Object]

> .. kvůli odstranění čištění keše založeného na TTL, dochází k nárůstu spotřebované paměti. To je ve své podstatě v pořádku, protože cílem keše je ukládat data, nikoli je preventivně zahazovat.

Pamat a cache je na pouzivanie, ale nema vyznam ukladat nepouzitelne data. DNS zaznam po vyprsani TTL by sa uz predsa nemal vracat. (edit: zase je pravda, ze pamat stoji par korun a nema zmysel to riesit, ked sme pod limitom vyuzitia)

LRU ma jednu dolezitu vlastnost - a sice ze LRU s cache velkosti 2N funguje vzdy rovnako alebo lepsie ako optimalny (Beladyho) algoritmus s cache velkosti N.
3. 4. 2025, 07:52 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 8:11

Ondřej Surý

Nakonec jsme do vývojové větve začlenili variantu, která TTL-based cleaning zachovává, ale jiné DNS servery (např. Unbound) žádné čištění na základě TTL nemají, a fungujou. Takže je možné, že to do budoucna ještě přehodnotíme. Jako další experiment je naplánováno nahrazení heap za skiplist, a uvidíme, jestli a jaký to bude mít dopad na výkon.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 8:27

Wasper

Když už o tom mluvíte, rád bych se zeptal, jak je do toho celého vlasntě začleněna featura stale-answers?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 13:55

bez prezdivky ...

Ja teda nevim, protoze to v tom testu neni, ale rek bych, ze kdyz se zaznam nenajde v cache, je to o dost rychlejsi, nez ho tam najit a resit ze je expirovanej.

Ucelem cache pak rozhodne neni skladovat neplatna data.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 14:13

Ondřej Surý

> kdyz se zaznam nenajde v cache, je to o dost rychlejsi, nez ho tam najit a resit ze je expirovanej.

Ne. Nesmíte si cache představovat jako knihovnici, která vám hledá knížku v papírové kartotéce…

> Ucelem cache pak rozhodne neni skladovat neplatna data.

To nikdo netvrdí. Nicméně náklady na mazání neplatných dat nejsou nulové, proto se mazání dělá pouze oportunisticky nebo až ve chvíli, kdy je to potřeba (cache-miss při plné keše).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 14:20

o6g

ja si predstavuju cache jako batoh co si nesu na zadech a mam v nem lahvace.
kdyz mam zizen a chci plzen a najdu v batohu plzen tak je to rychla akce a muzu se napit z lahvace plzne.
kdyz mam chut na starobrno, ale nemam ho v batohu, tak musim daleko do obchodu, nakoupit a jako zalohu si ho pridat do batohu.
ale kdyz vim, ze uz jsem dlouho nedostal chut na svijany, tak je radeji z batohu vyndam a venuju mistnimu popelarovi a uz neni v cache :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 17:24

xyz

No tahle analogie je mizerná. Protože po nákupu Starobrna a jeho vypití (fuj) už bys do batohu (cache) dal prazdnou flašku a při dalším requestu Starobrna bys stejně musel do obchodu. A ještě bys měl v cachi prázdné flašky (null objekty) :))
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 17:33

Ondřej Surý

Třeba si toho Starobahna jenom ucucne a vrátí ho do batohu. Vylije ho až když bude úplně vyšuměné.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 14:46

bez prezdivky ...

"Ne."

Dukaz?

1 ... select do databaze (cache neni nic jinyho)
2a ... vratim nalezenou odpoved
2b ... poslu select do externi databaze

vs

1 ... select do databaze (cache neni nic jinyho)
2* ... jdu overit, zda nalezeny zaznam je platny
3a ... vratim nalezenou odpoved
...

Je tam zcela jeznoznacne krok navic ktery delat nemusim pokud zaridim, ze zadne neplatne zaznamy v cache nebudou, Coz se specielne u DNS da udelat naprosto vpohode.

* Navic ten krok narozdil od mazani neplatnych zaznamu musim udelat okamzite s kazdym jednim dotazem.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 15:26

Marvin

Uklízení mrtvol je drahý, proto se to odkládá až není jiná možnost. Každou sekundu něco expiruje, uklízelo by se pořád.
Jedno CMP pro TTL na každý hit není moc práce.
U DNS se vrací záznamy i ze stale-cache, když je autoritativní server nedostupný.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 15:45

Ondřej Surý

Nezlobte se, ale bohužel nemám čas na to, abych vás dovzdělával. To musíte udělat vy sám.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 16:43

bez prezdivky ...

Takze konstatuji, ze neni k dispozici naprosto zadny argument. Casu na blaboleni a osobni utoky je ovsem zjevne dost.

2Marvin: Je to mnohem vic prace nez zadna prace, zaznamy z cache nemusim vyhazovat v okamzik expirace kterou maji typicky pomerne dlouhou, takze kdyz to budu delat 1x za hodinu a klidne budu aktivne vyhazovat ty, ktere konci pristi hodinu, porad to bude mnohem levnejsi, nez s kazdym dotazem overovat platnost. A klidne ty co maji pripadne ttl pod hodinu nebudu do cache davat vubec.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 16:57

Ondřej Surý

Tu důkazní nouzi máte vy, ne já. Předložil jste nějakou hypotézu, ze které jde vidět, že problematice nerozumíte. To není ani námět k diskuzi, ani osobní útok. Nemůžete po ostatních chtít, aby vaše hypotézy dokazovali nebo vyvraceli, a trávili tím čas, který má nějakou hodnotu. Podložte svou hypotézu teorií a daty, a bude možné v diskuzi pokračovat. Opakování nepravdivé hypotézy pořád dokolečka nepřináší žádnou hodnotu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
3. 4. 2025 18:08

Filip Jirsák

bez prezdivky ... Argumenty jsou. Ale pro pochopení argumentů jsou potřeba nějaké základní znalosti, které vy nemáte. A není povinností nikoho zde v diskusi vám ty základy vysvětlovat.

Vyhození záznamu z cache je práce, dost drahá práce. To, že ověřovat s každým dotazem platnost, je mnohem levnější, než vyhazovat záznamy z cache, je vaše ničím nepodložená domněnka.

Když nebudete cachovat záznamy s TTL menší než hodinu, s největší pravděpodobností nebudete cachovat většinu provozu. Protože ty nejzajímavější záznamy, kam lidé lezou nejčastěji, mají právě krátkou TTL.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 4. 2025 15:39

Petr Menšík

Zkuste si pořádně prohlédnout výstup digu při dotazech na populární weby. Zkuste parametr +ttlu. Většina obsahu poskytovaného nějakou CDN má krátká TTL, rozhodně po hodinových intervalech nemůžou pracovat. To sice platí pro servery TLD nebo root serverů, ale není tolik běžné u jiných serverů. Zkuste dig +ttlu www.root.cz www.lupa.cz, jak vysoké jsou.

Poté, co ověříte platnost a bude vypršená, můžete ten kontrolovaný záznam přehodit do listu "vypršené k použití přístě". Takže nutně nechodíte pořád na ten stejný záznam a neděláte to dokola.

Ty záznamy s kratším TTL budou chtít vaši klienti častěji, protože i oni obvykle mají svoji cache. Ty určitě nechcete nechat viditelně čekat.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 4. 2025 14:19

Vít Šesták

Ten krok navíc bude porovnání dvou čísel, tipuji tak jednu instrukcí. Ve srovnání se zbytkem je to řádově zanedbatelné.

Druhá věc ale je, jaká je alternativa. Mohli bychom cache uklízet hned, jak něco vyprší. V takovém případě bychom asi nechtěli procházet celou cache, tedy nejspíš bychom si udržovali i seřazený seznam expirací, a s každým uložením do cache bychom si museli ten seznam aktualizovat. Když ignoruju race conditions (teoreticky bychom mohli čerstvě vypršený záznam vrátit jako platný, protože úklid taky chvilku trvá*), udržování dlouhého seřazeného seznamu, do kterého pořád něco vkládáme, není úplně zanedbatelná operace.

*) Šlo by to samozřejmě řešit zámkem, což ale bude stát nemálo výkonu v situaci, kdy každou chvíli něco expiruje.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 4. 2025 14:58

Petr Menšík

Ondřej dělá už v desítkách let kolem DNS. Je to k neuvěření, ale asi mezitím něco pochytil. Váš příklad pěkně popisuje hledání záznamu, ovšem nikoliv proces úklidu vypršených záznamů. Ten se neděje jednou instrukcí.

Ano, DNS cache je databáze, která se typicky skládá ze stromu, ve kterém se hledá podle jména záznamu. Uložená data nebývají velká, často mohou být velká podobně jako pointer do paměti. A záznamy se vejdou dva do jednoho 64b pointeru, AAAA záznam potřebuje velikost 2 pointerů na 1 adresu. Moc se kvůli tomu nevyplatí dělat druhý index podle TTL, aby se vám snadno a rychle mazalo vypršené záznamy. Pokud v rámci bodu 1. ověříte, že to jméno máte, porovnání TTL záznamu už je v porovnání s hledáním ve stromu konstantní operace. 2* dostane handle na nalezené záznamy toho jména, nehledá znovu od začátku. Tohle není web cache, kde ukládáte celé stránky.

Nějak jste nevysvětlil, jak ze stromu uspořádaného podle jména rychle smažete ty vypršené záznamy, na které nemáte separátní frontu řazenou podle (zbývající) TTL. Mít dodatečný index k TTL každého záznamu je drahé a zabírá to dost místa, která by se mohla využít pro uložená data. Hit ratio je celkem zásadní parametr pro rychlé DNS, velká cache dost pomůže.

Vaše varianta s 3a je (pokud vím) v bind9 kódu použitá. Rád se nechám poučit, kde přesně to dělají jinak.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku SIEVE: algoritmus pro kešování lepší než LRU? od [object Object] - &gt; .. kvůli odstranění čištění keše založeného na...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Na dotace na zateplení zapomeňte. Nová vláda vykleští NZÚ

Apple opravil bezpečnostní chybu, která byla v iOS od verze 1.0

Malware, ransomware a další online hrozby: Jak se liší?

JMHZ a změny v daních z příjmů v roce 2026 a 2027

Irsko se po pauze znovu otevírá pro výstavbu datových center

Hackeři útočí přes e-mail, prahnou po přihlašovacích údajích

Nejen daňové přiznání, OSVČ musí podat elektronicky přehledy

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

V USA povolili terapii Optune i pro léčbu rakoviny slinivky

Zahrávají si ČEZ či E.ON s čínským ohněm?

Google Pixel 10a má plochý design a vylepšenou odolnost

Počet nových pracovních míst prudce klesá

Školkovné se vrací. S jakou obměnou?

Připravit, pozor, teď! Spouštíme Channeltrends Awards 2025

Lidl Outlet opustil Olomouc a zamířil na sever Moravy

EET není český výmysl. Zjistěte, kde za účtenku můžete vyhrát auto

Stát dá svobodu důchodcům, které držel ve III. pilíři

Lidé si mohou nechat zdarma vyšetřit znaménka, zrak i cukr

Co chceme od AI asistentů? Návrhy odpovědí a třídění pošty

Deset kroků pro maximální zabezpečení Google účtu

Vlákno názorů k článku SIEVE: algoritmus pro kešování lepší než LRU? od [object Object] - > .. kvůli odstranění čištění keše založeného na...