Vlákno názorů k článku Souborový systém Btrfs: kontrola dat a pokročilé použití od Swiso - Předně bych chtěl vyjádřit autorovi své díky za...

Článek je starý, nové názory již nelze přidávat.

18. 2. 2020 9:08

Swiso

Předně bych chtěl vyjádřit autorovi své díky za brilantní seriál o Btrfs systému. Jelikož ho začínám čerstvě používat spolu s RAID 1 polem, jsem rád, že se dozvídám mnoho důležitých informací jak z článku, tak i od diskutujících.

Nyní k mému dotazu: I zde v článku je zmíněno zálohování. Musím říct, že tenhle způsob záloh mi nedá spát a stále si nejsem jist, že to, jak to celé funguje, chápu správně. Pro mě osobně je záloha, kterou lze označit za zálohu 1:1 kopie dat. Čím více důležitých dat, tím více kopií na více úložištích a také fyzických místech. Tedy příkladně, pokud mám 2TB důležitých dat, lze jako jediné považovat za zálohu, pokud mám tyto data 1:1 na jiném 2TB disku (3 zálohy = 3x 2TB HDD). Jestli to chápu správně, snapshoty fungují tak, že dělají rozdílové "zálohy", tady musím mít něco jako zdroj a ze zdroje odečítám (zapisuji) k prvnímu snapshotu pouze rozdíl. Následný další rozdíl také, ale jenom s tím rozdílem, že již nějaká data odečítám z prvního snapshotu. Důležité ovšem je to, že musím mít někde ty 2TB dat (zdroj, který je porovnáván). Jestliže se zdroj poškodí, můžu si 10 snapshotů strčit někam. Chápu to správně? Jestliže ano, nejedná se totiž o zálohu a je velmi nesprávné a také zavádějící, to takto označovat. Je to jako tvrdit, že RAID 1 je záloha dat. Ano, data máte na dvou discích, ale bohužel, dojde např. k napadnutí stroje ransomware a data se zašifrují i na disku druhém. => proto se nejedná o zálohu. Píšu to, protože mnoho lidí to, bohužel, nechápe. Je mi jasné, že diskutující zde, ví.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 2. 2020 10:14

Josef Jebavý

Díky za pochvalu.
Ano je bude stal stejný problem jako pri priruskovych zalohach - pokid stratis full zálohu tak prustky ti jsou k nicemu.

Zaloha to je - mas to kopii od produkcnich dat a i na jinem mediu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 2. 2020 23:24

Logik

Ne úplně. Pokud provedeš na zálohovacím stroji Btrfs restore, tak tam budeš mít dva snapshoty, oba s full zálohama. Pokud starší snapshot smažeš, tak furt pomocí toho nového snapshotu data obnovíš. V tom je ta "genialita" snapshotů a obrovský rozdíl oproti klasickému přírůstkovému zálohování.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
19. 2. 2020 21:28

vdx

Ano ale samozřejmě taky s dvojnásobným datovým objemem :(
Zatímco snapshoty jsou něco jako git revize, kdy je celý systém v daném bodě dostupný, ale vnitřně to zabírá jen tu inkrementální část. Podobně jako u věcí typu syncthing.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 2. 2020 12:21

Logik

Nikoli: pokud to send-restore uděláš jako inkrementální, tak na cílovém stroji Ti také vzniknou dva snapshoty sdílející data. Btrfs send-restore právě funguje přesně jako git: snapshoty šetří místo jak na místním, tak na "vzdáleném repozitáři".
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 2. 2020 22:14

vdx

Aha tak dík za poučení, že by šlo udělat restore jako inkrementální, to jsem netušil. Vyzkouším teda, jestli se to dá v praxi použít. V podstatě bych si tak mohl vytvořit vlastní systém záloh s výhodami snapperu na libovolném jiném fs (typicky externí ext4 disk). Tedy pokud jsem to správně pochopil - restore opět na btrfs by nemělo moc smysl, nechci aby ta záloha byla závislá na konkrétním fs (mělo by to být fs-agnostic, tj. přenositelné resp. klonovatelné kamkoli).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
23. 2. 2020 18:02

Logik

....s výhodami snapperu na libovolném jiném fs (typicky externí ext4 disk).

Tak to zas ne. Teda leda bys na ten ext4 disk ukládal jen výsledek toho "send", a to je pitomý, protože z toho nemůžeš jednoduše dostat jednotlivý soubory. Jak bys chtěl udělat inkrementální restore na ext4, kde nic jako snapshoty nejsou??

Zálohovat send/recieve má největší smysl právě, když zálohy odkládáš na vzdálenej BTRFS, kde to rovnou obnovuješ (recieve), čímž tam máš dobře přístupný historický verze souborů.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
23. 2. 2020 20:47

vdx

Hmm, toto jsem tak nějak předpokládal... raději bych v tom případě použil něco jako restic.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
25. 2. 2020 17:33

Logik

No nějak nerozumím té motivaci. Nechceš řešení založené na BTRFS, protože je založené na "proprietálním software", a radši použiješ řešení založené na jiném proprietálním software.....
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 2. 2020 0:04

vdx

O proprietárním software jsem doufám nemluvil, to se netýká ani jednoho...

Ale jde mi o řešení přenositelné a nezadrátované natvrdo do partitions na nějakých discích, kde nemám pod kontrolou vážná rizika selhání, se kterými jsem se opakovaně setkal.

Byl bych strašně rád, kdyby btrfs bylo bezvadné, ale halt určité scénáře nemají ošetřené. Konkrétně mám osobní podezření, že to souvisí s velkou diskovou cache (případně s SSHD disky), kde disk navenek ohlásí zápis transakce z žurnálu, ale přitom si ji ve svém blackboxu jen zapsal do své obrovské mnohagigabajtové cache a bude ji zpracovávat po svém třeba následných X sekund. Pokud v této době dojde k přerušení napájení a disk nemá náhradní napájení (např. vestavěný kapacitor nebo baterii), tak dojde k poškození B-tree, které už fs není schopen nikdy opravit, protože ani normálně nenaběhne. A bohužel offline nástroj btrfscheck tuto kategorii chyb opravit taky nedokáže, ale spíše naopak situaci ještě zhorší. Takže pak nezbývá než force restore, kdy ale o data, která byla v té false flag transakci (případně i data, která rozjebal btrfs check) přijdete. Pokud šlo třeba o nějaký důležitý pracovní dokument nebo jiná unikátní nová data tak to není nic příjemného (kdyby se dala přehrát historie žurnálu která tato data musí obsahovat, tak by to bylo fajn řešení, ale to nepůjde, protože fs je koruptovaný a nepovolí to). Celé je to IMHO proti smyslu žurnálovacích fs, které by právě takovým jevům měly zamezovat. Jestli máte nějaký nápad jak to vyřešit, nebo mi napovědět, kde dělám v chybu třeba v nastavení parametrů fstab, tak prosím...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 2. 2020 10:38

Miroslav Šilhavý

Předně bych se nedržel premisy, že záloha == 1:1 kopie dat. Pokud tím máte na mysli to, že bude 1:1 bitová kopie, pak to zase s sebou nese riziko vznikající z chyb filesystému a jeho interpretace (v roce 2020 může mít btrfs nějakou chybu, kterou zároveň v této době umí "správně" interpretovat, ale v roce 2025 při připojení zálohy můžete narazit na projev problému). Záloha bitové kopie je jedna ze specifických typů záloh, ale určitě se nedá říct, že je to nejvhodnější vždy a všude (já bych skoro řekl, že se tato výhoda hodí málokdy).

Zálohovací systémy často umějí přírůstky intepretovat do hlavní knihovny záloh takovým způsobem, že po uložení dat už neexistuje závislost na full záloze a na předcházejících přírustcích (ale přesto umí podle katalogu najít stav ke každému inkrementu). To, jestli vím, tak ani zálohy snapshotů btrfs, ani zfs neumí (a třeba pro mě je to velké mínus).

Formou snapshotů je vhodné zálohovat často měnící se data, aby byl zachycen stejný okamžik na celém subvolume. V praxi je asi nejčastější případ formou snapshotů zálohovat (jenom) transakční logy databázových systémů, případně, pokud to situace dovoluje, tak i hlavní databázi.

Překvapilo mě doporučení na vypínání CoW pro databázová úložiště. Zrovna tam je to potřeba - stejně databáze zapisují stránky na konec transakčního logu, takže k častým přepisům dat nedochází. Ve chvíli, kdy dochází k promítnutí změněných stránek do hlavního úložiště, je CoW zapotřebí jako soli. CoW by mělo mít poměrně mrňavou režii (filesystem stejně zapisuje svoje stránky). Doporučil bych spíš vyladit interval zápisu logů do databáze, případně (po pečlivé úvaze) oslabit fsync, než vypínat CoW - to jde zcela proti smyslu architektury!
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 2. 2020 10:54

Swiso

Ano, máte pravdu, použil jsem nešťastný termín. Měl jsem na mysli 1:1 ve smyslu stejná data na jiném médiu ("prachsprostě" překopírovaná a poté ověřená a zkontrolovaná). Jinak časový snímek dat je parádní věc a i vím, kde bych to používal já, ale nelíbí se mi to označení záloha, protože to mate uživatele a já jim pak dost blbě vysvětluji, že to vlastně záloha ve smyslu záloha, není. Obdoba RAID 1, jak jsem psal. O bitové záloze máte pravdu, kvůli tomu ji také nedoporučuji používat. Na vlastní kůži jsem už poznal její záludnost.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 2. 2020 13:27

Heron

Ve chvíli, kdy dochází k promítnutí změněných stránek do hlavního úložiště, je CoW zapotřebí jako soli.

Záleží na konkrétní db, ale ty postavené na MVCC architektuře si něco jako COW dělají sami. Nikdy se nepřepisuje existující záznam, ale vždy se vytváří nový. Až zpětně jsou označeny volné záznamy nebo celé stránky.

Takže dělat MVCC nad COW znamená ty bloky na disku měnit 2x. DB zapíše změněnou stránku, FS to vidí jako změnu bloku, tak udělá ještě COW toho bloku. Potom nad DB proběhne vacuum, DB označí tu původní stránku jako volnou a FS to opět vidí jako změnu a provede COW.

Nepřináší to žádnou výhodu, takto postavená DB se sama vyrovná s výpadkem napájení apod. Živé stránky se nikdy nepřepisují a ty mrtvé jsou označeny za volné až někdy zpětně (ano, samozřejmě, existují optimalizace jako hot update apod, ale to není teď potřeba komplikovat). Tj datové soubory jsou vždy v pořádku a snadno rekonstruovatelné pomocí logů. Dělat nad tímto ještě další COW nic nepřinese a sníží výkon zápisu efektivně na polovinu (v praxi ještě více).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 2. 2020 16:38

Pavel Tavoda

Ja by som teda najprv urobil poriadok v pojmoch. Zaloha nie je archiv a archiv nie je zaloha. Mali by ste mat nejaku policy pre archivaciu udajov. Napriklad jeden archiv pre kazdy rok a za poslednych 6 mesiacov kazdy mesiac a posledne 4 stvrtroky. Vzdy full archiv na 2 roznych lokaciach a 2 technologicky roznych mediach (SSD, tocity disk, cloud, paska, ...).
Zalohy sa potom mozu odrazit z tychto archivov, takze si zalohujete iba rozdiely oproti full archivom.
No a na zaver technicka poznamka, musite vediet co robite. Ked si pod beziacim Oraclom urobite snapshot a zazalohujete neznamena to ze viete neskor obnovit instanciu Oraclu.

Vlákno názorů k článku Souborový systém Btrfs: kontrola dat a pokročilé použití od Swiso - Předně bych chtěl vyjádřit autorovi své díky za...

Dále u nás najdete

Odpovědnost za rozhodnutí zůstává na lidech AI navzdory

Bionáplast pomáhá s hojením bércových vředů

Máte záložní plán, pokud byste chtěli odjet z ČR?

7 věcí, kterými si kazíte business na LinkedInu aneb nebojte se mlčet

Zdravotní a sociální pojištění 2026 u OSVČ: Opět výrazný růst záloh

Proč přichází éra suverénních datových center?

Kolik bude stát snížení záloh OSVČ? Každý tvrdí něco jiného

Získá Netflix také HBO Max? Souboj jde do finále

Osvědčený recept na linecké. Zásadní je správný poměr surovin

Kubík musel na mimotělní oběh hned po porodu

Datové schránky se budou stěhovat a projdou redesignem

Nádor slinivky se ohlásil nafouklým břichem, pak přišla rychlá operace

Evropa už utíká od amerických cloudů

České investiční fondy sní americký sen

Samořídicí vozítka začala doručovat jídlo v pražském Karlíně

Vzniká nová aplikace PID Lítačka, co se mění?

HP chce propouštět a šetřit, argumentuje AI

Nevymknou se vládní investice do IT kontrole?

Nasedl jsem to samořiditelného taxi bez volantu

Elektronický podpis: slabiny a možnosti přerazítkování