Hlavní navigace

Názor ke zprávičce Linus Torvalds doporučuje nepoužívat ZFS na Linuxu od Jan Hrach - Úplné rozsypání jsem zažil někdy na začátku 2016...

  • 10. 1. 2020 14:52

    Jan Hrach

    Úplné rozsypání jsem zažil někdy na začátku 2016 s tehdy aktuálním kernelem, začalo to hlásit "corrupt leaf", ačkoli scrub procházel bez problému. Data byla stále dostupná, takže šla vykopírovat až na těch několik poškozených souborů. Pak jsem pustil fsck a ten smazal rekurzivně celý adresářový strom. A pak už to nešlo ani namountovat.

    Zbytek byly nefatální problémy:

    - RAID1 šel degradovaně připojit pro zápis pouze jednou, pak jen pro čtení. To opravili před pár lety.
    - Dostalo se to do stavu (vytvářením a mazáním snapshotů, i když jsem je nemazal na přeskáčku), kdy metadata zabírala spoustu místa a bylo potřeba pustit balance -musage 20, což trvalo několik dní na lowendových rotačních discích (6TB). Když se to stalo podruhé (cca. po dvou letech provozu), bylo to celé tak pomalé, že jsem to zrušil a vytvořil znovu.
    - Opakovaně se tomu na 4.15 daří vyrábět nested snapshoty, které se musí mazat rekurzivně. Takže workaround v pohodě, ale přijít na to chvíli trvalo (chybová hláška byla useless).
    - Kolem 4.1 vyráběl Dovecot na btrfs RAID 1 soubory, které při čtení vracely I/O error, žádnou chybu to nezalogovalo, scrub bez potíží a po rebootu se to vždycky na pár dní samo opravilo.