Jedna se o srovnani ceny, nikoliv kapacity. Druha vec je, jestli tyhle plotnovy disky bude nekdo chtit, pac cteni max 200MB/s a zapis s bidou 150MB/s je proste tragicke a kdo kdy menil disk a nebo v diskovym poli nahrazoval, tak to pak 5 dni cvdrdlika a ma to sotva polovicni vykon po tu dobu (mluvim o domacim policku na dva disky).
Tak jsou spousty situací, kdy to s velkou rezervou stačí. Takové NASky na doma nebo menší firmu ... stejně je to připojeno 1Gbps, takže to i ty rotační disky zvládnou ukrmit. Jasně že s SSD by to bylo svižnější, ale při stejné kapacitě také nesrovnatelně dražší. A ano ... rebuild takového pole trvá dlouho, přesto to lidé akceptují, protože cena za TB je u HDD prostě výrazně nižší.
Pro větší pole, ať už na zálohy či něco jiného, můžete výkon vyškálovat počtem disků. A je potřeba nezapomínat na to, že jsou zde velmi efektivní technologie, jak taková pole akcelerovat pomocí SSD ... ať už se bavíme o řešení v HW RAIDu, nebo využití moderních filesystémů jako je například ZFS apod. Samozřejmě se tak člověk nedostane na výkon full ssd pole, ale je to možnost to pole výrazně zrychlit.
Scénářů, kde potřebujete velkou kapacitu bez nároků na velký počet IOPS je tu myslím hodně a nečekám, že se to třeba do konce této dekády změní.
Offline záloha je taková, kterou (mimo dobu, kdy se zrovna zálohuje) nemůže ohrozit chyba uživatele, chyba software, ransomware,... Pokud možno by neměla sdílet hardware se systémem, který data zálohuje (corruptnutá data kvůli vadnému řadiči jsem zažil osobně a zdroj, který odpálil elektroniky všech disků jsem už viděl také). Paranoik by možná tvrdil, že by mimo dobu zálohování neměla být připojená k el. síti (úder blesku).
Já třeba ano, protože zkrátka musím, samozřejmě nejde o fotografie z dovolené, ale o pracovní dokumentaci např.: rozvodná skříň řídícího systému, kompenzace, vzduchotechnika a vše se do detailu nafotí před zapojením a po zapojení (předání). Jednak slouží jako podklad pro fakturaci, ale také jako důkaz. Nejednou se mi stalo, že po 10 letech zavolal naštvaný zákazník (investor), že jsme udělali něco špatně. Stačí porovnat fotografie a je naprosto jasné, že řve na nesprávného člověk. U každé zakázky se něco do 10-15 let upravuje a mnohdy to dělá někdo jiný - 50x vytelefonovaný projektový plán, 10x upravený podle "aktuálního" plánu zřídka kdy odráží realitu, to je úplně jiný vesmír a vždy se něco upravuje ještě na místě. Do roka se vždy zasahuje, protože se něco změní a často to provádí někdo další ... např.: přidávají se jističe apod. Velké změny zpravidla dělá původní dodavatel, ty malé, kdokoliv kdo má zrovna čas a to je kámen úrazu.
Samozřejmě je lepší mít data "online", tedy přístupná z datového pole (dva identické servery v zrcadle), ale pro jistotu se každý víkend pravidelně spustí pásková knihovna a všechno se archivuje "offline" na LTO4 pásky. Po zálohování se uloží a zůstávají jako pojistka proti zničení Toma a Jerryho, aneb tak se jmenují datové servery, které jsou "pro všechny případy" cca 600 m od sebe a propojené 10GHz WIFI uzlem. Kdyby mi náhodou vyhořel barák, nebo firma. Jinak samozřejmě mám pronajaté cloudové úložiště - disk, kam se zálohují pro ještě větší jistotu šifrované kontejnery s daty (dříve TrueCrypt, dnes VeraCrypt).
Plus si každou sobotu dojdu do práce a to nejdůležitější vypálím na DvD-RAM a odnesu domů (na firmě mám "Toma" s páskovou knihovnou a doma Jerryho s DvD-RAM). A pro všechny případy ještě ve světě. Už jsem o data přišel a jsem tak trochu paranoidní notorický zálohovač všeho. Protože mi to říká pane, mohu si zálohuji si i soukromé, ovšem už bez pásek a pravidelného sobotního pálení DvD-RAM. Na soukromé to zase tak nepotřebuji.
M-DISC, případně český DataTresorDisc (ale nevím, jestli to ještě dělají), je SKVĚLÁ volba archivního média pro běžné smrtelníky. M-DISC od Verbatimu existuje i jako BD, i jako BDXL - na to poslední se vejde 100GB dat, jen se ale musíš smířit s tím, že to médium stojí cca 300-400Kč. A když ti během vypalování vypadne na vteřinu elektřina .... no radši bych k tomu přidal i UPSku :-).
DataTresorDisc testoval před lety kolega WIFT na cdr/diit, prohnal to opravdu šílenými testy a byla to VELMI odolná média ... https://diit.cz/tagy/data-tresor-disc
Jinak já osobně zálohuji/archivuji takto: 99% věcí mám na velkém SATA HDD (jeden kus, žádnej RAID atd). Vše, co považuji za hodné uchování, pálím na DVD+R média. Jednou za čas vždy z té série nějaká média vytáhnu a zkontroluju čitelnost. Pokud se mi něco nezdá, přezálohovávám na nová. Ale to se takřka nestává. Jinak fotky dávám i na papír, takže kdyby selhala všechna média, mám papírovou zálohu. Nemluvě o tom, že mnoho mých fotek jsou skeny negativů, takže tam tou primární zálohou je čb negativ, u kterého stopro víme, že pokud byl dobře ustálen, vydrží určitě 100+ let (samozřejmě pokud není na debilní podložce, co podléhá octovému syndromu, což je případ barevnejch negativů typu C-41). No dalo by se o tom dlouze....
Je tam ale jeden drobný problém - aby po tých rokoch fungovala aj mechanika. HDD má v tomto jednu výhodu (ktorá je zároveň aj nevýhodou), že mechanika a médium tvoria jeden celok.
Pred rokmi som mal na starosti zálohovanie jednej banky a s páskami som si užil svoje. Napríklad, ak oddelenie nákupu stratí objednávku na nákup nových pások a celý neskutočne byrokratický proces schvaľovania tak musí začať odznova :-).
CD média približne z roku 2000 (zlaté Kodak) stále držia (asi pred rokom som potreboval jeden starý zdroják). Problém je hlavne s priestorom - celá prepravka, asi 100 ks CD, sa dnes dá uložiť na USB kľúč.
Diskety z roku 1995 - Verbatim a Polaroid sú čitateľné, no-name disketa priložená k časopisu Chip už nie (bohužiaľ, mladícka nerozvážnosť tam umiestnila jedinú elektronickú kópiu diplomovky - ostala mi tak už len tá vytlačená na papier).
Nostalgicky odkladám ešte asi 5ks 5,25" diskiet z druhej polovice 80. rokov - nemám žiadnu mechaniku na ich prečítanie.
Momentálne považujem za optimálne riešenie z kompromisného pohľadu zohľadňujúceho použiteľnosť, rýchlosť a zaberaný priestor, NAS v kombinácii s niekoľkými samostatnými externými diskami (umiestnenými na viacerých lokalitách) na najdôležitejšie dáta (tie sú ešte aj v niekoľkých cloudoch, ide hlavne o fotky).
Ano, to je obávám se největší slabina těchto neorganických DVD a BD médií. Jejich životnost je násobně vyšší než životnost DVD a BD mechanik, i kdyby nakrásně šlo o mechaniky vyrobené v roce 2045. Ostatně je to 6 let co Funai jako poslední výrobce na světě ukončil výrobu VHS videí. Čili řekněme za 10+ let se budeme moci bavit o tom, že tyhle "20 let satré klumpy" přestaly fungovat. Tou dobou budu stále ještě doma mít perfektně čitelné VHS kazety nahrané v roce 1992.
"99% věcí mám na velkém SATA HDD (jeden kus, žádnej RAID atd). Vše, co považuji za hodné uchování, pálím na DVD+R média"
To chce hodně odvahy. Kolik už těch DVD je? V případě havárie disku bych nechtěl čekat, než se nakopírují data z desítek či stovek DVD a postupně do mechaniky ládovat jedno po druhém a pokaždé se modlit za čitelnost.
Tak ten 4TB HDD obsahuje z velké části snadno rekonstruovatelné věci jako filmy/seriály. Zbytek, čili rodinná videa a fotky pravidelně zálohuju.
Těch DVD je odhadem 40ks rodinnejch věcí + cca 500ks film / seriálů / dokumentů, co se tu a tam opráší, případně tu a tam předělají do x265/opus, když jdou na novější DVD zálohu (např. jsem takhle onehdá přezálohovával už trochu zlobící DVD z roku 2004 na nová média, nicméně to zabralo zlomek prostoru).
Na ty testy si dobře vzpomínám, to jsem četl s velkým zaujetím, jako ostatně všechny články od WIFTa. Kdyby někdo podobným způsobem potrápil ty M-DISCy a sepsal o tom článek, byla by to paráda - ale to už asi v dnešní době nemůžu čekat. Další otázka, která mě v souvislosti s tím napadá, je jak jsou na tom kvalitativně dnešní vypalovačky za pár stovek (dobře, u BR trochu víc). Hlavně když to srovnám s dobou, kdy kvalitní (CD-R/RW) vypalovačka stála minimálně vyšší jednotky tisíc, ale člověk taky věděl, že nekupuje zajíce v pytli.
Myslím že důvod bude, především v situacích, kdy se přepisuje větší množství dat mnohokrát. Pokud se kapacita SSD bude vyvíjet tak, jak se vyvíjí, tedy každou generací klesá množství potenciální přepisů, tak to 10 TB SSD půjde přepsat tak jednou ;) zatímco HDD....
SSD technologii nepovažuji za spolehlivou, pokud bych měl nějaká důležitá data ukládat na SSD muselo by to být pole s nějakým rozumným stupněm redundance. Od skalních dob, co používám HDD se mi stalo snad jednou, že by mi odešel disk HDD (v době kdy kapacita dává smysl k používání), od dob, co používám SSD mi odchází prakticky každý druhý takový (dříve nebo později). Rekordů jsem dosahoval když jsem vyvíjel a stahoval si pravidelně testovací data ve velkých objemech (tam ty přepisy byly extrémní a SSD šlo do kytek tak za rok, a to byly ještě SLC).
Strategie je: SSD na programy a systém (tam tolik nevadí zničení a je třeba rychlý přístup); HDD na data nehledě na objem a druh (tam je třeba, aby to vydrželo, a to že se to trochu pomaleji načte mi nevadí) samozřejmě v nějakém alespoň mirror RAIDu.
Zajimave, ja mam naprosto opacnou zkusenost.
V drivejsich drevnich dobach byly problemy s disky dennim chlebem, rebuildy mirror poli, vymeny vadnych kusu a to jak na desktopech, tak na serverech.
Pak se situace sice vyrazne zlepsila, ale od doby SSD disky prakticky neresim, na desktopu ve firme odesel snad 1 kus z desitek a v servech zatim zadny (tuky, tuk) a to ani ve vetsich polich, ale je treba rici, ze jsou to enterprise zarizeni, drazsi, ale spolehlive a ani produkcni databazove servery nedokazaly ty SSD dostat k hranici zivotnosti prepisu.
No a od doby co tu mame NVME uz prakticky o I/O subsystemu nevim... ;-)
Čili pouze 200 přepisů a současně použití QLC NAND flash. kdysi jsme takovéhle parametry považovali za šunt. Pravda, vylepšení v algoritmech toho dost kompenzují a člověk obvykle nezapisuje ani desítky TB za den, takže ten garantovaný přepis vydrží za hranici morální životnosti těchto SSD. Ale i tak je tam prostě poměrně blízký strop.
Mimochodem, stále provozuji jedno 3,0Gbit/s SATA SSD, 120GB model s MLC čipy, stáří už pomalu 12 let. Jsou na tom jen Windows + aplikace, zápisů už tolik nebývá (jen občas se tam proženou nějaké aktualizace), ale to SSD stále perfektně drží. Tedy ... ulomil se kus plastu, co drží packou SATA kabel v SSD, tojo, to odešlo už před pár lety :-).
Čili já někdejší odpůrce SSD jsem změnil názor. Už jsem vzal na milost i TLC a momentálně jedu na 500GB SATA Šamšulovi k plné spokojenosti.
Co se tady neřešilo (překvapivě), je zápis v celých blocích na SSD. Jistě, fragmentace na HDD je skutečností a jednou za čas je dobré ji řešit nejen u velkých RAID polí. Ale i SSD se může - a v praxi reálně dostává - do situace, kdy velmi výrazně zpomalí v okamžicích, kdy je disk hodně obsazen. Toto je pak paradoxně nejen problém s rychlostí, ale také životností SSD. Přeskupování dat totiž zabere čas a ubere na počtu zápisů do jednotlivých buněk SSD disku. ani interní software disků na tom nic nezmění, hlídá sice rovnoměrné opotřebení buněk, nikoli zápis po blocích. Tudíž je nasnadě reálné použití SSD disků ve velkých polích serverů (neberu v potaz současné cenové rozdíly). Z mého pohledu si tady pořád klasické plotnové disky stojí dobře a zřejmě to tak ještě nějaký čas potrvá. Jak tady už zaznělo - SSD na systém určitě ano, ale na velký objem často se měnících dat zatím raději ne. Jistě namítnete, že to řeší serverové SSD disky "mixed use", ale rozhodně ne komplexně. Ostatně, je-li seberychlejší SSD připojeno rozhraním SATA, není rychlost limitována tím, co umí SSD disk, ale právě SATA řadič :-)
Jen bych chtěl případné diskutéry upozornit na rozdíl archivu a zálohy. Není to to samé. Každý sleduje jiný cíl a tak má jiné podmínky použití.
Já svá cenná domácí data archivuji na offline médium (optické), jelikož archiv je neměnná část dat a nepředpokládá se aktualizace. Oproti záloze, která je dynamická, v pohybu a má daleko kratší časové okno, navíc lze lépe diverzifikovat (kombinace denní NAS + offline HDD per month) dle povahy dat. A pak tu máme "skladiště" (NAS), který je pouhým pracovním mirrorem (přírůstkovým), který v případě selhání není kritický. A tam bych využil hlavně tento disk :-)
Nevydrží a to ani v ideálních podmínkách.
Prvním problémem je degradace povrchu disku, zejména i disků s vysokou hustotou zápisu. K silnému opotřebení např.: 4TB disku stačí intenzivně prohánět hlavičku po malé ploše a povrch plotny začne degradovat. Životnosti neprospívá ani kolmý zápis (Perpendicular), který je mnohem náchylnější, než tradiční podélný (Longitudinal). Tedy moderní disky s vysokou hustotou zápisu nedosahují ani třetinové životnosti těch staletých pomalých pekáčů a když se do toho přidá neustálé přejíždění poměrně malé oblasti, povrch plotny degraduje v jednotkách měsíců. Druhým problém je mechanika, takových zakousnutých disků odmítající se roztočit už jsem pár viděl, není to nic výjimečného. Do třetice tu máme elektroniku, včetně takové drobnosti jako pájení a spoje v čipech. Asi jste nikdy neviděl zvětšení rentgenový snímek a co s ním provede čas. A jde to docela rychle.
P.S.: Můj Panasonic LF-D321JD (10/2001) vypálil mnoho DvD-RAM a média jsou stále čitelná, i když data na nich nejsou úplně aktuálně, ale stále čitelná. Mimochodem, stále funguje. Stejně tak média vypálená na dvourychlostní Mitsumi. S kvalitními médii a stejně kvalitní vypalovačkou, dosáhnete mnohonásobně vyšší spolehlivosti, něž u jakéhokoliv disku.
Upřímně, já si neumím představit, jak bych DVD archiv (o inkrementálních zálohách ani nemluvě) spravoval. V archivu mám cca 1 TB dat (z čehož navíc mnoho souborů je větších, než kapacita jedné vrstvy DVD a to občas i troj- či čtyřnásobně). To je dohromady cca 250 jednovrstvých DVD (dvouvrstvá bych z toho radši vynechal kvůli spolehlivosti).
To zní jako solidní peklo.
Ona ta NAND Flash část bude zejména u šindelových disků hrát především roli „CMR cache“ (vzpomínám si na Seagate Archive, ten měl ještě CMR cache na plotnách, novější disky kvůli tomu mívají právě flash paměti - co to kecám, měl - ještě má, dodnes mi jede v serveru, ve druhém je ale už dvojice 18TB Seagate Exos X18).
11. 5. 2022, 15:45 editováno autorem komentáře
Možná jsem moc paranoidní, ale ty kombinované SSD/HDD, kde SSD část hraje roli cache, mi nepřijdou jako moc dobrý nápad. Z hlediska rychlosti to bude fajn, ale když si představím, kolik dat přes tu relativně malou cache proteče, jinými slovy kolikrát budou paměťové buňky přepsány, nemám z toho dobrý pocit. To už mi dává větší smysl použít dedikované SSD jako cache pro HDD na úrovni OS.
Pokud tam je dostatečně kvalitní řadič, prostě se ta cache bude snižovat jak bude to SSD odcházet až z toho nakonec bude normální HDD bez SSD cache. Nezdá se mi to jako velký technický problém kromě toho, že to pochopitelně zvyšuje komplexitu a komplexní systémy se, jak známo, rozbíjí komplexně.
Druhou věcí je, že já osobně jsem nikdy pořádně neviděl žádný zásadní rozdíl. Naopak, jeden tenhle kombinovaný seagate byl spolehlivě nejhorší disk, co jsem kdy měl.
Problém je, že tahle SSD cache je by design nezbytnou podmínkou funkčnosti takového HDD. Nahradila část disku, která se používala jako cache, databázista (jako já) by asi řekl, že to je takový ekvivalent redo logu. Takže až to odejde, disk bude v lepším případě jen v read-only módu.
Ta cache tam není jen tak kvůli obyčejnému urychlení. Ona je tam proto, že jsou v ní dočasná data, než se rozhážou na správné místo na disku. A to správné místo na disku je v částech, které jsou organizovány do velkých bloků, např. 256 MB a podobně. Musí se v krajním případě celý 256 MB blok načíst, někde pozměnit a pak zase zapsat (a to dočasné místo pro pozměnění je právě ta cache). Musí to být fail-proof, že když v půlce zápisu vypadne proud, nesmí se přijít o žádná data (proto na to nejde použít velká DRAM cache). Dřív to dělal disk v té CMR cache (část disku s tradičním nešindelovým zápisem), protože ji ale nahradili tou SSD cache, tak se to prostě bez té SSD cache neobejde :).
Představte si to jako databázi. Ta musí být v nějakém konzistentním stavu. Máte třeba velkou transakci a uprostřed té transakce to zbřaskne. DB engine musí po nahození zajistit, že pokud ta transakce nebyla dokončená, musí být databáze konzistentní ke stavu před tou transakcí. Nesmí se zkrátka stát, že se to dostane do stavu někde uprostřed, kdy nějaká data UŽ nemám a jiná data JEŠTĚ nemám. Na tohle by šindelové disky trpěly strašně často, pokud by tam nebyla tahle cache, protože ta operace změny velkých bloků (SMR zón) může fakt zabrat nezanedbatelné množství času.
Tak takovej youtube bude vyuzivat hdd jeste hodne dlouhou dobu. To same facebook atd. Tam, kde je pozadovana vysoka kapacita za nejnizsi cenu budou hdd vzdy.
Existujou statistiky, kolik rocne lidstvo vyprodukuje dat. Pak vemte celkovou vyrobenou kapacitu ssd za rok a dostanete celkem prehled, na cem ta data lezi...
Chapu vyznam pro DC ale pro domaciho uzivatele aby zaplnil disk 20TB smysluplnych dat, to uz je velky problem. Chapu ze pokud se nekod treba zivi YT tvorbou tak muze mit desitky TB dat ( ale to uz radim spise do businessu ). Ja mam cca 30GB rodinych fotek + dejme tomu 10GB scanu dokumentu a dulezitych dokumentu. Primarne na NASce, ktera je okopirovana na offline a jeste mam backup v cloudu ( Google cloud storage, neplest s Google drive ). Takze me ten backup stoji smesnych 0.40$ mesicne.
Vidíte. A já mám zálohy v jednotkách terabajtů. A to jsem ještě dost skromný, když poslouchám kolegy. Taky hlavně (ale nejen) fotky, mimochodem. A to jsem všechno, jen ne profesionál. Cloud by mě stál (lineárně aproximováno) o dost méně směšných 40 USD měsíčně. Proto ho mám taky na dvou různých místech, pochopitelně na HDD, lokálně, nikoliv někde v cloudu. Ono je to jaksi dost individuální.