Píšete, že lidi nezálohují svoje data - jaká je lepší možnost pro domácí podmínky, než diskové úložiště se zrcadlenými disky? Zálohovat to ještě na jeden další přenosný disk? Mám DVD-RAM, ale tam se vlezou jen ty nejdůležitější data. Páskové mechaniky jsou pro domácnosti nedostupné - vysoká cena, SCSI, ... Poraďte, rád se nechám poučit...
Disky jako médium vychází zdaleka nejlíp. Ale ono nejde ani tak o média, jako spíš o způsob práce s nimi - zrcadlení disků např. v tom Synology (nebo podobném zařízení) je fajn pro případ náhodné hardwarové poruchy, ale neřeší poruchy softwarové, tj. že vám třeba někdo ta zazálohovaná data zašifruje (nebo že vám poškodí originální soubory, které se pak v rámci synchronizace propíšou do zálohy). Určitě má smysl mít zálohovací zařízení dvě - jedno pro "živé" udržování aktuální zálohy, druhé kompletně odpojené a synchronizované jen jednou za čas ručně (např. jednou měsíčně - i kdyby došlo k nějakému napadení, tak za měsíc si toho snad všimnete a když všechny možnosti obnovy selžou, přijdete nejvýš o měsíc dat).
Pokud použijete paskvil jménem Synology Hybrid RAID (SHR), tak to nikde jinde dohromady nedáte. Např. u QNAPu není problém to vrazit kamkoliv.
QNAP je castecne otevreny a vyjma toho jejich klikafejsu dava ke svym modifikacim zdrojaky. I stare modely stare podporuje a pridava k nim nove funkcionality - asi spolecny strom na vyvoj.
Krom toho lze i na jejich armove krabice instalovat klasickeho debiana. Na qnap wiki je navod.
QNAP zatim pouziva MDcko takze sestaveni je otazkou prendani disku a vyhledani metadat md tooly. Synology SHR se dostava na uroven vendor specific pruserovosti stejne jako hw raid radice. Nepouzijes-li stejny radic nebo radu od toho vyrobce, tak jsi v haji.
Pokud to diskové úložiště se zrcadlenými disky chci používat pro zálohování, nemělo by být dostupné z internetu a mělo by se jen podle časového plánu automaticky zapnout, provést zálohování a zase se vypnout. Ale stejně je potřeba počítat s tím, že je to záloha pro případ smazání dat z PC nebo havárie disku v PC, ale neřeší to věci, které postihnou celou lokalitu (úder blesku a poškození elektroniky, povodeň, vykradení…).
Zrcadlení disků brání data pouze před poruchou disku. Mezi jiné hrozby může patřit například:
- Napadení malwarem.
- Mají k počítači přístup děti?
- Havárie v prostorách, kde jsou data fyzicky uložená.
- EMP.
- Zničíte si data sami například pod vlivem nějaké psychózy, o které ještě nevíte.
Jste ochotni risknout, že o data přijdete třeba při požáru nebo po výbuchu atomové bomby? Pak vám asi stačí pár externích disků v šuplíku.
Záleží zkrátka na vašem rozhodnutí, proti kterým hrozbám chcete svá data bránit a proti kterým ne.
SCSI neni dnes na doma problem. Ale ta mechanika je hodne draha. Kdysi jsem na doma pouzival DATky nez ty kapacity zacli byt smesne.
Delal jsem si kalkulaci jestli se mi vyplati poridit nejake online uloziste. Ani nahodou. Pri objemu 1-1,5TB nenahraditelnych dat (coz jsou hlavne fotky) je to tak 300-500kc za mesic. Pri cene externiho disku se mi to vrati za 10 mesicu. Pripojim,syncuju,verifikuju a rano vezmu do brasny do prace. I v pripade silneho prepeti a odejiti elektroniky vsech disku v prubehu synchronizace je mozne data na hdd obnovit pres recovery firmu s dobrou sanci na zachranu. Stale levnejsi nez online uloziste.
Nehlede na to ze ho muzu tahat s sebou a mam treba sifrovani pod kontrolou. Datovy tok co rozhrani dovolu. Naproti tomu nez prenesu pres 5-7Mbit po siti nekam do tramtarie tak to chvilku trva.
Dovolim si trosku nesuhlasit. Matematika sice sedi, ale velmi zalezi, co porovnavas. Napriklad aky spolahlivy je jeden disk? Pre porovnanie Amazon Glacier by mal mat 99.999999999%/rok spolahlivost. Takisto jeden disk uz z definicie nemoze mat data rozlozene na viacerych lokalitach.
Povedzme, ze sa bavime nie o jednom, ale troch diskoch aby sme si polepsili co sa tyka spolahlivosti. Okrem extra logistickych problemov (kam dame disky ak ma byt kazdy inde?) sa nam navysuje aj cena a zrazu je to 30 mesiacov aby sa nam zaplatil HW. (ratam cisto iba disky) Zivotnost tych diskov uz zrazu zacina byt faktor, lebo v takom casovom horizonte uz zacina byt realne ze potrebujes nahradit pokazene disky. (cize sa z toho pomaly stava pausalny poplatok) Nehovoriac o cene prace ktoru s tym mame.
Tiez to porovnanie nie je uplne fer aj opacnym smerom. Napr. spominany Amazon Glacier si uctuje poplatok za obnovu dat (platis za data ktore z toho storage tahas nad nejaky limit /5% mesacne/) Cize v pripade realnej nutnosti obnovy kompletnych dat platis extra. Cize treba zvazit aj to.
Ale samozrejme velmi zalezi, co chces. Ak je jeden disk "good enough" tak tvoja matematika sedi a uplne suhlasim.
Zivotnost disku se vam zkracuje hlavne jeho pouzivanim. Pokud ten disk pouzivate na zalohy a pak ho odpojite, tak pravdepodobne neodejde drive, nez ho nahradite za vetsi z duvodu nedostacujici kapacity a moralni zastaralosti. Pravdepodobne tak i jen s jednim externim diskem budete mit dostatecnou zalohu, protoze pravdepodobnost soucasneho odchodu do vecnych lovist disku v PC a disku se zalohou je dost mala. Samozrejme, obcas se vyskytne situace, kdy ani tri zalohy nestaci.
Momentalne jsme v dobe kdy se jedna zrejmne o anomalii, nicmene me 2TB disky ktere jsem poridi pred vice nez dvema lety se lisi od tech dnesnich cenove maximalne o 300kc. A to se fakt novy vyplati;) Hehe;)
Virtualni potopa tovaren stale trva. A vzrustajici cena dolaru tomu nepomuze.
Anomalie jsou i v zivotnostech disku. Kancelarsky kepl ktery bezi ve freeneti siti od roku 2004 nepretrzite s puvodnim diskem WDC AC36400L, jez ma snad 6GB nebo kolik. Na disk se pisou statistiky a logy. Ale je fakt ze je na nekolikanasobne jistenem okruhu, za ups a v cistem prostredi bez hulicu. Zadne vibrace. Ale taky zadna klima a teploty cvici v rozmezi 10-30 stupnu.
Zapomnel jsem dodat, ze zalohuji na treti disk po souborech data z domaciho raidz na zfs. Jedna se o snapshoty zmenenych souboru(nikoli tedy zfs snapshoty), pricemz jednou za x syncu je full kopie filesystemu. Na disku je hloupy ext4(pravidlo jineho fs pro zalohu+pravidlo zalohy po souborech), nebot kdo nekdy delal vic se zfs tak ze se muze take nechutne podelat.
Pro me domaci pouziti staci zalohovaci schema ktere jsem zde jiz uvedl. Veskere ostatni zalezitosti ktere jsem pocital jsou zatim drahe,neflexibilni a nekontrolovatelne. Pokud se objevi neco online vyhodnejsiho tak nemam problem.
Uvedena spolehlivost je vhodna pro specificka podnikova prostredi. Ve firme treba zadne takove veci nemame a storage systemy jsou vlastni z technickych, administrativnich,pravnich(prolinani nekolika jurisdikci, obchodni tajemstvi atd.) duvodu.
Nevadilo by mi mit nizsi spolehlivost a nevadilo by mi mit take pomalou dostupnost dat. Tj. zadam request na recovery a pozadavek bude odbavovan treba az za 5 hodin. To vetsine lidi staci.
používám kombinaci:
Mám 4 diskový DS410, RAID 5
Na fotky používám Flickr v privátním režimu - 1TB místa na fotky mi stačí.
A nemám tam žádné kompromitující fotky - pokud by nedej bože u Yahoo někdo nějakým způsobem získal data, tak mě v podstatě nemá na co vydírat a ani nebudu pro takového útočníka zajímavý.
Prostě to beru jako zálohu - mám na Synology puštěný script, kdy každý měsíc udělá Synchro s Flickrem včetně vytvoření příslušných alb podle složek. Do měsíce bych případné napadení zjistil, v případě havárie přijdu o měsíc fotek, ale většinou z foťáku a telefonu mažu obrázky starší než 30 dní, takže bych +- měl vše.
Ostatní důležitá data, kterých je relativně málo (tím myslím 100 GB cca) mám na synology a používám Cloudstation. Vím, že to nevypadá jako záloha, ale v podstatě k případům, kdy mám zapnutá všechna synchronizovaná zařízení (6 zařízení) najednou dochází tak 1x měsíčně. Věřím, že bych byl schopen problém identifikovat, zdravé zařízení odpojit od sychronizace a obnovit data.
Zbytek do 10 TB jsou postradatelná data - mrzela by mě, ale spíš z hlediska času, vynaloženého na jejich shromáždění.
Určitě - používám toto:
https://github.com/trickortweak/flickr-uploader
v INi je kompletní nastavení, je k tomu potřeba Python.
Dále je potřeba na Flickru získat token - dělal jsem to ještě na starší verzi, kde byl problém s právy lokální složky (nechtělo mi to token uložit) a otevřením web odkazu v konzoli.Pokud si dobře pamatuji, vyřešil sjem puštěním scriptu na stolním pc, získáním tokenu, zkopírováním na Synology do photo složky a puštěním scriptu na Synology.
Oba soubory se dají do hlavního adresáře s fotkami (u mě systémový photo adresář) a pustí - napoprvé ideálně v konzoli. Jakmile to proběhne ok, nic nebrání nastavení do plánovače.
Poznámka, že se nezálohuje, smiřuje na ty případy, kdy jsou data pouze v síťovém úložišti (a nikde jinde).
Jestliže síťové úložiště používáte pro zálohy, tak tento problém nemusí být fatální. Sice přijdete o zálohy, ale pořád máte originály, ze kterých vyrobíte novou zálohu. Samozřejmě to je obecná teorie. Jsou případy, kdy neplatí, kdy mohou nastat problémy.
Jak zálohuji já? Předně v každém počítači mám RAID 1 (notebooky) nebo RAID 5 (desktopy). Zálohuji několika způsoby dle různých potřeb: od nonstop synchronizace po řetězené obrazy disků. Data se zálohují na jeden NAS server, kde běží RAID 6. Ten se v pravidelných intervalech synchronizuje s dalším NAS serverem, kde rovněž běží RAID 6. Navíc data se šifrují a pak míří na Google Drive. Nejcennější data pak ještě archivuji na M-Disc nosiče.
V rámci Synology máte možnost zálohovat data přes internet.
Chápu, že na nějakém pomalém uploadu je to problematické, ale pokud máte "rozumný" upload, tak Synology sama o sobě nabízí nějaké možnosti (např. ukládání dat na Amazon, ElephanDrive, HiDrive, Glacier a další), dále zde jsou různé balíčky třetích (např. Crashplan)...
A máte to i mimo jinou fyzickou lokalitu, kdyby nedej náhodou došlo k nějakému jinému neštěstí...
Upload by ani nebyl problem. Clovek si holt pocka. A kdyz si udela sekvenci jobu od nejdulezitejsich dat po mene dulezita, tak snizuje riziko. Nejvetsi problem je ted cena vs dalsi normalni fyzicky disk. Jinak se sluzbou jako takovou bych problem nemel.
Jmenovane alternativy jsou prilis drahe proti prenosnemu disku. Navic je to zarizeni ktere mohu bez problemu velkou rychlosti synchronizovat i v opacnem smeru a nejsem omezen konektivitou.
Nez by mi kolega poslal 2giga po adsl tak jsem u nej drive na kole a zpatky s diskem a jeste udelam neco pro sve telo.
V domácích podmínkách to řeším takto:
1. Všechna data držím na disku prac. stroje.
2. Všechna data zálohuji na domácí NAS (tak 1 týdně, zvykl jsem si NAS vypínat).
3. Čas od času (měsíc) dělám kopii důležitých dat (neobnovitelných) z NAS na USB disk. USB disk se snažím držet v jiné lokaci, než NAS (v práci v šuplíku apod.)
4. Opravdu kritická data (cca 1GB) ukládám do cloudu popř. na flash/mobil.
Vše samozřejmě šifrované, takže v případě krádeže z toho nikdo nic nebude mít (doufám).
Času to nepožere mnoho a když člověk poleví, objeví se na rootu vždy nějaký motivační článek...