Tak ve mě zatrnulo, nahodil jsem exterák a čtu v manažeru disků to typové označení znak po znaku. ST3000DM001 Sedí, do puntíku. Vybrat tenhle disk pro zálohy byla fakt špatná volba.
Po chvíli hledání nového disku na CZC zjišťuji, že mají krásnou statistiku poruchovosti. U každého výrobku je procento vrácených kusů. Fascinuje mě, že Seagate Barracuda 3TB má poruchovost 6.1% a konkurenční WD Blue 3TB jen 1.4 %. Skvěle to koreluje s poměrem procenty v článku i když jde o jinou řadu disků.
Závěr je jasný.
Tak jako externí občas připojený disk je to ještě nejmenší zlo, i když na kritická data bych to teda určitě nepoužil. Jedním z hlavních problémů té sračky je to, že se ten disk uparkuje díky genitálním "zeleným" featurám k smrti. Schválně koukni do SMARTu na load cycle count.
:-X
ty se taky uparkujes ;)
for disk in /dev/sd[a,b,c,d,e]; do smartctl -x $disk | grep -e Model: -e On_Hours -e Cycle_Count ; done
Device Model: ST2000DM001-1CH164
9 Power_On_Hours -O--CK 081 081 000 - 16953
12 Power_Cycle_Count -O--CK 100 100 020 - 110
193 Load_Cycle_Count -O--CK 100 100 000 - 161
Device Model: ST2000DM001-1CH164
9 Power_On_Hours -O--CK 081 081 000 - 16953
12 Power_Cycle_Count -O--CK 100 100 020 - 112
193 Load_Cycle_Count -O--CK 100 100 000 - 179
Device Model: ST2000DM001-1CH164
9 Power_On_Hours -O--CK 081 081 000 - 16955
12 Power_Cycle_Count -O--CK 100 100 020 - 110
193 Load_Cycle_Count -O--CK 100 100 000 - 166
Device Model: ST2000DM001-1CH164
9 Power_On_Hours -O--CK 081 081 000 - 16955
12 Power_Cycle_Count -O--CK 100 100 020 - 110
193 Load_Cycle_Count -O--CK 100 100 000 - 160
Device Model: ST2000DM001-1CH164
9 Power_On_Hours -O--CK 081 081 000 - 16955
12 Power_Cycle_Count -O--CK 100 100 020 - 112
193 Load_Cycle_Count -O--CK 100 100 000 - 178
Pro zajimavost, jeden prumernej stroj 24/7:
Device Model: WDC WD20EZRX-00DC0B0
9 Power_On_Hours -O--CK 072 072 000 - 21165
12 Power_Cycle_Count -O--CK 100 100 000 - 63
193 Load_Cycle_Count -O--CK 181 181 000 - 57278
Device Model: WDC WD2000F9YZ-09N20L0
9 Power_On_Hours -O--CK 087 087 000 - 9865
12 Power_Cycle_Count -O--CK 100 100 000 - 18
193 Load_Cycle_Count -O--CK 200 200 000 - 2
Device Model: ST2000DL003-9VT166
9 Power_On_Hours -O--CK 064 064 000 - 31613
12 Power_Cycle_Count -O--CK 100 100 020 - 55
193 Load_Cycle_Count -O--CK 100 100 000 - 55
Device Model: SAMSUNG HD204UI
9 Power_On_Hours -O--CK 100 100 000 - 39886
12 Power_Cycle_Count -O--CK 100 100 000 - 96
225 Load_Cycle_Count -O--CK 100 100 000 - 96
Device Model: SAMSUNG HD204UI
9 Power_On_Hours -O--CK 100 100 000 - 31613
12 Power_Cycle_Count -O--CK 100 100 000 - 77
225 Load_Cycle_Count -O--CK 100 100 000 - 77
Device Model: WDC WD20EURS-63S48Y0
9 Power_On_Hours -O--CK 070 070 000 - 22402
12 Power_Cycle_Count -O--CK 100 100 000 - 67
193 Load_Cycle_Count -O--CK 200 200 000 - 9
Device Model: ST2000VX003-1HH164
9 Power_On_Hours -O--CK 095 095 000 - 5216
12 Power_Cycle_Count -O--CK 100 100 020 - 5
193 Load_Cycle_Count -O--CK 100 100 000 - 18
Device Model: WDC WD20EURS-63S48Y0
9 Power_On_Hours -O--CK 065 065 000 - 26025
12 Power_Cycle_Count -O--CK 100 100 000 - 72
193 Load_Cycle_Count -O--CK 200 200 000 - 12
Device Model: ST380815AS
9 Power_On_Hours -O--CK 042 042 000 - 51537
12 Power_Cycle_Count -O--CK 100 100 020 - 152
Device Model: WDC WD1600AAJS-00PSA0
9 Power_On_Hours -O--CK 032 032 000 - 50316
12 Power_Cycle_Count -O--CK 100 100 000 - 594
193 Load_Cycle_Count -O--CK 200 200 000 - 621
Device Model: WDC WD20EARX-00PASB0
9 Power_On_Hours -O--CK 058 058 000 - 31280
12 Power_Cycle_Count -O--CK 100 100 000 - 79
193 Load_Cycle_Count -O--CK 186 186 000 - 43930
Kupuju do podobnych veci smejdy, jak uz nekdo poznamenal, rozdil oproti "server" grade je zanedbatelny. Vyplati se jen 3/5 zaruka, hodne casto odchazi po 2.5 letech. V prumeru 1 disk/rok na stroj s 10ti diskama. Tak 80% v zaruce. Pokud to neprosvihnu ja, neb vsude je RAID6... Tak je casu dost :)
Obecne pada na drzku vsechno, ale nejvic, jednoznacne, seagate (i historicky). A to nekolikrat presne po zaruce (nekolik mesicu)... zrejmne if (power_hours_to_failure-- && bezim_porad) naser_uzivatele(); To nemuze byt nahoda...
Jinak evidentne Load_Cycle_Count muze znamenat 'cokoliv' mezi vyrobcema a i firmwarem (radou).
R.
Samozreme, jak to neni levne, nebo to neni z popelnice, tak je to podle CZ/SKuplne na nic. Treba vase LLC ... to je taky kriterium, jako remen.
WD Red 120 - 180TB/rok 1/10^14 (to znamena 1chyba na kazdych 10TB ...pro r6 chutovka)
WD Re4 550TB/rok 1/10^16
Seagate Savvio unlimited 1/10^16
Workload se pocita jako soucet cteni a zapisu (od toho tam EEPROM pro zaznam je). Mozna to pole mate jen proto, abyste mel pole.
LLC? asi myslis LCC... nicmene pokud by jsi cetl driv nez reagoval, tak vistopujes reakci k "Schválně koukni do SMARTu na load cycle count." od Lol... ja se podival a pridal k tomu aby to melo nejakou vypovidaci hodnotu pocet hodin a zapnuti, tedy neresil se zadny workload, ale pocet "locad cycle count" na kterej chtel Lol at se podivame ;)
Ono je treba hodnotam trochu rozumet vis?
Pokud jde o ECC chybovost tak ta je zcela normalni. Pro mlecny vocasy ktery uz si ani nepamatuji 3,5 diskety je cokoliv o chybuje spatne. Ale cteni z hdd je jako hledani kvantove zmagnetizovane jehly v kupce sena. Cili k chybam dochazi _VZDY_ a protoze se toho cte mraky tak tech chyb je taky dost. Vzhledem k rozdilym implementacim a interpretacim chybovosti se ta cisla znacne lisi i ve stejne serii disku, behem provozu a zalezi i na jake fyzicke pozici. Takze nic neres, nemudruj a neprepinej protoze to nevyrabis. Tato cisla se maximalne hodi pokud mas nejakou referenci,statistiku a kalibrujes hlavy pro zachranu dat.
Vždy si vzpomenu na zákazníka, který chtěl reklamovat DIMM modul protože mu memtest ukazoval rostoucí počet "výpadků cache". Nenechal si vysvětlit, co to to "cache miss rate" je a že to vůbec nesouvisí s tím DIMM modulem. Dostal zpátky peníze. Hlavně proto, že nás dost pobavil.
Má to smysl komentovat? To, že si někdo pod Linuxem vypne ono zelené zvěrstvo přes hdparm, má jaksi nulovou výpovědní hodnotu ohledně těch 99,99999% uživatelů, kterým se ten disk pod Windows "ekologicky" vypíná každou minutu, když usoudí, že nic nedělají.
Jinak:
http://knowledge.seagate.com/articles/en_US/FAQ/223651en
https://www.google.com/?gws_rd=ssl#q=seagate+chirp
A poslední poznámku k téhle ksindl company:
http://knowledge.seagate.com/articles/en_US/FAQ/203971en?language=en_US
Seagate uses the SeaTools diagnostic software to test the SMART status of the drive. SeaTools does not analyze attributes or thresholds. As a practical matter, the technology supporting SMART is constantly being improved. Each new design incorporates improvements that increase the accuracy of the SMART prediction. As a matter of policy, Seagate does not publish attributes and thresholds.
Therefore, if you wish to test the drive for physical integrity, please use our SeaTools diagnostic software.
The SMART values that might be read out by third-party SMART software are not based on how the values may be used within the Seagate hard drives. Seagate does not provide support for software programs that claim to read individual SMART attributes and thresholds. There may be some historical correctness on older drives, but new drives, no doubt, will have incorporated newer solutions, attributes and thresholds.
"Překvapivě" tam, kde jakákoliv jiná diagnostika hlásí fatální chyby, novější verze SeaTools nenacházejí žádný problém. Zobrazit SMART hodnoty v tomto "diagnostickém" nástroji je také nemožné. A skutečně "překvapivě", otestování toho samého disku o pár let starší verzí SeaTools ty chyby najde.
No, já myslím, že si každý člověk s mozkem udělá závěr sám. Tenhle ksindl fakt nemám zapotřebí podporovat.
Popsal bych to jinak - oni upravili tu svoji diagnostickou utilitu, aby ty profláknuté problémy taky ignorovala (tedy ve smyslu, že ony Seagatem neuznávané hraniční "threshold" hodnoty SMARTu prostě nepovažuje za směrodatné a ty nové verze SeaTools jako vadný označí v podstatě pouze disk, který je téměř mrtvý), a současně prohlásili, že údaje z jakéhokoliv jiného nástroje je nezajímají. Jelikož jsme tady těch zmetků v různých fázích umírání měli plný šuplík, nebyl pochopitelně problém je projet mnoho verzemi SeaTools, výsledky jsem už popsal - čím novější verze diagnostiky, tím méně disků označila za vadné. Přitom při běžném použití v počítači ten disk samozřejmě způsoboval značné problémy viditelné pochopitelně i přes dmesg atd.
Oni prostě vědomě a naprosto úmyslně skrývají vady té zmetkové, špatně navržené řady disků, protože se na ně ty šmejdy v reklamacích valily zpátky po milionech. A spoléhají na to, že než ten disk zdechne úplně, tak už bude po záruce. Navíc i po tom, co měli jasné informace i od výrobců třeba těch NASů, že ty disky jsou pro dané použití naprosto nevhodné, nadále na webu valily do uživatelů tvrzení o tom, že jsou naopak velmi vhodné.
Ono u nás to samozřejmě není tak zcela relevantní, protože reklamace se uplatňují u prodejce, nikoliv u výrobce. Ale v zemích, kde se reklamuje přes RMA formuláře výrobce a kde bez RMA kódu prostě nic nevyreklamuješ, to pak končí těma class suit action. Stejně dopadlo IBM s jejich DeathStar. A ani pro Seagate tohle není první žaloba tohoto typu.
a ma cenu komentovat tebe? nevim, zkusim to ;)
- pres hdparm sem nic nevypinal
- seatools nepouzivam
co mam videt na download fw?
http://knowledge.seagate.com/articles/en_US/FAQ/223651en
kdyz kouknu na tvuj odkaz:
https://www.google.com/?gws_rd=ssl#q=seagate+chirp
vidim 23000 vysledku, pro zajimavost zadam
https://www.google.cz/search?q=wd+OR+%22western+digital%22+chirp
a vidim 117000 vysledku, tedy 5x vice problemu u WD...
btw: osobne mam par SSHD Laptop 1TB, ted sem kupoval dalsi a provadel u nej upgrade FW, stahl sem si archiv, rozbalil, precetl readme, spustil pribalenej linux nastroj z nabehleho systemu z toho HDD a behem nekolik vterin bylo hotovo, readme se zminuje o tom ze z nabehlejch windows neni mozne provadet upgrade primo a je potreba boot z iso, ktere obsahuje live linux a ten linuxovej nastroj...
tak nevim ale tohle je mi opravdu HODNE sympaticky pristup, jak je na tom WD ? ;)
42 stupnu neni nikterak vysoka teplota. I 50 stupnu u disku muze byt porad ok. Jak dokazuji stare statistiky google, tak teplota neni jeden z faktoru ktera by se podepisovala na poruchovosti.
http://static.googleusercontent.com/media/research.google.com/en//archive/disk_failures.pdf