Vlákno názorů k článku Buďte S.M.A.R.T. a hlídejte si disky od Palo M. - Este by som dodal mojich par skusenosti: 1. Ked...

  • Článek je starý, nové názory již nelze přidávat.
  • 28. 6. 2013 5:58

    Palo M. (neregistrovaný)

    Este by som dodal mojich par skusenosti:
    1. Ked sa disk "zacina lucit", tak zrazu zacne prudko stupat hodnota "Reallocated Sector Count". A niekedy aj "Current Pending Sector". Pri starsich diskoch (80-320G) sa mi stalo, ze sa par sektorov relokovalo, potom to prestalo a disk funguje dalej. Pri novsich diskoch (1T+) mam skor tu skusenost, ze ked to zacne, uz sa to len zhorsuje a treba urychlene kupit novy disk.
    2. Isty cas mali WD disky od vyroby zle nakalibrovany senzor teploty (alebo bol zle umiestneny) a hlasili prilis vysoke teploty (disk bol na dotyk uplne studeny, ale SMART hlasil teplotu 65 stupnov Celzia). Jeden taky som kupil, hned som ho reklamoval. Dostal som druhy, kde bol uplne ten isty problem (az potom som si precital na nete, ze je taka cela seria). Ten disk dodnes slape (cely komp som ale medzicasom posunul, takze neviem do detailov v akom stave je ten disk).
    3. Po kupe noveho disku, este predtym nez na disk dam nejake data, vzdy najprv pozriem SMART, potom zbehnem badblocks -svw a potom opat skontrolujem SMART. Uz som tak reklamoval dva uplne nove disky. Pred badblocks ziadne realokovane sektory, po badblocks vela, plny log SMART chyb a odvtedy kazdy long test skoncil chybou. Inak sa disk tvaril ako funkcny, bez SMARTu by som asi nemal sancu zistit, ze mu nieco je.
    Sice badblocks pri vacsom ako 1T disku trva viac nez 24 hodin, ale stoji mi to za to. Az tak vela som tych diskov nekupoval a to, ze 2 boli zle uz od vyroby, sa mi zda prilis vysoke cislo...

  • 29. 6. 2013 0:21

    Trident (neregistrovaný)

    1. To sedi s mym pozorovanim. Jde videt ze narozdil od "analytickych vocasu" jsi prakticky a vnimavy clovek.
    V teto souvislosti jsem i zjistil ze nezalezi na tom jestli to jsou starsi lowendove disky nebo hiend. Troufam si odhadnout ze to souvisi se zmenou technologie hlav a zaznamu.

    3. Badblocks je k nicemu. To bylo tak dobry na velmi stary disky s hloupym fw co neumel realokovat (v radu MB) nebo diskety.

    Na soucasnych lowend discich zalezi hodne na tom jestli zpetne vraci zjistene chyby elektronika disku (resp. firmware) do ATA/SCSI commandu nebo ne. Mam zkusenost ze disky dnes delaji mrtveho brouka (nereportuji v ATA/SCSI chyby) i kdyz na pozadi realokuji jako blazen. V pripade nemozne realokace uz pak jen smutne sleduji timeouty.
    Na poruchy se prijde az z smart counteru nebo u novejsich disku z logu. Dalsi veci je ze muze ukazovat false positive chyby pokud je problem v kabelazi nebo s radicem i kdyz je disk samotny v poradku. Na tyto poruchy pomaha prohlednout si log neuspesnych prikazu z disku a counter chyb na rozhrani.

    Takze badblocks ve smyslu zjisteni spatnych bloku zbytecny. Nicmene jeho vedlejsim efektem je ze procvici cele plotny na zaznam/cteni. Coz odhali chyby na ktere by se pak prislo az pozdeji pri provozu.

    Cele plotny by mel analyzovat i long test, ale vzhledem k tomu ze krom vyrobce nevime co dela pri testech firmware disku na pozadi a kazdy fw je jeste jiny, tak verim jen provedenemu celemu zapisu/cteni/random seeku na vyssich urovnich (ATA/SCSI prikazy).

    Misto badblocks je lepsi parkrat na disk nadojit ddckem /dev/zero a /dev/urandom po vetsich blocich. Pak udelat par cyklu s ddckem na random seek/write. Random seek/write delaji i samotne smart testy ale jak rikam. Clovek muze pouze verit ze neco takoveho delaji protoze je to blackbox.
    Vyhoda je ze tato metoda funguje na unixovych systemech kde zadny badblocks nemam.

  • 29. 6. 2013 3:34

    CHe (neregistrovaný)

    1. predrečník jasne napísal, že používa kombináciu badblocks+porov­nanie SMART counterov pred/po

    2. disk môže realokovať až pri zápise. Pri čítaní, ak ani po interných retry cykloch nesedí CRC sektora, môže akurát tak vrátiť chybu (a označiť si sektor ako "pending"). Badblocks sa dá celkom úspešne použiť na dump zoznamu LBA sektorov, kde disk vrátil nejakú chybu. Následne sa dá napr. skúsiť prepísať ich pôvodným obsahom (resp. teda tým, čo z neho zostalo), na spôsob takéhoto RW refreshu:

    dd if=/dev/sdX of=/dev/sdX bs=512 iflag=direct oflag=direct conv=noerror seek=LBA skip=LBA count=C

    Zápis na ten "pending" sektor sa vtedy buď podarí (a vyradí ho z pending listu), alebo nepodarí a realokuje ho.

    Prípadne sa ten RW refresh dá preventívne spustiť na celý disk (ak je záloha, tak kľudne aj s rádovo väčším bs - tak, aby napr. trebárs sekundu bez seekovania lineárne čítal a následne seekol späť a obsah zapísal). Samozrejme vtedy bez seek/skip/count parametrov.

  • 29. 6. 2013 11:02

    Neználek (neregistrovaný)

    To "vracení zjištěných chyb"...

    V EventLogu System (Windows) mám tři zdroje událostí - Disk, DiskDiagnostic, Windows Disk Diagnostic.

    Během posledních let byl zdrojem událostí pouze Disk.
    Kromě varování při chybách stránkování a hlášení chyb řadičů, vše na výměnných discích, ukazuje pro stabilní disk jen tyto události (nekritická chyba, dva výskyty hned po sobě):

    Zařízení \Device\Harddis­k1\DR1 má chybný blok.
    Zařízení \Device\Harddis­k1\DR1 má chybný blok.

    To je informace z HDD, nebo si ji zjistil systém při čtení? Pokud si to zjistil systém sám, tak ty dva výskyty po sobě, to je opakování pokusu, nebo detekce dvou vadných bloků (celkově má HDD realokované čtyři sektory, ve FAT nejsou žádné sektory označené jako uzamčené)?
    Pokud vadné sektory zjistil systém, komunikuje pak nějak s HDD a oznámí mu chyby?

    Děkuji za případnou osvětu.

  • 29. 6. 2013 18:21

    Jirka1 (neregistrovaný)

    Tahle hláška se vyskytne až při přístupu na vadný blok. Disk samotný nic iniciativně neposílá, to by se vám taková hláška musela objevit kdykoliv při připojení "načlého" disku. Nemám tu hlášku před sebou, ale pokud tam není adresa bloku, tak z ní nepoznáte, jestli to byly 2 vadné bloky, nebo se snažil 2 x zapsat do stejné oblasti. Ve smartu HDD by se to mělo objevit jako pending sektor, dokud se mu to nepovede realokovat. Není potřeba, aby o tom systém pak komunikoval s HDD - HDD to ví jako první, on tu chybu při čtení zjistí a posílá ji systému. Zároveň si ji zapíše.

  • 29. 6. 2013 15:02

    Orosený (neregistrovaný)

    Jaké by měly být běžné pracovní teploty notebookových HDD (2,5 palcových)? Běžně se uvažuje s teplotou 42°C jako varování, 52°C jako kritická.

    Můj HDD dosáhne teploty 42°C asi po hodině práce notebooku. Pak kolem ní kolísá, ale pod těch 42°C klesá teplota jen při "spoření" (uživatel není neustále aktivní), nebo při mnohahodinovém (spíše více denním) zapnutí kdy vše důležité je již v paměti a disk se používá spíše nárazově.
    Při velkém zatížení disku se ale stane, že teplota může být třeba i několik hodin 43-45°C. Přesto je notebook v místě HDD chladnější než mnoho jiných notebooků, které jsem měl v ruce.

    U mne jde o disk Toshiba (SATA 3Gb/s), který je vybaven zvukovou signalizací. Dodnes nevím přesně čeho (web Toshiby nikdy nebyl sdílný, dnes tam nejsou ani tyto informace).
    Mělo by jít o překročení kritické teploty (která ale nevím kolik je stupňů). Signalizace se ozvala za životnost disku 3x (pokud vím) a i když bylo opravdu horko a disk jel naplno, nezdá se mi že by byla překročena teplota 52°C. Realokovány jsou celkem 4 sektory.

    Náhradní disk, který mám připravený a už se chystám na generační výměnu uváděl (informace opět na webu Toshiby již nejsou dostupné) pracovní teplotu 5-55°C. To je předpokládám teplota na senzoru uvnitř disku.
    Chápu správně, že to znamená že při teplotě 55°C na plotnách ještě nejsou data v ohrožení? Zvukovou signalizaci by měl mít, ale opět nevím jak nastavenou a čeho všeho se má týkat. V úvahu připadá ještě G-senzor a prakování hlaviček - což by měly dnešní disky dělat do 2 ms, ale to je vše co o tom vím. Jaký je rozdíl mezi 300 G a 400 G netuším.

    Jak topí vaše disky?

  • 29. 6. 2013 20:21

    Orosený (neregistrovaný)

    Antivirový scan (který disk celkem zatěžuje) dokáže zmíněnou stabilní teplotu 42°C s přehledem zvednout až na 47°C.

    Věřím, že u kompletních skenů, které trvají mnoho hodin a procesor i disk jedou prakticky naplno bych počítal i s o 1-2 stupně vyšší teplotou. Ale momentálně takový test nemohu provést.

  • 12. 7. 2013 20:00

    Orosený (neregistrovaný)

    Tak teploty 52°C u starého HDD už bylo dosaženo a zvuková signalizace se neozývá. Snad se tedy ten kravál aktivuje až při zmíněných 55°C.

    Kromě teploty zaznamenává S.M.A.R.T. i hodnotu 220/DC - Disk Shift. Je stále stejná a ani při práci za uvedených teplotních podmínek RAW hodnota nevzrostla.