Bych se skoro i hádal, protože těch různých vláken o reportování ECC chyb je i z dřívějška hodně. Nicméně se to může týkat DDR5 "frikulínská - On-Die - taky jako ECC" na šajzemodulech do počítačů, které mají ECC jen na úrovni čipu, ale nechrání data na sběrnici, takže tam si chyby vesele mohou blbnout ...a hromada nemá ani to... nebo těžko říct. Taky jsem nic moc super nevygooglovoal.
On-Die ECC je lepší než nic, jistě, ale dal bych přednost ochraně dat po celou dobu přenosu, včetně problémů co se objeví na sběrnici.
8. 1. 2024, 15:52 editováno autorem komentáře
No ale nefungovalo to, alespoň ne v memtest86+. V memtest86 ano (má i free verzi, ale není open source).
Viz:
https://github.com/memtest86plus/memtest86plus/discussions/92
Ono to je pořád nejasné.
Jednak, není memtest jako memtest (Grrr) a dále, ECC chyba může vzniknout na úrovni modulu a opraví se na úrovni registru. Tj. i občas vadný modul se pak jeví jako OK, protože ty chyby neprobublají ven. No a pak může chyba vzniknout na úrovni přenosu po sběrnici, nebo to je chyba, kterou interní mechanismy už nedokáží opravit a tak probublá i přes to ECC. Já si "myslím" (myslet = hooo vědět), že minimálně některé chyby ten memtest dokáže označit jako chyby ECC. Každopádně by bylo milé, kdyby to detekovalo chyby až už vzniknou kdekoliv.
Trochu normalni HW ti chyby ECC indikuje (z tech modulu) a memtest na to nepotrebujes. Normalne najdes v logu ze byla detekovana opravitelna chyba. Ta informace je totiz pomerne zasadni, protoze ti typicky zacne chybovat konkretni modul, tak abys vedel, ktery vymenit.
Samozrejme existuji desky, ktery chyby ECC fejkujou, pri nejakym obsazeni modulama. Pamatuju trebas R900 od dellu, kdyz to melo plny sloty ramek.