Člověk se furt něco nového učí, viz článek z roku 2008:
"Už při čtyřech současně běžících procesorech se ukazuje, že propojovací struktura se stává úzkým hrdlem této architektury, protože i přes mnohdy velikou kapacitu pamětí cache nastávají kolize při přístupu do hlavní paměti, kdy na sebe jednotlivé procesory musí čekat (blíže viz Amdahlův zákon)."
Jo, Amdahlův zákon. Ale jak jinak nabereš výkon když 100GHz+ 1 CPU nejde vyrobit a mělo by v podstatě ty samé potíže s cache, jen na méně vláken tak by reálný dopad byl možná ještě větší. Když máš mnoho nezávislých procesů na mnoha jádrech a odpovídající hardwarový návrh architektury aby je prostě stačila nakrmit tak se tě to netýká. Ne náhodou AMD dodalo svým serverovým 4CPU slepencům v jednom modulu 8kanálový řadič pamětí s propustností 170GB/s a spoustu vzájemně propojené cache. Power9 s jeho 10MB cache na jádro to sice není ale přesto oproti předchozí generaci dosahuje 1 HT vlákno větší výkon jako dřív celé Opteronové fyzické jádro.
Jasně že CML z toho asi nebude ale právě tento typ CPU rozhýbal stojaté vody po letech stagnace a zbavil nás předražených CPU, které si na Amdahlův zákon od roku 2008 patrně dávaly hodně pozor tak víc jak 4 vlákna masám raději moc neposkytovaly...