Vlákno názorů k článku NUMA pro Raspberry Pi 4 a 5 přináší vyšší výkon ve více vláknech od František Ryšánek - Jedna další věc, která může být lokální pro...

14. 11. 2024 17:36

František Ryšánek

Jedna další věc, která může být lokální pro nějakou podmnožinu celkového počtu jader i v rámci single-chip CPU, je cache, hlavně L1 a L2. Díky tomu mají některé dvojice jader navzájem rychlejší komunikaci (cache coherence protokolem) a jiné dvojice pomalejší. Nástroj na odkazu výše z toho skládá čtvercovou vztahovou matici.

NUMA mechanismus alokace RAM jistě nemá přímý vliv na využití cache (protože tato se nealokuje explicitně), ale... se zapnutou podporou NUMA by mohlo dojít například k úpravě schedulingu vláken na fyzická jádra CPU tak, aby vlákna téhož procesu běžela na "blízkých" fyzických jádrech... [/fabulace][/spekulace] pokud to náhodou takto nefunguje furt.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 11. 2024 23:22

bez prezdivky ...

Jen bych rek ze pri tom narazis na takovou drobnost, ze jedna vec je to, jak neco ten CPU prezentuje ven, a druha je, jak je to implementovano uvnitr, takze vysledek muze byt klidne i zcela opacny = bude to mnohem horsi.

Jinak s tim schedulingem si pichnul do intelich vicemalovelkojader ... ktery mimo jine kvuli tomu nefungujou. Respektive ten problem existuje pri jakymkoli vicejadre, ale kdyz se jejich latence rozchazi radove, tak to zacne byt prus.r.

Dále u nás najdete