Vlákno názorů k článku
AVX-512 s AMD Strix Halo: výkon o polovinu vyšší, spotřeba stejná od cc - Jenže programovat pro AVX-512 dnes hlavně znamená používat...

Článek je starý, nové názory již nelze přidávat.

29. 5. 2025 7:40

cc

Jenže programovat pro AVX-512 dnes hlavně znamená používat ty další rozšíření. Nejdůležitější pro mě je VBMI/VBMI2 (tady se dělá magie). U FMA je sice super mít 2 FMA jednotky, ale využít obě + ten zbytek FPU jednotek (FADD) to neumí hned tak každý.

AVX-512 prostě není o FMA (stačí se podívat na simdjson a další projekty co extenzivně využívají AVX-512).

(nevím proč ta odpověď se zobrazuje tady...)
29. 5. 2025, 07:41 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 5. 2025 8:53

linuxák

Utilizovat všechny FMA jednotky na 100% je velmi snadné, stačí pustit inferenci jakékoliv neuronky na CPU, což je v podstatě jenom násobení a sčítání a je to omezené jen hrubým výkonem fused multiply add, který CPU má. Tady nedávají Intel CPU s jednou FMA jednotkou žádný smysl, má to poloviční výkon. Nějaké menší modely se běžně provozují v datacentrech na CPU, protože GPU jsou drahá a NPU se zatím nějak moc do serverových CPU neprosadilo.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 5. 2025 10:00

cc

A seš si jistý, že na to chceš používat 32-bit FMA místo třeba instrukce VDPBF16PS, kterou přidává AVX512_BF16 a díky které můžeš mít mnohem lepší výkon? A co memory bandwidth? Právě u interference je ten memory bandwidth celkem důležitý ne? Toto jde vidět u nového Zen 5 - sice má neuvěřitelný AVX-512 výkon, ale memory bandwidth hodně slabý.

Nechci se tady hádat, ale prostě AVX-512 nikdy nebylo striktně o FMA výkonu. Ta ISA je tak univerzální, že jde použít skoro na všechno, stačí jen trochu přemýšlet.

Vlákno názorů k článku AVX-512 s AMD Strix Halo: výkon o polovinu vyšší, spotřeba stejná od cc - Jenže programovat pro AVX-512 dnes hlavně znamená používat...

Dále u nás najdete

Malware, ransomware a další online hrozby: Jak se liší?

Analýza rozebrala moderování Jílkové v Máte slovo

Registrace zaměstnance od 1. dubna 2026 pro účely JMHZ

Ještě mi nevrátili peníze za Markétu a už je tu EET zas

USA chystají web na obcházení blokací obsahu

Zmatky u superdávky: přerušeno, zpracovává se a kdy dokládat

Notepad++ opravil chybu zneužívanou k šíření malware

Pojišťovny zneužívají lenosti svých klientů. Ti za to platí

Stát se za data retention omluvil, ale údaje sbírá dál

Jaké screeningy vám lékař doporučí po padesátce

Na arytmii přišel díky hodinkám. Lékaři radí zkoušet tep pravidelně

Ve firmách se pořád věří jediné „pravdě“ z dat. A to je problém

Útok AirSnitch dovoluje překonat izolaci klientů na Wi-Fi

Google uvádí Gemini 3.1 Pro a přidává působivé benchmarky

Česko se přímo podílí na evropské strategii pro čipy

Lidl Outlet opustil Olomouc a zamířil na sever Moravy

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

Co chceme od AI asistentů? Návrhy odpovědí a třídění pošty

Navazující a souběžná zaměstnání pro účely JMHZ

Spropitné v restauracích se nebude muset danit ani evidovat v EET

Vlákno názorů k článku
AVX-512 s AMD Strix Halo: výkon o polovinu vyšší, spotřeba stejná od cc - Jenže programovat pro AVX-512 dnes hlavně znamená používat...