Názory k článku Rozšíření instrukční sady AVX a programy v assembleru

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

15. 4. 2025 3:01

kvr kvr

U instrukcí je pak definováno, zda budou horní prvky registrů vynulovány, nebo ponechány na původní hodnotě. Tento koncept není úplně nový a můžeme ho vidět i u základních pracovních registrů (AL AX EAX RAX)...

Právě že ten koncept je nový a zadělal x86_64 na velké problémy. O to víc překvapující, že v případě obecných registrů (*AX) to vyřešili správně. Kvůli tomu, že původní SSE nemění horní části registrů, v důsledku dávají cílový registr do role zdrojového í cílového operandu z hlediska pipeline. Takže přechod z kódu pro AVX do kódu SSE značně limituje možnosti paralelní execution. Intel pro to vytvořil VZEROUPPER, která explicitně označí horní části (všech) registrů jako nepoužité, což ale zase znemožní uchování stavu mezi voláním funkcí (prakticky by měl být VZEROUPPER na konci každé funkce, která operuje nad rámec XMM registrů). Přitom využití je v zásadě nulové - vektorové registry se po částech nenahrávají, a když už, tak je to přes různé shuffle...

PS: U popisu VPADD* v 15. kapitole je chyba - je tam dvakrát VPADDW místo jednoho VPADDD.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 9:52

Pavel Tišnovský

Zlatý podporovatel

Díky za upozornění na chybu, opraveno.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 9:57

Pavel Tišnovský

Zlatý podporovatel

Tím, že je to na x86 řešeno jsem myslel toto:
1) můžeme pracovat s dolní částí běžného pracovního registru, horní část se nebude modifikovat, vůbec o ní ani nemusíme vědět (16bitový kód v 32bitovém režimu)
2) nebo můžeme explicitně použít MOVZX popř. MOVSX. Pravda, tady to jsou jen přenosové instrukce a jinde to udělat nejde, ale přecejen máme aspoň něco.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 15:43

kvr kvr

Pravda, v 16-bitových operacích se taky nemění horní část registrů. Tohle ale vzniklo v době 386, kdy ještě Intel pipeline dependency nejspíš vůbec nepředvídal (nebo možná nepředpokládali, že by s 16-bitovými operandy vůbec někdo běžně pracoval). U 32-bitových operací už to udělali správně a jakákoliv operace vynuluje zbytek registru. U AVX z neznámého důvodu nikoliv...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 18:43

cc

Všechny AVX a AVX-512 instrukce nulujou nepoužitou část cílového vektoru. Takže to udělali správně. Nepochopitelné je, že při přechodu k AVX právě SSE instrukce nenulujou ty horní bity YMM/ZMM registrů.

Může za to asi Windows a ta jejich Win64 konvence při volání funkcí, ale spekulovat se mi nechce.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 19:53

kvr kvr

Nepochopitelné je, že při přechodu k AVX právě SSE instrukce nenulujou ty horní bity YMM/ZMM registrů.

Ano, to jsem myslel, ne AVX kód samotný (v původním příspěvku správně, v odpovědi jsem to zjednodušil). Možné vysvětlení se zdrojem přímo od Intel je v https://stackoverflow.com/questions/41819514/why-do-sse-instructions-preserve-the-upper-128-bit-of-the-ymm-registers - zjevně kompatibilita s existujícím software, resp kernel drivery. Ale ty špatné důsledky...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 18:37

cc

AVX-512 umožňuje v 32-bit režimu adresovat pouze 8 registrů a ne 32 jak je napsané v článku.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 20:16

Pavel Tišnovský

Zlatý podporovatel

tyjo to je nejakej copy&paste error, opravim
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 18:46

cc

Já bych ještě doplnil k článku, že právě prefixy se u VEX (a později EVEX) kódování moc nepoužívají (v praxi jsem neviděl je použít). VEX a EVEX kódování má ty důležité prefixy všechny v sobě, takže jedině použít prefix typu 67h nebo nějaký segment override prefix, což ale stejně nedává smysl.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 4. 2025 20:37

atarist

možná ještě REX prefix, nebo už to taky nemá smysl?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
16. 4. 2025 12:58

cc

To nejde - x86 přímo zakazuje použití REX prefixu (a dalších) s VEX nebo EVEX prefixem (REX a další prefixy jsou přímo součástí VEX/EVEX), proto se s použitím dalších prefixů v praxi moc nesetkáme.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 4. 2025 14:57

cc
Rád bych upozornil na pár věcí k detekci AVX.

AVX potřebuje následující

CPUID[0x1].ECX bit 28 (AVX flag)

CPUID[0x1].ECX bit 26 (XSAVE flag)

CPUID[0x1].ECX bit 27 (OSXSAVE flag) (XSAVE enabled by OS)

Pokud všechno projde, tak použít instrukci XGETBV (s parametrem 0), a zjistit jestli (EAX & 0x00000006u) == 0x00000006u

Jinak se může stát, že AVX i když ho CPU má není povolené v rámci OS.

Jak to vyzkoušet? Spustit virtuál, povolit jen SSE2, a provést nějakou AVX operaci (skončí to SIGILL).
20. 4. 2025, 14:58 editováno autorem komentáře

Zasílat nově přidané názory e-mailem

Názory k článku Rozšíření instrukční sady AVX a programy v assembleru

Dále u nás najdete

Nedostatek vitaminu D se projeví nejen únavou

Paramount získal Warnery a Netflix na tom vydělal

Sociální sítě: od seznamování k debatám o bezpečnosti

Vývojáři už kód nepíší, kočírují smečky AI agentů

„Chybí mi tam 9 let, pohoda.“ Sítě plní zkušenosti s ČSSZ

Budoucnost Office, digitálního pracoviště a e‑shopů

T-Mobile má za sebou v tuzemsku pozitivní rok, rostly tržby i zisk

Zuzana svým byznysem podporuje nigerijské trhovkyně

Na arytmii přišel díky hodinkám. Lékaři radí zkoušet tep pravidelně

Experti nedoporučují rušit rozhlasové a TV poplatky

Benefity z pohledu pracovněprávního a daňového

Standardizace sítí 6G se soustředí na 6GHz pásmo a možnosti sdílení

Nejlepší telefony všech dob dostanou pořádného nástupce

Spotřeba elektřiny v Evropě prudce poroste, může za to AI

Domácí péče hrazená pojišťovnou: kdo ji dostane a co pokryje?

Medicína na míru s AI pomalu vstupuje do zdravotnictví

Co hradí pojišťovny u domácí péče

V IT a podnikových službách už v Česku pracuje 200 tisíc lidí

Vrácení kauce s úroky může být sporné. Pomůže jasná dohoda ve smlouvě

Takto praktik zkontroluje játra, když budete chodit na prevenci