Vlákno názorů k článku
GCC 15 dostane AVX-512 optimalizace pro AMD Zen 4 a Zen 5 od cc - Zapíná optimalizaci vektorizace AVX2/SSE v rámci AVX-512 Věřím, že...

  • Článek je starý, nové názory již nelze přidávat.
  • 12. 11. 2024 15:48

    cc

    Zapíná optimalizaci vektorizace AVX2/SSE v rámci AVX-512

    Věřím, že tomuto ani sám autor zprávičky nerozumí...

    Podle mě jde spíš o dvojitý epilog v cyklech s tím, že se použijou 2 epilogy pro zbývající vektorové délky (XMM a YMM registry), když už se pro dané operace plně nevyužijou ZMM registry.

    Ono je to ale celkem divné z toho hlediska, že AVX-512 má predikované load/store operace, takže toto většinou není potřeba (a Zen5 má 512-bit ALU, takže proč to dělat?). Pokud toto má vliv, tak to spíš vypadá na nějaké omezení v samotné mikroarchitektuře a nejedná se o optimalizaci, ale spíš o workaround.

    Jinak jedná se o autovektorizaci, takže ve většině případů je to o ničem.

    BTW: Chybí zdroj (Phoronix).

    12. 11. 2024, 15:52 editováno autorem komentáře

  • 12. 11. 2024 17:59

    David Ježek

    Díky, trochu jsem to zneutrálnil a přidal odkaz (nevím, kam se ztratil, asi někam mezi židli a klávesnici).