AVX-512 obchází limit dekodérů instrukcí na x86, kdy dekódováním jedné AVX-512 instrukce za jeden cykl "protáhne" stejně "práce" za jeden cykl, jako 2 normální instrukce. Samozřejmě to platí jen pro SIMD operace, což i tak je alespoň polovina use-casů.
Jinak díky AMD se teď AVX-512 implementuje všude, protože AMD je na serverech a PC doma. Intel je jen v OEM, kde výkon nikdo neřeší (počítače často za trest).