Zjednodusovat se nebude - je to prece x86. Pokud neco, tak by mohli pridat dalsi bit ci rovnou dva, k executable strankam, ktere budou napovidat, ze tam ulozeny kod neni ci je zarovnan na hranici 4 / 8 / 16 bajtu (a vypadovan treba NOPy, pro zpetnou kompatibilitu). Pak si muze ID vzit tento hint a dekodovat paralelne kolik instrukci chce, protoze budou "fixni" velikosti a nemusi hledet na vocasni bajty - ty jsou ignorovany (maj byt nop).
koukam ze zarovnani dost hraje roli uz ted, kvuli uop cache
https://www.bazhenov.me/posts/2024-02-performance-roulette/
https://www.youtube.com/watch?v=IX16gcX4vDQ