Nevím, jestli to bude kratší, ale rychlejší by to být mělo. Zrovna nedávno jsem řešil komplexní násobení velkého počtu hodnot v jednoduché přesnosti, a při použití té jejich SSE3 implementace se doba výpočtu zkrátila přibližně na polovinu oproti verzi, kterou vyrobilo GCC. Zkoušel jsem i ICC, s tím se mi povedlo dosáhnout zhruba o 20–30 % rychlejšího výsledku než s GCC.