Názor k článku
Generování fraktálů v assembleru
... (neregistrovaný)
11. 4. 2007 7:05
Re: implementace s využitím SSE3 instrukcí
celé vlákno
Nevím, jestli to bude kratší, ale rychlejší by to být mělo. Zrovna nedávno jsem řešil komplexní násobení velkého počtu hodnot v jednoduché přesnosti, a při použití té jejich SSE3 implementace se doba výpočtu zkrátila přibližně na polovinu oproti verzi, kterou vyrobilo GCC. Zkoušel jsem i ICC, s tím se mi povedlo dosáhnout zhruba o 20–30 % rychlejšího výsledku než s GCC.

