Vlákno názorů k článku
Generování fraktálů v assembleru
... (neregistrovaný)
10. 4. 2007 4:19
implementace s využitím SSE3 instrukcí
Pěkná implementace využívající SSE3 instrukce je zde, při jednoduché přesnosti se počítají rovnou dva pixely současně. :-)
10. 4. 2007 17:06
Re: implementace s využitím SSE3 instrukcí
To vypada dost zajimave. V minulosti jsem se pokousel o MMX verzi (to snad SSE jeste neexistovalo), ale k nejakemu extra zkraceni nedoslo. Sice se dalo pocitat paralelne, ale zase prevody v FX formatu do docela zabily a MMX instrukce maji docela dlouhe opkody.
... (neregistrovaný)
11. 4. 2007 7:05
Re: implementace s využitím SSE3 instrukcí
Nevím, jestli to bude kratší, ale rychlejší by to být mělo. Zrovna nedávno jsem řešil komplexní násobení velkého počtu hodnot v jednoduché přesnosti, a při použití té jejich SSE3 implementace se doba výpočtu zkrátila přibližně na polovinu oproti verzi, kterou vyrobilo GCC. Zkoušel jsem i ICC, s tím se mi povedlo dosáhnout zhruba o 20–30 % rychlejšího výsledku než s GCC.

