Díky za další zajímavý článek. Pár dotazů:
1. Překvapuje mě zbytečné přetahování obsahu registrů uvnitř smyček (jak SSE2 - movaps, tak i ARM - mov r11/r10). Má to nějakou spojitost s navazujícím kódem, nebo je to výsledek "šablonového" překladu, který není dále překladačem optimalizován?
2. Úvodní test na přetečení - tady mě zajímají dvě věci: a) skoky z testů na přetečení končí na kódu pracujícím s jiným dat. typem, nebo na chybě?
b) Překvapuje mě, že překladač, který by jistě mohl vědět, že při vstupu do smyčky jsou sum a i plněny 0, přesto sáhne na detekci přetečení - metoda 'anything could happen'?