Funkce vestavěné v GCC pro provádění nízkoúrovňových aritmetických operací

31. 7. 2025

Doba čtení: 30 minut

Líbí se vám článek?
Podpořte redakci

Dnes si popíšeme některé funkce (resp. pseudofunkce) vestavěné do překladače GCC, které jsou určeny pro provádění nízkoúrovňových aritmetických operací. Díky nim lze realizovat vícebajtovou aritmetiku atd.

Obsah

1. Funkce vestavěné v GCC pro provádění nízkoúrovňových aritmetických operací

2. Operace součtu s detekcí přetečení

3. Způsob překladu operací součtu do strojového kódu

4. Funkce __builtin_add_overflow se shodnými typy sčítanců i výsledku součtu

5. Překlad volání funkce __builtin_add_overflow na platformě x86–64

6. Analýza vygenerovaného strojového kódu pro platformu x86–64

7. Překlad volání funkce __builtin_add_overflow pro 32bitové ARMy

8. Analýza vygenerovaného strojového kódu pro platformu ARM32

9. Překlad volání funkce __builtin_add_overflow pro 64bitové ARMy (AArch64)

10. Analýza vygenerovaného strojového kódu pro platformu AArch64

11. Chování funkce __builtin_add_overflow, pokud mají sčítance i výsledek součtu odlišné typy

12. Demonstrační příklad: součet s využitím různých kombinací hodnot typu char a int

13. Operace rozdílu s detekcí přetečení

14. Demonstrační příklad: volání funkce __builtin_sub_overflow

15. Překlad volání funkce __builtin_sub_overflow na platformě x86–64

16. Operace součinu s detekcí přetečení

17. Vestavěné funkce realizující součet tří hodnot s přetečením a rozdíl tří hodnot s výpůjčkou

18. Demonstrační příklad: operace součtu tří hodnot a operace rozdílu tří hodnot

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

1. Funkce vestavěné v GCC pro provádění nízkoúrovňových aritmetických operací

Na stránkách Roota jsme se již několikrát setkali s takzvanými builtins, což jsou funkce, typicky různé nízkoúrovňové funkce, podporované přímo překladači jazyka C. Dnes se zaměříme na známý překladač GCC, který obsahuje podporu pro relativně velké množství funkcí určených pro nízkoúrovňové aritmetické operace. Na tomto místě se vývojáři mohou ptát k čemu je to dobré, vždyť samotný jazyk C je dostatečně nízkoúrovňový. Ve skutečnosti tomu tak není (alespoň ne za všech okolností), protože například není zcela snadné realizovat základní aritmetické operace s detekcí přetečení výsledků. Navíc starší normy céčka explicitně říkají, že způsob realizace přetečení u celočíselných datových typů se znaménkem (signed) je nedefinovaná operace a překladač céčka se tedy může chovat prakticky libovolným způsobem – v závislosti na zvolené architektuře, přepínačích použitých při překladu, nebo (zcela jistě nejčastěji) podle fáze Měsíce nebo prostředí, ve kterém aplikace běží (korektně na testovacím prostředí, nekorektně u zákazníka).

U dále popsaných funkcí si ukážeme jak jejich základní způsoby volání, tak i způsob jejich překladu do strojového kódu. Mnohdy jsou totiž takové funkce přeložené do jediné strojové instrukce nebo relativně malého množství strojových instrukcí a využívají se zde příznakové bity (které nejsou přímo v C dostupné).

Poznámka: článek je sice zaměřen na GCC, ovšem funkce s podobným nebo i zcela stejným významem nalezneme například i v Clangu.

2. Operace součtu s detekcí přetečení

První skupinou funkcí vestavěných do překladače GCC, s níž se dnes seznámíme, jsou funkce určené pro provedení operace součtu, ovšem s tím, že je navíc korektně detekováno i přetečení výsledků, a to i pro hodnoty se znaménkem. Těchto funkcí existuje celkem sedm: tři funkce pro součet hodnot bez znaménka (unsigned), tři funkce pro součet hodnot se znaménkem (signed) a „univerzální“ funkce, jejíž parametry mohou být různého typu. Povšimněte si, že všech sedm funkcí má stejný počet i význam parametrů (které jsou ovšem různého typu) i stejný typ návratové hodnoty. Tato návratová hodnota pouze signalizuje, že došlo k přetečení; samotný výsledek součtu je vrácen (přes ukazatel, resp. referenci) v posledním předaném parametru:

#	Jméno funkce	Návratový typ	Parametry
1	__builtin_add_overflow	bool	typ1 a, typ2 b, typ3 *res

2	__builtin_sadd_overflow	bool	int a, int b, int *res
3	__builtin_saddl_overflow	bool	long int a, long int b, long int *res
4	__builtin_saddll_overflow	bool	long long int a, long long int b, long long int *res

5	__builtin_uadd_overflow	bool	unsigned int a, unsigned int b, unsigned int *res
6	__builtin_uaddl_overflow	bool	unsigned long int a, unsigned long int b, unsigned long int *res
7	__builtin_uaddll_overflow	bool	unsigned long long int a, unsigned long long int b, unsigned long long int *res

Poznámka: zdánlivě chybějící varianty vestavěných funkcí pro datové typy signed char, unsigned char, signed short a unsigned short lze nahradit první funkcí z tabulky, což si ostatně dnes ukážeme na demonstračních příkladech.

3. Způsob překladu operací součtu do strojového kódu

V programovacím jazyce C je pochopitelně možné všechny funkce zmíněné v předchozí kapitole naprogramovat, i když v případě celočíselných typů se znaménkem je implementace (resp. přesněji řečeno přenositelná implementace) dosti komplikovaná. Ovšem výhoda vestavěných funkcí by měla být v tom, že je překladač jazyka C přeloží nebo by alespoň měl přeložit do optimálního a rychlého strojového kódu, protože na většině mikroprocesorových platforem je detekce přetečení většinou poměrně snadná až triviální (paradoxně v čistém C se jedná o mnohem složitější úlohu, protože nám zde chybí příslušné sémantické konstrukce). Typicky jsou vestavěné funkce přeloženy bez nutnosti použití CALL+RETURN; výsledkem bývá sekvence dvou až pěti strojových instrukcí. O tom, jakým způsobem je překlad prováděn, se přesvědčíme v demonstračních příkladech popsaných v navazujících kapitolách.

4. Funkce __builtin_add_overflow se shodnými typy sčítanců i výsledku součtu

V dnešním prvním demonstračním příkladu je několikrát volána vestavěná funkce nazvaná __builtin_add_overflow, které jsou předány parametry různého typu, konkrétně typu char, short, int a long, a to ve variantách se znaménkem a bez znaménka. V dalších kapitolách si ukážeme způsob překladu těchto funkcí:

#include <stdbool.h>
 
bool add_overflow_signed_char(signed char x, signed char y) {
    signed char z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_unsigned_char(unsigned char x, unsigned char y) {
    unsigned char z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_signed_short(signed short x, signed short y) {
    signed short z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_unsigned_short(unsigned short x, unsigned short y) {
    unsigned short z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_signed_int(signed int x, signed int y) {
    signed int z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_unsigned_int(unsigned int x, unsigned int y) {
    unsigned int z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_signed_long(signed long x, signed long y) {
    signed long z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_unsigned_long(unsigned long x, unsigned long y) {
    unsigned long z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}

Poznámka: povšimněte si, že musíme importovat pouze hlavičkový soubor stdbool.h s definicí datového typu bool. Ovšem hlavičky vestavěných funkcí není nutné definovat – překladač je zná a může přímo použít. A navíc u funkce __builtin_add_overflow by hlavička byla stejně zavádějící, protože tato funkce je v určitém smyslu generická (pro celočíselné datové typy).

5. Překlad obecné funkce __builtin_add_overflow na platformě x86–64

Nejprve se pokusíme první demonstrační příklad přeložit pro platformu x86–64. Zvolíme dvě strategie překladu: zcela bez optimalizací a naopak s povolenými optimalizacemi:

$ gcc -S -O0 -masm=intel add_overflow.c
 
$ gcc -S -O9 -masm=intel add_overflow.c

Kvůli použití přepínače -S bude výsledkem překladu nikoli objektový kód, ale kód v assembleru, který byl navíc pro účely článku očištěn od zbytečných informací a přepínačů.

V případě, že jsou optimalizace zakázány, budou funkce z demonstračního příkladu přeloženy do této (skutečně neoptimální) podoby:

add_overflow_signed_char:
        push    rbp
        mov     rbp, rsp
        mov     edx, edi
        mov     eax, esi
        mov     BYTE PTR [rbp-20], dl
        mov     BYTE PTR [rbp-24], al
        movsx   edx, BYTE PTR [rbp-20]
        movsx   eax, BYTE PTR [rbp-24]
        mov     ecx, 0
        add     al, dl
        jno     .L2
        mov     ecx, 1
.L2:
        mov     BYTE PTR [rbp-2], al
        mov     eax, ecx
        and     eax, 1
        mov     BYTE PTR [rbp-1], al
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret
 
add_overflow_unsigned_char:
        push    rbp
        mov     rbp, rsp
        mov     edx, edi
        mov     eax, esi
        mov     BYTE PTR [rbp-20], dl
        mov     BYTE PTR [rbp-24], al
        movzx   eax, BYTE PTR [rbp-20]
        movzx   edx, BYTE PTR [rbp-24]
        mov     ecx, 0
        add     al, dl
        jnc     .L6
        mov     ecx, 1
.L6:
        mov     BYTE PTR [rbp-2], al
        mov     eax, ecx
        and     eax, 1
        mov     BYTE PTR [rbp-1], al
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret
 
add_overflow_signed_short:
        push    rbp
        mov     rbp, rsp
        mov     edx, edi
        mov     eax, esi
        mov     WORD PTR [rbp-20], dx
        mov     WORD PTR [rbp-24], ax
        movsx   edx, WORD PTR [rbp-20]
        movsx   eax, WORD PTR [rbp-24]
        mov     ecx, 0
        add     ax, dx
        jno     .L10
        mov     ecx, 1
.L10:
        mov     WORD PTR [rbp-4], ax
        mov     eax, ecx
        mov     BYTE PTR [rbp-1], al
        and     BYTE PTR [rbp-1], 1
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret
 
add_overflow_unsigned_short:
        push    rbp
        mov     rbp, rsp
        mov     edx, edi
        mov     eax, esi
        mov     WORD PTR [rbp-20], dx
        mov     WORD PTR [rbp-24], ax
        movzx   eax, WORD PTR [rbp-20]
        movzx   edx, WORD PTR [rbp-24]
        mov     ecx, 0
        add     ax, dx
        jnc     .L14
        mov     ecx, 1
.L14:
        mov     WORD PTR [rbp-4], ax
        mov     eax, ecx
        mov     BYTE PTR [rbp-1], al
        and     BYTE PTR [rbp-1], 1
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret
 
add_overflow_signed_int:
        push    rbp
        mov     rbp, rsp
        mov     DWORD PTR [rbp-20], edi
        mov     DWORD PTR [rbp-24], esi
        mov     ecx, 0
        mov     edx, DWORD PTR [rbp-20]
        mov     eax, DWORD PTR [rbp-24]
        add     eax, edx
        jno     .L18
        mov     ecx, 1
.L18:
        mov     DWORD PTR [rbp-8], eax
        mov     eax, ecx
        mov     BYTE PTR [rbp-1], al
        and     BYTE PTR [rbp-1], 1
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret
 
add_overflow_unsigned_int:
        push    rbp
        mov     rbp, rsp
        mov     DWORD PTR [rbp-20], edi
        mov     DWORD PTR [rbp-24], esi
        mov     ecx, 0
        mov     eax, DWORD PTR [rbp-20]
        mov     edx, DWORD PTR [rbp-24]
        add     eax, edx
        jnc     .L22
        mov     ecx, 1
.L22:
        mov     DWORD PTR [rbp-8], eax
        mov     eax, ecx
        mov     BYTE PTR [rbp-1], al
        and     BYTE PTR [rbp-1], 1
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret
 
add_overflow_signed_long:
        push    rbp
        mov     rbp, rsp
        mov     QWORD PTR [rbp-24], rdi
        mov     QWORD PTR [rbp-32], rsi
        mov     ecx, 0
        mov     rdx, QWORD PTR [rbp-24]
        mov     rax, QWORD PTR [rbp-32]
        add     rax, rdx
        jno     .L26
        mov     ecx, 1
.L26:
        mov     QWORD PTR [rbp-16], rax
        mov     rax, rcx
        mov     BYTE PTR [rbp-1], al
        and     BYTE PTR [rbp-1], 1
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret
 
add_overflow_unsigned_long:
        push    rbp
        mov     rbp, rsp
        mov     QWORD PTR [rbp-24], rdi
        mov     QWORD PTR [rbp-32], rsi
        mov     ecx, 0
        mov     rax, QWORD PTR [rbp-24]
        mov     rdx, QWORD PTR [rbp-32]
        add     rax, rdx
        jnc     .L30
        mov     ecx, 1
.L30:
        mov     QWORD PTR [rbp-16], rax
        mov     rax, rcx
        mov     BYTE PTR [rbp-1], al
        and     BYTE PTR [rbp-1], 1
        movzx   eax, BYTE PTR [rbp-1]
        pop     rbp
 
        ret

Překlad s povolenými optimalizacemi dopadne o mnoho lépe:

add_overflow_signed_char:
        add     dil, sil
        seto    al
        ret
 
add_overflow_unsigned_char:
        add     sil, dil
        setc    al
        ret
 
add_overflow_signed_short:
        add     di, si
        seto    al
        ret
 
add_overflow_unsigned_short:
        add     si, di
        setc    al
        ret
 
add_overflow_signed_int:
        add     edi, esi
        seto    al
        ret
 
add_overflow_unsigned_int:
        add     edi, esi
        setc    al
        ret
 
add_overflow_signed_long:
        add     rdi, rsi
        seto    al
        ret
 
add_overflow_unsigned_long:
        add     rdi, rsi
        setc    al
        ret

6. Analýza vygenerovaného strojového kódu pro platformu x86–64

Popišme si ve stručnosti, jaké instrukce jsou vlastně v přeloženém strojovém kódu použity. U neoptimalizovaného kódu nalezneme tuto sekvenci instrukcí:

add_overflow_signed_char:
        ...
        add     al, dl
        jno     .L2
        ...
 
add_overflow_unsigned_char:
        ...
        add     al, dl
        jnc     .L6
        ...
 
add_overflow_signed_short:
        ...
        add     ax, dx
        jno     .L10
        ...
 
add_overflow_unsigned_short:
        ...
        add     ax, dx
        jnc     .L14
        ...
 
add_overflow_signed_int:
        ...
        add     eax, edx
        jno     .L18
        ...
 
add_overflow_unsigned_int:
        ...
        add     eax, edx
        jnc     .L22
        ...

Vzor je tedy vždy stejný – nejdříve se provede běžný součet založený na instrukci ADD, pokaždé pochopitelně s různými typy registrů (8 bitů, 16 bitů, 32 bitů). A po součtu následuje rozeskok realizovaný instrukcí JNO (Jump if Not Overflow) nebo JNC (Jump if Not Carry). Při realizaci podmíněného rozeskoku se tedy testuje příznakový bit overflow u hodnot se znaménkem nebo příznakový bit carry u hodnot bez znaménka. Naprosto stejnou operaci by provedl i programátor v assembleru.

Při překladu se zapnutými optimalizacemi se ovšem žádný rozeskok neprovádí, protože zde ihned za instrukcí součtu následuje instrukce seto (součet hodnot se znaménkem) nebo setc (součet hodnot bez znaménka). Instrukce SETcc přitom na platformě x86–64 existuje ve více variantách, ovšem provádí vždy stejnou operaci – do cílového registru nebo místa paměti dosadí hodnotu 1, pokud je splněna zvolená podmínka. V opačném případě dosadí hodnotu 0:

Instrukce	Význam instrukce	Podmínka
SETO	Set to 1 if Overflow	OF = 1
SETNO	Set to 1 if Not Overflow	OF = 0
SETS	Set to 1 if Sign	SF = 1
SETNS	Set to 1 if Not Sign	SF = 0
SETE	Set to 1 if Equal	ZF = 1
SETZ	Set to 1 if Zero	ZF = 1
SETNE	Set to 1 if Not Equal	ZF = 0
SETNZ	Set to 1 if Not Zero	ZF = 0
SETB	Set to 1 if Below	CF = 1
SETNAE	Set to 1 if Not Above or Equal	CF = 1
SETC	Set to 1 if Carry	CF = 1
SETNB	Set to 1 if Not Below	CF = 0
SETAE	Set to 1 if Above or Equal	CF = 0
SETNC	Set to 1 if Not Carry	CF = 0
SETBE	Set to 1 if Below or Equal	CF = 1 \| ZF = 1
SETNA	Set to 1 if Not Above	CF = 1 \| ZF = 1
SETA	Set to 1 if Above	CF = 0 & ZF = 0
SETNBE	Set to 1 if Not Below or Equal	CF = 0 & ZF = 0
SETL	Set to 1 if Less	SF <> OF
SETNGE	Set to 1 if Not Greater or Equal	SF <> OF
SETGE	Set to 1 if Greater or Equal	SF = OF
SETNL	Set to 1 if Not Less	SF = OF
SETLE	Set to 1 if Less or Equal	ZF = 1 \| SF <> OF
SETNG	Set to 1 if Not Greater	ZF = 1 \| SF <> OF
SETG	Set to 1 if Greater	ZF = 0 & SF = OF
SETNLE	Set to 1 if Not Less or Equal	ZF = 0 & SF = OF
SETP	Set to 1 if Parity	PF = 1
SETPE	Set to 1 if Parity Even	PF = 1
SETNP	Set to 1 if Not Parity	PF = 0
SETPO	Set to 1 if Parity Odd	PF = 0

7. Překlad obecné funkce __builtin_add_overflow pro 32bitové ARMy

Nyní se podívejme na způsob překladu stejného céčkovského zdrojového kódu se stejnou funkcí __builtin_add_overflow, nyní ovšem pro 32bitovou architekturu ARM (minimálně ARMv7, což je dnes již naprostý standard):

add_overflow_signed_char:
        add     r0, r0, r1
        sxtb    r3, r0
        subs    r0, r0, r3
        it      ne
        movne   r0, #1
        bx      lr
 
add_overflow_unsigned_char:
        add     r0, r0, r1
        lsrs    r0, r0, #8
        bx      lr
 
add_overflow_signed_short:
        add     r0, r0, r1
        sxth    r3, r0
        subs    r0, r0, r3
        it      ne
        movne   r0, #1
        bx      lr
 
add_overflow_unsigned_short:
        add     r0, r0, r1
        lsrs    r0, r0, #16
        bx      lr
 
add_overflow_signed_int:
        adds    r0, r0, r1
        ite     vs
        movvs   r0, #1
        movvc   r0, #0
        bx      lr
 
add_overflow_unsigned_int:
        cmn     r0, r1
        ite     cs
        movcs   r0, #1
        movcc   r0, #0
        bx      lr
 
add_overflow_signed_long:
        adds    r0, r0, r1
        ite     vs
        movvs   r0, #1
        movvc   r0, #0
        bx      lr
 
add_overflow_unsigned_long:
        cmn     r0, r1
        ite     cs
        movcs   r0, #1
        movcc   r0, #0
        bx      lr

Pro operace s osmibitovými hodnotami bez znaménka se ihned po operaci součtu volá instrukce LSRS neboli logický posun doprava o zadaný počet bitů s nastavením příznaků. Ovšem důležitější je, že po posunu o osm resp. 16 bitů doprava bude v registru RO uložena skutečně jen hodnota 0 nebo 1, tedy příznak přetečení:

add     r0, r0, r1                add     r0, r0, r1
lsrs    r0, r0, #8                lsrs    r0, r0, #16
bx      lr                        bx      lr

Nejsložitější je situace u osmibitových a 16bitových hodnot se znaménkem, které vyžadují konverzi pomocí SXTB resp. SXTH, provedení operace rozdílu a následný rozeskok realizovaný opět pomocí prefixu IT.

8. Analýza vygenerovaného strojového kódu pro platformu ARM32

Pokud se podíváme na strojový kód uvedený v předchozí kapitole zjistíme, že se většinou šablonovitě provádí tato sekvence operací:

     add ...
     nastavení registru r0 na 0 nebo 1
     bx lr

První instrukce slouží k získání informace o přetečení, dalších několik instrukcí vloží do registru R0 hodnotu 0 nebo 1 na základě toho, zda k přetečení došlo či nikoli a poslední instrukce BX (Branch and eXchange) slouží k návratu z funkce s tím, že výsledek bude uložen právě v registru R0.

Na platformě ARM32 je zajímavé, že je na rozdíl od x86–64 orientována převážně na provádění 32bitových operací, takže operace s osmibitovými operandy je většinou nutné řešit specifickými způsoby, typicky jejich konverzí na plných 32 bitů.

Podívejme se nejdříve na řešení použité u operací s typy int a long (bez rozdílu), a to jak se znaménkem, tak i bez znaménka. Je zde využit instrukční prefix IT Tento prefix může být aplikován na jednu až čtyři instrukce následující za prefixem. Ihned za prefixem IT se (bez mezery) udává, zda má být daná instrukce provedena při splnění podmínky (T – then) či naopak při jejím nesplnění (E – else). U první instrukce je automaticky předpokládáno T, tudíž se uvádí maximálně tři kombinace znaků T/E. Samozřejmě je taktéž nutné zapsat i testovanou podmínku – může se jednat o kódy používané jak u podmíněných skoků, tak i v podmínkových bitech.

V našem konkrétním případě je vždy využit prefix ITE a testuje se buď nastavení příznaku Carry nebo Overflow. Pro hodnoty bez znaménka:

cmn     r0, r1   ; porovnání s negovanou hodnotou
ite     cs       ; provedení třetí nebo čtvrté instrukce na základě příznaku Carry
movcs   r0, #1
movcc   r0, #0

Se znaménkem:

cmn     r0, r1   ; porovnání s negovanou hodnotou
ite     vs       ; provedení třetí nebo čtvrté instrukce na základě příznaku Overflow
movcs   r0, #1
movcc   r0, #0

9. Překlad obecné funkce __builtin_add_overflow pro 64bitové ARMy (AArch64)

Pro mikroprocesory a mikrořadiče s architekturou AArch64 je překlad proveden zcela odlišným způsobem, než je tomu u 32bitových ARMů. Je to ostatně patrné i při pohledu na výsledek překladu, který bude (v případě povolení optimalizací) vypadat následovně:

add_overflow_signed_char:
        sxtb    w1, w1
        sxtb    w0, w0
        add     w2, w0, w1
        eon     w0, w0, w1
        eor     w1, w1, w2
        and     w0, w1, w0
        ubfx    w0, w0, 7, 1
        ret
 
add_overflow_unsigned_char:
        and     w0, w0, 255
        add     w1, w0, w1
        cmp     w0, w1, uxtb
        cset    w0, hi
        ret
 
add_overflow_signed_short:
        sxth    w1, w1
        sxth    w0, w0
        add     w2, w0, w1
        eon     w0, w0, w1
        eor     w1, w1, w2
        and     x0, x1, x0
        ubfx    x0, x0, 15, 1
        ret
 
add_overflow_unsigned_short:
        and     w0, w0, 65535
        add     w1, w0, w1
        cmp     w0, w1, uxth
        cset    w0, hi
        ret
 
add_overflow_signed_int:
        cmn     w0, w1
        cset    w0, vs
        ret
 
add_overflow_unsigned_int:
        adds    w0, w0, w1
        cset    w0, cs
        ret
 
add_overflow_signed_long:
        cmn     x0, x1
        cset    w0, vs
        ret
 
add_overflow_unsigned_long:
        cmn     x0, x1
        cset    w0, cs
        ret

10. Analýza vygenerovaného strojového kódu pro platformu AArch64

Jak je z předchozího výpisu patrné, umožňuje instrukční sada AArch64 provedení odlišných operací, které jsou v případě 32bitových a 64bitových hodnot kratší a efektivnější, než je tomu na architektuře ARM32.

První zcela novou instrukcí uvedenou až na architektuře AArch64, je instrukce nazvaná CSET neboli Conditional Set. Tato instrukce vlastně přímo odpovídá požadavkům kladeným na datový typ boolean v mnoha programovacích jazycích, v nichž je hodnota true interně reprezentována jedničkou a hodnota false nulou. Tato instrukce existuje ve dvou variantách, přičemž první varianta pracuje s 32bitovým a druhá varianta s 64bitovým operandem):

CSET Wd, condition
CSET Xd, condition

Například:

CSET W3, EQ
CSET W4, MI
CSET X5, HI

Tato instrukce pracuje následujícím způsobem – v případě, že je podmínka zapsaná ve druhém operandu cond splněna, uloží se do cílového registru Wd či do registru Xd hodnota 1. Pokud podmínka naopak splněna není, uloží se do registru Wd či Xd hodnota 0:

cíl = condition ? 1 : 0;

Ve skutečnosti se v případě CSET jedná o alias pro instrukci CSINC popsanou dále (podmínka ovšem musí být v tomto případě negována):

CSINC Wd, WZR, WZR, invert(condition)
CSINC Xd, XZR, XZR, invert(condition)

Díky tomu je možné přímo detekovat přetečení u 32bitových a 64bitových hodnot se znaménkem či bez znaménka. Šablona je stále stejná, liší se jen první instrukce (porovnání s opačným operandem nebo přímý součet s nastavením příznaků) a to, zda jsou použity 32bitové či 64bitové registry:

cmn     w0, w1        adds    w0, w0, w1        cmn     x0, x1        cmn     x0, x1
cset    w0, vs        cset    w0, cs            cset    w0, vs        cset    w0, cs
ret                   ret                       ret                   ret

U hodnot osmibitových a šestnáctibitových se opět objevuje nutnost použití konverzních instrukcí SXTB a SXTH, v případě 16bitových porovnání se znaménkem se navíc používá bitový posun UBFX.

Poznámka: jak je z výpisů patrné, nejsou operace s osmibitovými a 16bitovými hodnotami nijak efektivní. Asi nejvíce je to patrné na vlastně „nejjednodušším“ případě – detekci přetečení u osmibitových hodnot:

sxtb    w1, w1         ; znaménkové rozšíření na 32 bitů
sxtb    w0, w0         ; znaménkové rozšíření na 32 bitů
add     w2, w0, w1     ; součet nyní 32bitových hodnot s uložením výsledku do registru W2
eon     w0, w0, w1     ; operace XOR s negovaným operandem (důležitý bude osmý bit zprava)
eor     w1, w1, w2     ; operace XOR (důležitý bude opět osmý bit zprava)
and     w0, w1, w0     ; bitový součin mezivýsledků předchozích operací
ubfx    w0, w0, 7, 1   ; bitový posun, zajímat nás bude osmý bit zprava
ret

11. Chování funkce __builtin_add_overflow, pokud mají sčítance i výsledek součtu odlišné typy

Ještě jednou se podívejme na hlavičku vestavěné funkce nazvané __builtin_add_overflow:

bool __builtin_add_overflow(type1 a, type2 b, type3 *res)

za povšimnutí stojí především fakt, že datové typy parametrů a, b a *res nejsou totožné, tedy nikde není řečeno, že se například ve všech třech případech musí jednat o unsigned char nebo o signed long. Je tomu vlastně přesně naopak, protože tato funkce akceptuje parametry libovolných celočíselných numerických typů (popř. v posledním případě odkaz/ukazatel na libovolný celočíselný numerický typ). To ovšem znamená, že například můžeme libovolným způsobem zkombinovat například typy unsigned char a unsigned int, což je ostatně ukázáno v dalším demonstračním příkladu, ve kterém je implementováno všech osm možných kombinací:

#include <stdbool.h>
 
bool add_overflow_ccc(unsigned char x, unsigned char y) {
    unsigned char z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_cci(unsigned char x, unsigned char y) {
    unsigned int z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_cic(unsigned char x, unsigned int y) {
    unsigned char z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_cii(unsigned char x, unsigned int y) {
    unsigned int z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_icc(unsigned char x, unsigned char y) {
    unsigned char z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_ici(unsigned int x, unsigned char y) {
    unsigned int z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_iic(unsigned int x, unsigned int y) {
    unsigned char z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}
 
bool add_overflow_iii(unsigned int x, unsigned int y) {
    unsigned int z;
    bool overflow = __builtin_add_overflow(x, y, &z);
    return overflow;
}

12. Demonstrační příklad: součet s využitím různých kombinací hodnot typu char a int

Podívejme se nyní na způsob překladu výše uvedeného demonstračního příkladu do strojového kódu pro platformu x86–64. Překlad je vlastně poměrně přímočarý, minimálně ve většině případů:

add_overflow_ccc:
        add     sil, dil
        setc    al
        ret
 
add_overflow_cci:
        xor     eax, eax
        ret
 
add_overflow_cic:
        mov     esi, esi
        movzx   edi, dil
        add     rdi, rsi
        test    rdi, -256
        setne   al
        ret
 
add_overflow_cii:
        movzx   edi, dil
        add     edi, esi
        setc    al
        ret
 
add_overflow_icc:
        add     sil, dil
        setc    al
        ret
 
add_overflow_ici:
        movzx   esi, sil
        add     esi, edi
        setc    al
        ret
 
add_overflow_iic:
        mov     esi, esi
        mov     edi, edi
        add     rdi, rsi
        test    rdi, -256
        setne   al
        ret
 
add_overflow_iii:
        add     edi, esi
        setc    al
        ret

Pojďme si jednotlivé případy blíže vysvětlit. Variantu char+char→char již známe, stejně jako variantu int+int→int, takže si je již nebudeme znovu popisovat (za povšimnutí stojí jen pojmenování osmibitových částí registrů SI a DI):

add_overflow_ccc:
        add     sil, dil
        setc    al
        ret
 
add_overflow_iii:
        add     edi, esi
        setc    al
        ret

Součet char+char→int nemůže nikdy vést k přetečení, a z tohoto důvodu se vždy vrací nula:

add_overflow_cci:
        xor     eax, eax
        ret

Varianty char+int→int a int+char→int jsou pochopitelně shodné, až na opačné pořadí vstupních operandů:

add_overflow_cii:
        movzx   edi, dil
        add     edi, esi
        setc    al
        ret
 
add_overflow_ici:
        movzx   esi, sil
        add     esi, edi
        setc    al
        ret

Varianta int+char→char musí kontrolovat přetečení, tedy příznakový bit Carry:

add_overflow_icc:
        add     sil, dil
        setc    al
        ret

Nejsložitější jsou varianty char+int→char a int+int→char, v nichž se porovnává výsledek s hodnotou –256 ve dvojkovém doplňku a na základě relace NE (not equal) se nastavuje výsledná hodnota:

add_overflow_cic:
        mov     esi, esi
        movzx   edi, dil
        add     rdi, rsi
        test    rdi, -256
        setne   al
        ret
 
add_overflow_iic:
        mov     esi, esi
        mov     edi, edi
        add     rdi, rsi
        test    rdi, -256
        setne   al
        ret

13. Operace rozdílu s detekcí přetečení

Ve druhé kapitole jsme si představili skupinu sedmi vestavěných funkcí určených pro provádění operací součtu s detekcí přetečení. Podobně – i kvůli zachování symetrie – existuje i sedm obdobných funkcí, které tentokrát své operandy odečtou a opět detekují stav, kdy dochází k přetečení. Jedná se o tyto funkce:

Jméno funkce	Návratový typ	Parametry
__builtin_sub_overflow	bool	type1 a, type2 b, type3 *res

__builtin_ssub_overflow	bool	int a, int b, int *res
__builtin_ssubl_overflow	bool	long int a, long int b, long int *res
__builtin_ssubll_overflow	bool	long long int a, long long int b, long long int *res

__builtin_usub_overflow	bool	unsigned int a, unsigned int b, unsigned int *res
__builtin_usubl_overflow	bool	unsigned long int a, unsigned long int b, unsigned long int *res
__builtin_usubll_overflow	bool	unsigned long long int a, unsigned long long int b, unsigned long long int *res

V praxi to například znamená, že funkce __builtin_ssub_overflow vrací pro operandy 2, 1 hodnotu 0 (bez přetečení) a pro operandy 1, 2 hodnotu 1 (s přetečením resp. lépe řečeno s výpůjčkou).

14. Demonstrační příklad: volání funkce __builtin_sub_overflow

Podobně, jako jsme si ukázali demonstrační příklad s voláním funkce __builtin_add_overflow, si ukážeme podobný příklad, který ovšem nyní bude volat funkci __builtin_sub_overflow s různými typy vstupních parametrů i s návratovým typem funkce:

#include <stdbool.h>
 
bool sub_overflow_signed_char(signed char x, signed char y) {
    signed char z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}
 
bool sub_overflow_unsigned_char(unsigned char x, unsigned char y) {
    unsigned char z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}
 
bool sub_overflow_signed_short(signed short x, signed short y) {
    signed short z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}
 
bool sub_overflow_unsigned_short(unsigned short x, unsigned short y) {
    unsigned short z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}
 
bool sub_overflow_signed_int(signed int x, signed int y) {
    signed int z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}
 
bool sub_overflow_unsigned_int(unsigned int x, unsigned int y) {
    unsigned int z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}
 
bool sub_overflow_signed_long(signed long x, signed long y) {
    signed long z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}
 
bool sub_overflow_unsigned_long(unsigned long x, unsigned long y) {
    unsigned long z;
    bool overflow = __builtin_sub_overflow(x, y, &z);
    return overflow;
}

15. Překlad volání funkce __builtin_sub_overflow na platformě x86–64

Překlad do strojového kódu opět využívá rozdíl popř. porovnání hodnot následovaný instrukcí SETcc s vhodně nastavenou podmínkou. Konkrétně se setkáme s těmito třemi variantami:

Instrukce	Význam instrukce	Podmínka	Typ
SETO	Set to 1 if Overflow	OF = 1	se znaménkem
SETA	Set to 1 if Above	CF = 0 & ZF = 0	bez znaménka
SETB	Set to 1 if Below	CF = 1	bez znaménka

Strojový kód vypadá následovně:

sub_overflow_signed_char:
        sub     dil, sil
        seto    al
        ret
 
sub_overflow_unsigned_char:
        cmp     sil, dil
        seta    al
        ret
 
sub_overflow_signed_short:
        sub     di, si
        seto    al
        ret
 
sub_overflow_unsigned_short:
        cmp     si, di
        seta    al
        ret
 
sub_overflow_signed_int:
        sub     edi, esi
        seto    al
        ret
 
sub_overflow_unsigned_int:
        cmp     edi, esi
        setb    al
        ret
 
sub_overflow_signed_long:
        sub     rdi, rsi
        seto    al
        ret
 
sub_overflow_unsigned_long:
        cmp     rdi, rsi
        setb    al
        ret

16. Operace součinu s detekcí přetečení

Poslední sedmice vestavěných funkcí se dvěma vstupními operandy a detekcí přetečení se týká operace součinu, a to jak hodnot se znaménkem, tak i hodnot bez znaménka. Způsob pojmenování funkcí je stále zachován (s-signed, u-unsigned, l-long, ll-long long):

#	Jméno funkce	Návratový typ	Parametry
1	__builtin_mul_overflow	bool	type1 a, type2 b, type3 *res

2	__builtin_smul_overflow	bool	int a, int b, int *res
3	__builtin_smull_overflow	bool	long int a, long int b, long int *res
4	__builtin_smulll_overflow	bool	long long int a, long long int b, long long int *res

5	__builtin_umul_overflow	bool	unsigned int a, unsigned int b, unsigned int *res
6	__builtin_umull_overflow	bool	unsigned long int a, unsigned long int b, unsigned long int *res
7	__builtin_umulll_overflow	bool	unsigned long long int a, unsigned long long int b, unsigned long long int *res

Poznámka: poslední základní aritmetickou operací je operace podílu, ovšem v tomto případě (pokud jsou shodné datové typy operandů i výsledku) k přetečení nedochází, „pouze“ může dojít k dělení nulou. Proto v GCC nenalezneme obdobu vestavěných funkcí __builtin_divXX_overflow.

17. Vestavěné funkce realizující součet tří hodnot s přetečením a rozdíl tří hodnot s výpůjčkou

Posledních šest vestavěných funkcí, s nimiž se dnes alespoň ve stručnosti seznámíme, jsou funkce, které provádí součet či rozdíl tří hodnot, přičemž třetí hodnotou bývá příznak přetečení nebo výpůjčky z předchozí operace. Díky tomu je možné volání těchto funkcí zřetězit a implementovat tak aritmetické operace s velkým počtem bajtů (bitů), například 512 bitů atd.:

#	Jméno funkce	Návratový typ	Parametry
1	__builtin_addc	unsigned int	unsigned int a, unsigned int b, unsigned int carry_in, unsigned int *carry_out
2	__builtin_addcl	unsigned long int	unsigned long int a, unsigned long int b, unsigned int carry_in, unsigned long int *carry_out
3	__builtin_addcll	unsigned long long int	unsigned long long int a, unsigned long long int b, unsigned long long int carry_in, long long int *carry_out

4	__builtin_subc	unsigned int	unsigned int a, unsigned int b, unsigned int carry_in, unsigned int *carry_out
5	__builtin_subcl	unsigned long int	unsigned long int a, unsigned long int b, unsigned int carry_in, unsigned long int *carry_out
6	__builtin_subcll	unsigned long long int	unsigned long long int a, unsigned long long int b, unsigned long long int carry_in, unsigned long long int *carry_out

U operací součtu se sečtou všechny tři operandy, zatímco u operace rozdílu se provádí výpočet a-b-carry_in (poslední znaménko je důležité).

18. Demonstrační příklad: operace součtu tří hodnot a operace rozdílu tří hodnot

Výše popsané funkce, konkrétně funkce __builtin_addc a __builtin_subc, si otestujeme v následujícím demonstračním příkladu:

#include <limits.h>
#include <stdio.h>
 
void add_with_carry(unsigned int x, unsigned int y, unsigned int carry_in) {
    unsigned int carry_out;
    unsigned int result;
 
    result = __builtin_addc(x, y, carry_in, &carry_out);
    printf("%u + %u + %u = (%u)%u\n", x, y, carry_in, carry_out, result);
}
 
void sub_with_carry(unsigned int x, unsigned int y, unsigned int carry_in) {
    unsigned int carry_out;
    unsigned int result;
 
    result = __builtin_subc(x, y, carry_in, &carry_out);
    printf("%u - %u - %u = (%u)%u\n", x, y, carry_in, carry_out, result);
}
 
int main(void) {
    add_with_carry(0, 0, 0);
    add_with_carry(0, 0, 1);
    add_with_carry(1, 2, 0);
    add_with_carry(1, 2, 1);
 
    add_with_carry(UINT_MAX, 0, 0);
    add_with_carry(UINT_MAX, 0, 1);
    add_with_carry(UINT_MAX, 1, 0);
    add_with_carry(UINT_MAX, 1, 1);
 
    putchar('\n');
 
    sub_with_carry(0, 0, 0);
    sub_with_carry(0, 0, 1);
    sub_with_carry(2, 1, 0);
    sub_with_carry(2, 1, 1);
    sub_with_carry(2, 2, 0);
    sub_with_carry(2, 2, 1);
}

Nejprve sčítáme dvě malé hodnoty s přidáním příznaku přetečení (ten je nastaven na hodnotu 0 nebo 1). Výsledek je zobrazen formou (nový příznak přetečení)výsledek:

0 + 0 + 0 = (0)0
0 + 0 + 1 = (0)1
1 + 2 + 0 = (0)3
1 + 2 + 1 = (0)4

Předchozí čtyři součty pochopitelně nevedly k přetečení. Podívejme se nyní na mezní případy – přičtení nuly či jedničky k hodnotě UINT_MAX společně s přičtením příznaku přetečení. Ve třech posledních případech došlo podle očekávání k přetečení:

4294967295 + 0 + 0 = (0)4294967295
4294967295 + 0 + 1 = (1)0
4294967295 + 1 + 0 = (1)0
4294967295 + 1 + 1 = (1)1

Podobně si můžeme otestovat operaci rozdílu. Výsledky jsou pochopitelné – při přechodu přes hodnotu 0 je hlášeno přetečení (resp. přesněji řečeno výpůjčka):

0 - 0 - 0 = (0)0
0 - 0 - 1 = (1)4294967295
2 - 1 - 0 = (0)1
2 - 1 - 1 = (0)0
2 - 2 - 0 = (0)0
2 - 2 - 1 = (1)4294967295

19. Repositář s demonstračními příklady

Demonstrační příklady napsané v jazyku C, které jsou určené pro překlad s využitím překladače gcc, byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/8bit-fame. Jednotlivé demonstrační příklady si můžete v případě potřeby stáhnout i jednotlivě bez nutnosti klonovat celý (dnes již poměrně rozsáhlý) repositář:

#	Příklad	Stručný popis	Adresa
1	add_overflow.c	volání vestavěné funkce __builtin_add_overflow s předáním operandů různých typů	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_overflow.c
2	add_overflow_x86_64_O0.asm	překlad volání funkce __builtin_add_overflow na platformě x86–64 bez aplikace optimalizací	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_overflow_x86_64_O0.asm
3	add_overflow_x86_64_Os.asm	překlad volání funkce __builtin_add_overflow na platformě x86–64 s aplikací optimalizací	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_overflow_x86_64_Os.asm
4	add_overflow_arm₃₂.asm	překlad volání funkce __builtin_add_overflow pro 32bitové ARMy	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_overflow_arm₃₂.asm
5	add_overflow_arm₆₄.asm	překlad volání funkce __builtin_add_overflow pro 64bitové ARMy (AArch64)	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_overflow_arm₆₄.asm

6	add_diff_types.c	součet s využitím různých kombinací hodnot typu char a int	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_diff_types.c
7	add_diff_types_x86_64.asm	překlad volání funkce __builtin_add_overflow na platformě x86–64 s aplikací optimalizací	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_diff_types_x86_64.asm
8	add_diff_types_arm32.asm	překlad volání funkce __builtin_add_overflow pro 32bitové ARMy	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_diff_types_arm32.asm
9	add_diff_types_arm64.asm	překlad volání funkce __builtin_add_overflow pro 64bitové ARMy (AArch64)	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/add_diff_types_arm64.asm

10	sub_overflow.c	operace rozdílu s využitím funkce __builtin_sub_overflow	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/sub_overflow.c
11	sub_overflow.asm	překlad volání funkce __builtin_sub_overflow na platformě x86–64	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/sub_overflow.asm

12	addc_subc.c	operace součtu tří hodnot a operace rozdílu: s výpůjčkou nebo s přetečením	https://github.com/tisnik/8bit-fame/blob/master/gcc-builtins/addc_subc.asm

20. Odkazy na Internetu

GCC documentation: Extensions to the C Language Family
https://gcc.gnu.org/onlinedocs/gcc/C-Extensions.html#C-Extensions
GCC documentation: Using Vector Instructions through Built-in Functions
https://gcc.gnu.org/onlinedocs/gcc/Vector-Extensions.html
SSE (Streaming SIMD Extentions)
http://www.songho.ca/misc/sse/sse.html
Timothy A. Chagnon: SSE and SSE2
http://www.cs.drexel.edu/~tc365/mpi-wht/sse.pdf
CPU design (Wikipedia)
http://en.wikipedia.org/wiki/CPU_design
GCC Compiler Intrinsics
https://iq.opengenus.org/gcc-compiler-intrinsics/
Other Built-in Functions Provided by GCC
https://gcc.gnu.org/onlinedocs/gcc/Other-Builtins.html
GCC: 6.60 Built-in Functions Specific to Particular Target Machines
https://gcc.gnu.org/onlinedocs/gcc/Target-Builtins.html#Target-Builtins
Stránka projektu Compiler Explorer
https://godbolt.org/
The LLVM Compiler Infrastructure
https://llvm.org/
GCC, the GNU Compiler Collection
https://gcc.gnu.org/
Clang
https://clang.llvm.org/
Clang: Assembling a Complete Toolchain
https://clang.llvm.org/docs/Toolchain.html
Integer overflow
https://en.wikipedia.org/wiki/Integer_overflow
SETcc — Set Byte on Condition
https://www.felixcloutier.com/x86/setcc
The ARMv8 instruction sets
http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.den0024a/ch05s01.html
A64 Instruction Set
https://developer.arm.com/products/architecture/instruction-sets/a64-instruction-set
Switching between the instruction sets
http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.den0024a/ch05s01.html
The A64 instruction set
http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.den0024a/ch05s01.html
Introduction to ARMv8 64-bit Architecture
https://quequero.org/2014/04/introduction-to-arm-architecture/
Undefined behavior (Wikipedia)
https://en.wikipedia.org/wiki/Undefined_behavior
Is signed integer overflow still undefined behavior in C++?
https://stackoverflow.com/questions/16188263/is-signed-integer-overflow-still-undefined-behavior-in-c
Allowing signed integer overflows in C/C++
https://stackoverflow.com/questions/4240748/allowing-signed-integer-overflows-in-c-c
SXTB, SXTH, SXTW
https://www.scs.stanford.edu/~zyedidia/arm64/sxtb_z_p_z.html
BX, BXNS
https://developer.arm.com/documentation/100076/0200/a32-t32-instruction-set-reference/a32-and-t32-instructions/bx–bxns?lang=en
Carry and Borrow Principles
https://www.tpub.com/neets/book13/53a.htm
In binary subtraction, how do you handle a borrow when there are no bits left to borrow form
https://stackoverflow.com/questions/68629408/in-binary-subtraction-how-do-you-handle-a-borrow-when-there-are-no-bits-left-to

Seriál: Vývoj her a grafických dem pro platformu PC

Algoritmus CORDIC a numerické formáty s pevnou řádovou čárkou
Funkce vestavěné v GCC pro provádění nízkoúrovňových aritmetických operací
Generátor náhodných čísel založený na instrukcích RDSEED a RDRAND

Přečtěte si všechny díly seriálu Vývoj her a grafických dem pro platformu PC nebo sledujte jeho RSS

Neutrální ikona do widgetu na odběr článků ze seriálů

Zajímá vás toto téma? Chcete se o něm dozvědět víc?

Objednejte si upozornění na nově vydané články do vašeho mailu. Žádný článek vám tak neuteče.

Vstoupit do diskuse (28 názorů)

Pavel Tišnovský

Vystudoval VUT FIT a v současné době pracuje na projektech vytvářených v jazycích Python a Go.

Témata:

Co konkrétně myslíš? To, že odstranili VLA, které bylo přidáno jako velká novinka do C99 a které do jazyku typu C prostě vůbec nezapadá? On je problém v tom, že moderní C v některých oblastech prostě použít nejde, není tam překladač nebo vůbec snaha přejít na jiný překladač. A i kdyby, prostě původní kód zůstane (a možná - když už překopávat, tak úplně do jiného jazyka)

atarist

Sdílet

Obsah

1. Funkce vestavěné v GCC pro provádění nízkoúrovňových aritmetických operací

2. Operace součtu s detekcí přetečení

3. Způsob překladu operací součtu do strojového kódu

4. Funkce __builtin_add_overflow se shodnými typy sčítanců i výsledku součtu

5. Překlad obecné funkce __builtin_add_overflow na platformě x86–64

6. Analýza vygenerovaného strojového kódu pro platformu x86–64

7. Překlad obecné funkce __builtin_add_overflow pro 32bitové ARMy

8. Analýza vygenerovaného strojového kódu pro platformu ARM32

9. Překlad obecné funkce __builtin_add_overflow pro 64bitové ARMy (AArch64)

10. Analýza vygenerovaného strojového kódu pro platformu AArch64

11. Chování funkce __builtin_add_overflow, pokud mají sčítance i výsledek součtu odlišné typy

12. Demonstrační příklad: součet s využitím různých kombinací hodnot typu char a int

13. Operace rozdílu s detekcí přetečení

14. Demonstrační příklad: volání funkce __builtin_sub_overflow

15. Překlad volání funkce __builtin_sub_overflow na platformě x86–64

16. Operace součinu s detekcí přetečení

17. Vestavěné funkce realizující součet tří hodnot s přetečením a rozdíl tří hodnot s výpůjčkou

18. Demonstrační příklad: operace součtu tří hodnot a operace rozdílu tří hodnot

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

Algoritmus CORDIC a numerické formáty s pevnou řádovou čárkou