Vlákno názorů k článku Podpora numerických hodnot typu quadruple-precision floating-point v GCC od judovana - Koukam aarch64 to nativne zda se taky nema....

Článek je starý, nové názory již nelze přidávat.

4. 3. 2026 16:51

judovana

Koukam aarch64 to nativne zda se taky nema. Ale pisou "emulovano softwareove", cimz zda se nemysli microcode. Tak uz jsem plne zmatenej a vede vlastne k te me prapuvoidni otazce... @tisnik , nedelej mrtvyho brouka!-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 3. 2026 16:59

Pavel Tišnovský

Zlatý podporovatel

Zdar, no my taky musíme pracovat, na rozdíl od vás ve Velké modré :-)

Je to takto: ten typ __float128 je podporovaný z pohledu C (!!!) jen na některých platformách, ale patří sem i Intel, ARM i RISC-V (takže většina světa je s tím v pohodě, na druhou stranu to ovšem nepojede řekněme na M68k). Ovšem podpora v tomto kontextu znamená, že to můžeš použít ve zdrojácích. Interně se to bude počítat čistě v SW voláním subrutin (to bylo v tom assemblerovským výpisu). Pokud vím, tak jen na RISC-V je ten typ podporovaný nativně, tj. například __float128+__float128 se přeloží do jediné instrukce.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 3. 2026 17:03

Ladis

Ono taky se už pár let neprogramuje v assembleru. Takže proč prodražovat hardware. Mimochodem zrovna ARM už v počátcích řešil to, že kompilace C/C++ prokládala load operace s ostatními, protože trvaly 2 cykly, tak aby byly "za jeden cykl" tím, že je udělá o 1 cykl dopředu. Tedy už v počátcích ARMu by musel assembler programátor řešit věci specifické pro danou platformu (tehdy aby měl výkon). x86 je víc highlevel a nemusel a víc toho řešil sám uvnitř v mikrokódu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 3. 2026 18:06

Pavel Tišnovský

Zlatý podporovatel

Ta podpora nemá až tak moc s assemblerem moc společného, řekl bych. Spíš se nikdo nenamáhal s přenosem těch subrutin na méně používané platformy.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 3. 2026 13:53

judovana

Mene podporovane platformy? jako intel a aarch64?-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 3. 2026 13:57

Pavel Tišnovský

Zlatý podporovatel

vsak jsem o 2 komenty vyse psal, ze tam je to v C podporovany. Ze ty vypocty bezi v SW je vec jina, ale z cecka to zavolas.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 3. 2026 21:11

PEAK

x264
x265
x266
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 3. 2026 21:10

PEAK

Big Blues
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 3. 2026 1:14

radioing

Je to emulovano softwarove, mikrokod x86-64 toto aktualne neda ze dvou duvodu: za prve na to nejsou k dispozici/v dosahu 128 bit registry (rax atd. nejdou skladat po dvojicich, FPU ma 80 bitu, SSE... nejsou dotazene k FPU) a za druhe FPU aritmetika je 80bitova a jeji rozsireni na 128 by potrebovalo docela dost kremiku navic (predevsim gon. fce apod.) - mikrokodem rozsirena presnost mantisy je vzhledem k moznostem mikrokodu nerealna.
SW emulace napr. v gcc pouziva libquadmath knihovnu, kde funkce sleduji pattern:
1. Natahnuti operandu z pameti do dvojic 64-bit registru (treba rdx:rax)
2. Dekompozice znamenkoveho bitu, exponentu a mantisy v prac. registrech
3. Provedeni operace (treba u scitani komparace exponentu, shift mantisy, soucet, vypocet exponentu, normalizace
4. Repack znamenka, exponentu a mantisy do 128 bitu
5. Ulozeni do pameti
Treba takova sw emulace i jen scitani __addtf3(__float128, __float128) se vsemi pozadovanymi zaokrouhlenimi, NANy, +/- zero atd. spotrebuje nekolik set instrukci, takze muze byt az cca 100x pomalejsi nez double add v FPU.
Jeste horsi je to u goniometrickych funkci, kde je to postaveno na tabulkach a vypoctu Cebysevovych polynomu (a tady to dost brzdi docela dost soucinu 128bit * 128bit).
Ale existuji i ruzne "triky", např. takova odmocnina si prvni odhad vypocita v FPU v double a zbytek se dojede iterativne Newton-Raphsonem.