Názory k článku Zpracování hodnot typu half float (fp16) na platformě AArch64

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

9. 9. 2025 8:57

atarist

Kde se to používá? HF jsem viděl u LLM a třeba na x86 to nebylo vůbec rychlejší než třeba "float" varianta. Na druhou stranu jsou i LLM s bajtovými váhami (ale nevím, jak to funguje vevnitř).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 9. 2025 19:06

Pavel Tišnovský

Zlatý podporovatel

Pro embeddings. Tam je AArch64 úplně super. Samozřejmě ne tak rychlý jako GPU, jenže GPU jsou v čmoudu drahé/nejsou k dispozici, takže si na to beru vždycky mašinu s AArch64 a pomalejší x86-64 nechám pro ostatní (asi s Windows :-). Taky se s tím dají přežít SW-only LLM s half-float (tedy záleží na tom, na co, ale někdy fakt není GPU k dispozici).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 0:55

bindiff

Mimo neuronové sítě se používá v grafice, ikdyž je fakt, že většinu toho desktopový SW počítá na GPU, kde ARM nejspíš nepoběží. ;) Na druhou stranu, hodí se to třeba na MCU, který bere obraz z kamery a potřebuje provést nějaké zpracování – rozsah 8bitového integeru se do half-floatu vleze bez potíží a navíc si program může dovolit používat výrazně větší dynamický rozsah bez toho, aby hrozilo přetečení celočíselného typu.

Další oblast je zpracování jiných signálů, například data ze senzorů – přesnost half-floatu by mohla postačovat například na zpracování dat z akcelerometru, senzoru osvětlení, …

Pak mě napadá zvuk. Ale převod z 16bitového floatu do 16bitového integeru vypadá dost bolestně…
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 15:23

Pavel Tišnovský

Zlatý podporovatel

to mi připomnělo, že s typem half float jsem se poprvé kdysi setkal v Cg a později v HLSL (jazyky pro psaní shaderů).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 18:55

bindiff

Já pro změnu v GLSL. Při výpočtech barev na GPU se half-floaty fakt hodí, protože barvy typicky není potřeba počítat přesně, narozdíl od transformací.

Vzhledem k tomu, že NEON, narozdíl¹ od x87, (předpokládám) provádí pro half-floaty jednodušší výpočty, to zrychlení se může hodit. Bylo by zajímavé řešit s NEONem renderování 3D objektu na MCU (bez GPU). Jako use-case si představuji třeba náhled modelu² před tiskem na 3D tiskárně.

¹ Na x87 se floaty počítají vždy 80bitově (tzn. ještě širší než double), na požadovanou délku se ořezávají až při ukládání. SIMD instrukce na x86 to už mají jinak. (Jestli to je implementováno opravdu na méně cyklů netuším.)

² Ikdyž, náhled se daleko snáz dělá ze STL(-like) souboru, ale k tisku je potřeba ho naslajsovat, typicky do G-code příkazů. Ty je už trošku problém vykreslit vystínované a přitom efektivně.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
10. 9. 2025 16:27

PEAK

OpenEXR
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 14:25

Pavel Tišnovský

Zlatý podporovatel

jj tam to taky používají, díky za doplnění
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 0:48

bindiff
Článek tvrdí, že mantisa má 10 bitů (z toho je počáteční jednotka implicitní, předpokládám, takže vlastně 11 bitů) a přitom přesnost je dle článku 5–6 číslic. To se do mantisy nemá šanci vejít: Přesnost v číslicích spočítáme jako log₁₀ 2⁽¹⁺¹⁰⁾ ≈ 3.311. Takže přesnost je 3 „až 4“ číslice.

Hodnoty ve výpočtu:

₁₀ jakožto základ logaritmu – číselná soustava, pro kterou počítáme počet číslic

2 – číselná soustava čísla v paměti

1+10 – jedna implicitní číslice (= bit) mantisy + 10 bitů zapsaných
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 4:51

Marek

Oprášil jsem svůj starý kód a upravil jsem ho na 16bit floaty. Ano, nejmenší hodnota mantisy je 0.0009765625, to je 1/(2^10). Takže přesnost je zhruba 3-4 cifry. Moje aplikace je k dispozici na webu: https://marekknapek.github.io/half/#?n=0x01
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 14:28

Pavel Tišnovský

Zlatý podporovatel

jj je to tak, opravil jsem to
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 18:57

bindiff

Já děkuji za pěkný článek. Je to další věc po Pokročilých assemblerech na FIT VUT, co mě nakopla k tomu si někdy důkladně(ji) pohrát s ARMem.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 0:57

bindiff

Za zmínku stojí také to, že ARMy umí používat rozšířený rozsah o hodnotu exponentu 31, která by jinak značila ±∞/NaN. Takže se dostáváme na hodnoty až ±131008.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 8:45

cc

Pokud vím tak toto je jen pro konverzi z alternativní fp16 reprezentace do fp32 a fp64, ale nemá to vliv na fp16 operace.
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Názory k článku Zpracování hodnot typu half float (fp16) na platformě AArch64

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Začínající podnikatel: Základní pojmy z účetnictví

OSVČ senioři letos v přehledech uplatní slevu na pojistném

Malware, ransomware a další online hrozby: Jak se liší?

Hledala dokonalý šálek, našla životní vášeň a učí pít kakao

Špionáž v Googlu a phishing na Signalu

Pálení žáhy zhoršuje nevhodná večeře. Vadí přejídání i kafe

Bitcoinová burza omylem rozdala 40 miliard dolarů

Kdo se bude moct vyhnout EET a co bude muset splnit?

Sophos kupuje Arco Cyber, zpřístupní CISO organizacím

Notepad++ opravil chybu zneužívanou k šíření malware

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

Lidé si mohou nechat zdarma vyšetřit znaménka, zrak i cukr

EET není český výmysl. Zjistěte, kde za účtenku můžete vyhrát auto

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Miliony webů nesplňují zákon o přístupnosti. Jaký hrozí trest?

Plánované změny v penzích: Zjistili jsme další podrobnosti

Ve firmách se pořád věří jediné „pravdě“ z dat. A to je problém

Navazující a souběžná zaměstnání pro účely JMHZ

Na dotace na zateplení zapomeňte. Nová vláda vykleští NZÚ

Registrace zaměstnance od 1. dubna 2026 pro účely JMHZ