Vlákno názorů k článku Zpracování hodnot typu half float (fp16) na platformě AArch64 od atarist - Kde se to používá? HF jsem viděl u...

Článek je starý, nové názory již nelze přidávat.

9. 9. 2025 8:57

atarist

Kde se to používá? HF jsem viděl u LLM a třeba na x86 to nebylo vůbec rychlejší než třeba "float" varianta. Na druhou stranu jsou i LLM s bajtovými váhami (ale nevím, jak to funguje vevnitř).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 9. 2025 19:06

Pavel Tišnovský

Zlatý podporovatel

Pro embeddings. Tam je AArch64 úplně super. Samozřejmě ne tak rychlý jako GPU, jenže GPU jsou v čmoudu drahé/nejsou k dispozici, takže si na to beru vždycky mašinu s AArch64 a pomalejší x86-64 nechám pro ostatní (asi s Windows :-). Taky se s tím dají přežít SW-only LLM s half-float (tedy záleží na tom, na co, ale někdy fakt není GPU k dispozici).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 0:55

bindiff

Mimo neuronové sítě se používá v grafice, ikdyž je fakt, že většinu toho desktopový SW počítá na GPU, kde ARM nejspíš nepoběží. ;) Na druhou stranu, hodí se to třeba na MCU, který bere obraz z kamery a potřebuje provést nějaké zpracování – rozsah 8bitového integeru se do half-floatu vleze bez potíží a navíc si program může dovolit používat výrazně větší dynamický rozsah bez toho, aby hrozilo přetečení celočíselného typu.

Další oblast je zpracování jiných signálů, například data ze senzorů – přesnost half-floatu by mohla postačovat například na zpracování dat z akcelerometru, senzoru osvětlení, …

Pak mě napadá zvuk. Ale převod z 16bitového floatu do 16bitového integeru vypadá dost bolestně…
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 15:23

Pavel Tišnovský

Zlatý podporovatel

to mi připomnělo, že s typem half float jsem se poprvé kdysi setkal v Cg a později v HLSL (jazyky pro psaní shaderů).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 9. 2025 18:55

bindiff

Já pro změnu v GLSL. Při výpočtech barev na GPU se half-floaty fakt hodí, protože barvy typicky není potřeba počítat přesně, narozdíl od transformací.

Vzhledem k tomu, že NEON, narozdíl¹ od x87, (předpokládám) provádí pro half-floaty jednodušší výpočty, to zrychlení se může hodit. Bylo by zajímavé řešit s NEONem renderování 3D objektu na MCU (bez GPU). Jako use-case si představuji třeba náhled modelu² před tiskem na 3D tiskárně.

¹ Na x87 se floaty počítají vždy 80bitově (tzn. ještě širší než double), na požadovanou délku se ořezávají až při ukládání. SIMD instrukce na x86 to už mají jinak. (Jestli to je implementováno opravdu na méně cyklů netuším.)

² Ikdyž, náhled se daleko snáz dělá ze STL(-like) souboru, ale k tisku je potřeba ho naslajsovat, typicky do G-code příkazů. Ty je už trošku problém vykreslit vystínované a přitom efektivně.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Zpracování hodnot typu half float (fp16) na platformě AArch64 od atarist - Kde se to používá? HF jsem viděl u...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Agentické nakupování mění pravidla e-commerce

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Malware, ransomware a další online hrozby: Jak se liší?

Spropitné v restauracích se nebude muset danit ani evidovat v EET

Desítky rozšíření pro Chrome kradou uživatelská data

Příspěvek na produkty spoření na stáří a daň z příjmů

Strojové učení slibuje rychlejší a levnější vývoj baterií

Sophos kupuje Arco Cyber, zpřístupní CISO organizacím

Notepad++ opravil chybu zneužívanou k šíření malware

Plánované změny v penzích: Zjistili jsme další podrobnosti

Ještě mi nevrátili peníze za Markétu a už je tu EET zas

AI se snaží promlouvat i do stavebnictví

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

Stát dá svobodu důchodcům, které držel ve III. pilíři

Google uvádí Gemini 3.1 Pro a přidává působivé benchmarky

Sailfish OS na Sony Xperia 10 III: seznámení a instalace

Počet nových pracovních míst prudce klesá

Školkovné se vrací. S jakou obměnou?

Proč mají vysavače mikrofony? Omylem ovládl tisíce vysavačů DJI

U dědečkova stavu našla smysl a teď oživuje unikátní tkaní