Vlákno názorů k článku Raspberry Pi 4B: 64bit či nebýt – to je otázka od Milan Keršláger - Ani na PC neznamenal přechod z 32 na...

Článek je starý, nové názory již nelze přidávat.

4. 11. 2019 8:35

Milan Keršláger

Ani na PC neznamenal přechod z 32 na 64 bitů zrychlení, bylo to maximálně o pár procent, spíše plichta. 64bitový kód je totiž řidší, více prostorově náročný, což znamenávětší nároky na RAM i na přenosy z/do disku/flash. Přínos je hlavně v přímém/jednoduchém přístupu ke větší RAM.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 8:50

Fík

Zlatý podporovatel

No to záleží, co testujete, ale často byl přínos značný a ne jen pár procent. Třeba tu:

https://www.phoronix.com/scan.php?page=article&item=ubuntu-1710-x8664

namátkou:
FFTW +30%
cray +25%
ffmpeg +11%
openssl 4,4x
redis +40%
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 8:56

Milan Keršláger

Jenže to jsou bohužel jen specifické testy na konkrétní strojové instrukce (veskrze matematika). Zkuste si najít výsledky z běžného používání, dělali to lidé kolem distribucí, tam právě po zahrnutí ostatních vlivů byl přínos minimální (a jinde - např. zjednodušení práce s pamětí, viz např. Chrome).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 9:41

Fík

Zlatý podporovatel

Nevím, jaké výsledky běžného používání máte na mysli, ale když se kolem roku 2005 pomalu začínalo s přechodem na 64 bitů, tak občas nějaký program byl ve 32 bitech výrazně rychlejší než v 64. Bývalo to většinou tím, že v x86 byla část optimalizovaná v assembleru a to pro x86_64 zatím nebylo. Proto jsem dal testy až z roku 2017, kdy už byl tento nedostatek odstraněn.

Jinak je asi všem jasné, že u aplikace, která nepoužívá matematiku, vystačí si dohromady s pěti registry a celou dobu čeká na periferie nebo uživatele, těžko můžu očekávat nějaké zrychlení.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 10:42

radioing

Tak, tak. Dosáhnout podstatného zrychlení na ARM72 při přechodu z AArch32 na AArch64 je docela potíž a přesně jak je uvedeno výše, daří se to dobře právě u těch "specifických testů". Programátor zkrátka musí v kódu jít naproti novým možnostem, a v případě AArch64 je to především navýšení počtu registrů na dvojnásobek. Kompilátor také ledacos dokáže, ale pokud je algoritmus zapsán tak, že vystačí s pár 32bitovými registry (a přitom by nad 20 64bitovými registry mohl být podstatně rychlejší), je kompilátor/AArch64 mimo hru. Mimochodem, AArch64 má stejně jako AArch32 32bitovy opkód. Thumb sada je samozřejmě poněkud úspornější.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 11:54

ded.kenedy

Jinak je asi všem jasné, že u aplikace, která nepoužívá matematiku, vystačí si dohromady s pěti registry a celou dobu čeká na periferie nebo uživatele, těžko můžu očekávat nějaké zrychlení.

Delani matematiky ala FFT nebo lin. algebra neni jediny zpusob, jak intenzivne pouzivat CPU.

Hlavni problem je s pointery. Pokud mas grafove algoritmy, strom objektu (coz mi prijde v programovani jako mnohem beznejsi nez dilci matematicke ulohy), tak diky 2x vetsim pointerum se ti do cache vejde (priblizne) polovina uzlu nebo objektu a to uz jde poznat na vykonu a vic registru moc nepomuze. Mne to na nekterych ulohach delalo i 30% pokles.
4. 11. 2019, 11:56 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 12:30

Fík

Zlatý podporovatel

Záleží asi co komu přijde běžnější :) Kvůli pointerům bylo vymyšleno i speciální x32 ABI, ale jelikož se neprosadilo, tak ty pointery nakonec až takový problém zřejmě nejsou.

https://en.wikipedia.org/wiki/X32_ABI
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 12:44

ded.kenedy

Kvůli pointerům bylo vymyšleno i speciální x32 ABI, ale jelikož se neprosadilo, tak ty pointery nakonec až takový problém zřejmě nejsou.

Ano, a bohuzel se nikdy nedostalo z faze "zajimava hracka", protoze podpora pro toto ABI byla miziva, zejmena na strane knihoven a nastroju.

Na druhou stranu, treba JVM pouziva komprimovane (32bitove) ukazatele prave z mnou popsanych duvodu. A tady se opravdu neda mluvit o tom, ze by se to nepouzivalo.

Záleží asi co komu přijde běžnější :)

Ony se prestaly pouzivat objektove orientovane jazyky?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
4. 11. 2019 14:56

mhi

Jestli by resenim 64bit aplikaci nebylo pouzivat pointery pres tabulku pointeru. Obvykle nepotrebuju mit 4GB dat ruzne rozhazenych, ale urcite struktury "patri k sobe". Takze bych mel malou tabulku variabilne dlouhych pointeru, do ktere bych indexoval. Tabulka by byla asi relativne mala a relativni vuci svemu offsetu (resi ze v ramci +-2G heap se vejdu do 32 bitu). Pri propojeni s alokatorem by to mohlo byt i vcelku bezudrzbove z pohledu programatora. Slozite resitelne u C, mene slozite u nejakeho C++ a u jazyku typy Java/C# asi trivialni.

Podobny mechanismus jsem videl u embedded prekladace PowerPC ISA, kdy kvuli uspore pameti (z 32 na 16 bitu) byly pouzity urcite globalni registry na adresaci dat v RAM a flash, nicmene tam to bylo mozne z duvodu chytreho navrhu (struktura byla navrzena tak, aby to nepreteklo).

U PowerPC bylo chytre i resnei 64bit cisel, 32bitovy a 64bitovy kod se v podstate nelisily, rozdil byt pouze v moznosti naloadovat hornich 32 bitu a pak jestli ALU pocita 32bitove nebo 64bitove (flagy, mul/div).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2019 10:32

jdsulin

Zrovna u grafovych algoritmu si hezky muzes udelat prvky treba v std::vector ,takze je mas vsechny pekne v jednom miste pameti a indexovat je jak chces klidne pomoci 32bitu, ale chapu, ze nejake 64bit programy by si vystacily s 32bit pointery. Kdyz to zjednodusim, tak pri prechodu byly vyhody 2 -> muzes indexovat vice pameti, proto programy, ktere potrebovaly vice bud neexistovaly nebo pouzivaly pseudoswap a tim padem prechod na 64bit byl pro ne naprosto skvela vec a druha vec - pro kompilery jistota registru a vlastnosti CPU.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2019 12:00

ded.kenedy

Zrovna u grafovych algoritmu si hezky muzes udelat prvky treba v std::vector ,takze je mas vsechny pekne v jednom miste pameti a indexovat je jak chces klidne pomoci 32bitu

Tomu se bezne rika knizeci rady. Uprimne me prekvapilo, ze s touto dobrou radou prisel nekdo az po dvou dnech.

Kdyz mas totiz program, ktery je naprogramovany beznym zpusobem (pouziva pointery tam, kde to je na miste) a ktery je odladeny a otestovany, a ktery na nove architekture bezi pomaleji, protoze spatna prace s cache, tak ti hodne pomuze, kdyz vis, ze neni problem v nove architekture, ale v tom, ze jsi to jeste neprepsal tak, aby to bezelo rychleji. Proboha, bavime se tu celou dobu o tom, ze prechod 32->64 bitu nemusi znamenat automaticky prinos.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2019 1:03

ByCzech

tak občas nějaký program byl ve 32 bitech výrazně rychlejší než v 64

To je pravda, ale stávalo se to hlavně na prvních 64 bit Intelech. Na AMD byla situace při přepnutí na 64 bit režim jiná.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2019 7:23

Milan Keršláger

Doporučuji vzít 32bit Raspberry a vyzkoušet/změřit běžný provoz na 64bit verzi. Kromě výše jmenovaných (např. SSL, kódování videa) podstatné zrychlení nenajdete.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
5. 11. 2019 23:09

radioing

Když ono je to urychlování těžké. "Běžnému" kódu bez programátorské péče trochu pomůže jen to zvýšení počtu registrů, když se opravdu dají zužitkovat. Pokud se programátor cíleně zaměří na vybrané algoritmy, tak je nakonec často výhodnější použít SIMD (např. FFT), a když přesto chce použít instrukční sadu jádra, tak zjistí, že spousta algoritmů zcela logicky ctí předpokládaný mainstream hardware v době svého vzniku (namátkou AES - matice 4 x 4 x bajt, ChaCha matice 32bitových slov,...), takže rozšíření operandů z 32 na 64 bitů bez nějaké minimální podpory ve smyslu SIMD (třeba alespoň rozdělení 64bitových registrů na 2 32bitové) má přínos nula.
Osobně jsem zažil vše od 4bitů (vynechávám dřevní 1bitové řezy, které jsem pouze viděl) přes slavnou éru 8bitů, přechodné období 16bitů (86/286, 80166, MSP430; ale ta krása moci pracovat přímo v rozsahu 65536 diskrétních hodnot, což bohatě stačilo na téměř všechny aplikace) po éru 32bitů (ve 4 mld. úrovních už lze vyjádřit snad vše a po uint64_t jsem sáhl opravdu výjimečně, když dynamika aritmetiky těsně vyjela nad 32 bitů, abych ji vzápětí zkrotil posunem vpravo). S 64bit. registry si nějak nevím rady. Občas se to hodí, když třeba prohledávaný prostor vyteče z 32bitů a algoritmus je nutné z důvodu rychlosti udržet v registru, ale jinak... Adresovací možnosti jako spíše embeďák nějak nedokážu ocenit a 64bitové pointery ve mně vyvolávají asociace, jako když jsme v automatizovaných splachovačích záchodů nahrazovali staré dobré 8051 ARMy (nadsázka).
Posun 32 bitů -> 64 bitů core je zásluhou nedostatečného adresového prostoru, a nikoliv hladu po větším rozsahu operandů - je to sice příjemný side-effect, ale na to tu už nějaké roky bylo mocnější SIMD. Tomu pak odpovídá i urychlení vykonávání kódu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2019 10:40

jdsulin

Presne tak, na druhou stranu takove aplikace, ktere potrebuji adresovat vice nez 4 GB existuji. A jeden z pripadu pouziti je OS - jasne mame tu PAE, ale to neni v mnoha ohledech idealni. A aplikace si porad muzes psat v 32 bitech.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 11. 2019 11:05

JSH

Mít obrovský virtuální adresový prostor se dá občas zajímavě využít. Třeba si rezervovat veliké pole a postupně mu pak přidávat stránky místo realokování a přesouvání. Ale je to spíš specialitka.

Vlákno názorů k článku Raspberry Pi 4B: 64bit či nebýt – to je otázka od Milan Keršláger - Ani na PC neznamenal přechod z 32 na...

Dále u nás najdete

Důchody 2026: Jak vypočítat, o kolik vám vzroste penze?

Kolik bude stát snížení záloh OSVČ? Každý tvrdí něco jiného

Pětina lidí leží v nemocnicích zbytečně, ale není je kam přemístit

Legitimní weby jsou zneužívány k manipulaci prohlížečů

Jak funguje platforma IBM Power11?

Bionáplast pomáhá s hojením bércových vředů

ChatGPT rozšiřuje prostor pro spolupráci

Babišův střet zájmů potvrdil soud, Agrofert už přišel o stovky milionů

Stop nákupům, start pomoci: je tu Giving Tuesday

Samořídicí vozítka začala doručovat jídlo v pražském Karlíně

Nové zákony s účinností od roku 2026 pro zaměstnavatele

Česká televize chystá projekt Tak moment pro mladé

Zdravotní pojišťovny přispějí na sport, prevenci i helmu na lyže

Nemocenská 2026. Spočítali jsme, kdo dostane za marodění víc

Vzniká nová aplikace PID Lítačka, co se mění?

Datové schránky se budou stěhovat a projdou redesignem

Zahraniční cestovní náhrady v roce 2026. 0smnást nových sazeb

Co nového přináší Securitytrends 4/2025?

Změny v sociálním pojištění v roce 2026 v oblasti zaměstnávání

Google do Androidu přidává další várku pozoruhodných novinek