Vlákno názorů k článku
Výkon experimentálního Ubuntu sestaveného pro x86-64-v3 od RDa - To se dalo cekat - ono AVX2 na...

Článek je starý, nové názory již nelze přidávat.

28. 12. 2023 12:45

RDa

To se dalo cekat - ono AVX2 na modernim cpu neprinasi tolik uzitku - je to proste draha sranda - protoze to snizuje maximalne dosazitelne takty.

Smysl by to melo u AVX2 only aplikaci, ktere tyhle instrukce budou vyuzivat velice huste - ne u operacniho systemu, kdy je uziti velice ridke, a rekl bych ze v pripade gcc/stdlib omezene temer na obycejne memcpy/memset. A to jsou spis servisni funce, nez samotne jadro aplikaci.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 13:13

CPU

Co říkáš neodpovídá dosaženému zrychlení.
Ber to tak, že AVX2 je z roku 2013 a nemusíš tedy řešit rozdíly ve vývoji do té doby. PŘÍČINA ZRYCHLENÍ tak bude nejspíš v odstranění hromady obezliček pro "před AVX2" procesory z výsledného kódu a další "na první pohled nepodstatné" záležitosti.

Prostě nemusíš řešit, jestli a kterou subvariantu AVX máš k dispozici, nebo jestli musíš emulovat dolů na SSE/FMA(E), protože máš k dispozici AVX2 a moderní procesor.

Další benefity budou na té straně, že postupně dochází k rozšíření registrů, kdy na starších procesorech prostě nebylo vždy úplně jasné, jestli lze rozšířené registry použít, jestli v CPU vůbec jsou. x86-64-v3 ti jasně definuje: AVX, AVX2, BMI1, BMI2, F16C, FMA, LZCNT, MOVBE, XSAVE

Je pravda, že x86-64-v4 se týká už jen 512 bitových registrů (AVX512F, AVX512BW, AVX512CD, AVX512DQ, AVX512VL) a není jasné, jestli by to vůbec nějaký přínos mělo. Možná asi ani ne.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 13:54

RDa

Nevim kde beres pocit ze to neodpovida zrychleni - proste v beznem kodu je X procent memcpy, a ted je tento kod 2 krat rychlejsi, takze celkovy prinos je X/2 procent vykonu navic.

Zadna distribuce neresi subvarianty ani emulace / nahrazky.

Vzdy je to skompilovany optimalne, vuci urcite urovni architektury. Tj bezne ubuntu bezi na nejakem minimalnim hw, a ta nova rekompilace pod nazvem x86-64-v3 ti vyzaduje hw s AVX2. Ani jedna z techto distribuci neresi runtime detekci.

A dalsi zminena nevyhoda AVX2 je dvakrat vetsi kontext, ktery se musi ukladat pri task switchu (otazka je, zda vzdy, nebo jen kdyz userspace pouzije tyhle instrukce).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 19:07

ja.

Runtime detekciu riesi glibc hwcaps. Pokial v systeme existuju binarky pre jednotlive mikroarchitektury, tak dynamicky linker natiahne tu optimalnu.

Takze nic nebrani mat -v2 pre starsie systemy, -v3 pre novsie a -v4 pre tych zopar, co maju AVX512 a vsetci mozu byt spokojni (okrem builderov, ktori musia skompilovat binarku 3x).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 12. 2023 10:45

mhi

Videl jsem pres nejake xMMn registry vyresene i slozitejsi operace nez je memcpy/memset. Ale ano, technicky slo o podobne operace. V cyklu se presouvala nejaka data a inicializovaly nejake promenne, ovsem ne do 'statickeho' vzorku.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 16:11

LD

x86-64-v3 je imho mnohem menší problém, než se zdá. Přechod na x86-64-v4 by byl, jelikož Avx512 nemá/nemělo spousta "aktuálních" cpu. Třeba do mobilních cpu je intel nedával a amd se dlouhou dobu avx512 vyhýbal obloukem. Navíc pokud si dobře pamatuji, tak použití avx512 bylo u intelu z počátku hodně energeticky náročné a kolidovalo s turbo boostem, takže možná ten přidaný výkon nakonec z hlediska spotřeby není o moc výhodnější.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 12. 2023 18:58

CPU

To rozhodně! Plus přínos by byl maximálně teoretický, to už je lepší skutečně optimalizovat aplikace nikoliv OS.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 12. 2023 23:49

Danny

Stříbrný podporovatel

U avx512 je tu jeste jista past :-) Platforma dva roky stara, zejo...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 1:41

Bez přezdívky:

Domnivam se, ze by asi bylo lepsi napsat jadro na Apple Mx a zahodit podporu x86 a x64, tim by se zvedl vykon v radu stovek procent. A neresit nejaky jednotky %.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 10:10

balkovic

>>Domnivam se, ze by asi bylo lepsi napsat jadro na Apple Mx a zahodit podporu x86 a x64, tim by se zvedl vykon v radu stovek procent. A neresit nejaky jednotky %.

Na procesor Tachyum Prodigy to optimalizovať, prečo sa obmedzovať na divnú architektúru od apple?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 19:25

Ladis

Ta "divná" architektura je ARM64 (AArch64). Normálně tam fungují binární balíčky z repozitáře Ubuntu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 22:44

balkovic

Tak načo to potom optimalizovať na apple bazmeg, keď vlastne netreba? Že by tam boli nejaké proprietárne výmysli, alebo čo?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 22:50

Ladis

Je to nabušený procesor, který si poradí - narozdíl od Cortexů - i s neoptimálním kódem. Takže není třeba moc optimalizovat. Ale i tak je Apple např. hlavním tahounem vývoje kompilátoru LLVM a těží z toho i ostatní zařízení s ARMem. Pokud jde o akcelerátory, Apple má narozdíl od AMD stejně kvalitní SDK jako třeba NVidie, takže pro vývojáře je to radost přidat podporu do svého software. AMD např. dodnes nemá funkční ani výpočty na GPU na většině jejich grafik. Natož nějaká podpora AI nebo enkódování videa.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 22:56

balkovic

>>Je to nabušený procesor, který si poradí - narozdíl od Cortexů - i s neoptimálním kódem

Takže optimalizovať na cortexy, kašlať na hacky kvôli apple a máme vyhrané. Cool nemám to rasberry pi 5 nadarmo :)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 22:57

Ladis

Tak Apple Silicon zvládne slušně i x86 kód, takže ano, většina vylepšení přidá výkon hlavně pro Cortex a trošičku pro M.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 22:50

Danny

Stříbrný podporovatel

To nemusi byt nutne proprietarni vymysly. I linuxovy kernel je plny errata a quirku k ruznym specifickym bugum konkretnich hardwarovych platforem. A proste to nechcete aplikovat plosne, kdyz by to melo degradovat vykon tam, kde to neni nutne.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 12. 2023 18:06

Ondra Satai Nekola

Zlatý podporovatel

Tak to se domníváš špatně.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Výkon experimentálního Ubuntu sestaveného pro x86-64-v3 od RDa - To se dalo cekat - ono AVX2 na...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Ke kuplířství nedocházelo, říká obžalovaný z kauzy Sex.cz

Chystá se EDU Rádio, které rodičům ušetří za doučování

Malware, ransomware a další online hrozby: Jak se liší?

Irsko se po pauze znovu otevírá pro výstavbu datových center

OSVČ senioři letos v přehledech uplatní slevu na pojistném

Na dotace na zateplení zapomeňte. Nová vláda vykleští NZÚ

V Evropě roste zájem o alternativu k Microsoftu, říká Petra Novotná

Výjimka z EET je nejmenším OSVČ k ničemu, hodí se ale podvodníkům

Domén s koncovkou .CZ přibývá, většina je podepsaných

Digitalizační masakr: stát chce data o zaměstnancích

Statistiky o ransomware, které jste asi neznali nebo si neuvědomili

Sophos kupuje Arco Cyber, zpřístupní CISO organizacím

Kdo se bude moct vyhnout EET a co bude muset splnit?

Školkovné se vrací. S jakou obměnou?

Plánované změny v penzích: Zjistili jsme další podrobnosti

Deset kroků pro maximální zabezpečení Google účtu

Navazující a souběžná zaměstnání pro účely JMHZ

Počet nových pracovních míst prudce klesá

AI jako soudce – zákon na prvním místě

Vlákno názorů k článku
Výkon experimentálního Ubuntu sestaveného pro x86-64-v3 od RDa - To se dalo cekat - ono AVX2 na...