Názory k článku
Z jádra 6.0 byla odstraněna optimalizace -O3 pro architekturu ARC

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

11. 8. 2022 17:16

MSBOSS

Opět si připomeňme:
Podpora efektivní optimalizace pro nesymetrické procesory Alder Lake byla přidána až v GCC12 a nenašel jsem zmínku, že by to backportovali do GCC 11.2. E-jádra mají společnou L2 cache pro více jader (a jinak velkou), jinak velkou L1 cache, neumí AVX512 (pravda, P-jádra ho mají taky vypnuté). Takže výkon na jednom typu jader bude na GCC 11.2 vždy trochu trpět.

Zde srovnání z Phoronixu GCC 11.2 a GCC12 s -O3 -march=native. Mimochodem stejný odkaz jsem už dával pod pár týdnů starý článek od p. Ježka ohledně -O3 pro kernel. Jaký je rozdíl mezi verzemi bez march=native, jsem nenašel.

https://www.phoronix.com/review/gcc-12-alderlake
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 8. 2022 17:20

MSBOSS

Jenom co jsem tím chtěl říct - berte testy na nesymetrických architekturách trochu s rezervou. Zatím to není ještě úplně doladěná oblast pro běžné použití, takže se v kompilátorech ještě řeší, jak se s tím popasovat.
Osobně by mě zajímalo, jestli se kompilují všechny funkce a kód 2x pro oba typy jader a nějak se za běhu rozhoduje, jaký kód má běžet na kterém jádru nebo jak to ty optimalizace dělá...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 8. 2022 23:56

RDa

Rekl bych ze optimalizace na velikost cache nejde uplne delat.. ta cache ma i dulezitejsi parametry nez jenom svoji velkost. Treba asociativitu, tj. kolika-cestna ta cache je.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2022 0:55

Jakub Štech

Ten patch jen doplňuje ceny různých instrukcí, operací, konstrukcí na nové generaci, aby se optimalizační heuristika líp trefovala. IIRC ten problém byl, že GCC 11 to kompiloval pro ta silnější Golden Cove P-jádra, která mají mimo jiné silně out-of-order execution (512 instrukcí), takže kompilátor nedělá instruction scheduling, nebo aspoň ne tak agresivně, protože počítá s tím, že to udělá procesor. Jenže ty Gracemont E-jádra mají reorder buffer jenom 256 instrukcí dlouhý, takže to u větších celků (funkcí, těl smyček) žerou v naivním pořadí, pipeline se občas zastaví (stall), protože se zbytečně čeká na věci.

Dělat to jak píšete by znamenalo překopání jak vůbec ELF binárky fungují. Každá funkce by musela mít wrapper, který by skočil do jedné nebo druhé varianty podle toho, na jakém jádře to zrovna sedí. A nebo by se při každé migraci procesu z jádra na jádro musela patchnout nějaká vtable, přes kterou by všechna volání funkcí musela jít (což není zadarmo). A nějak by se muselo zabránit migraci, když to zrovna v nějaké optimalizované funkci je. Dneska to ty plánovače přehazují z jádra na jádro i podle teploty, proces se tam doslova ani neohřeje a už ho pakuje :-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2022 14:44

cc

Ono to může být i tím, že nějaká zajímavá instrukce je třeba na tom úsporném jádrě o hodně pomalejší - to, že CPUID říká, že nějaké rozšíření jsou k dispozici ještě úplně neznamená, že je tak výhodné je použít. Ryzeny třeba taky mají PDEP/PEXT (BMI2), ale jsou v mikrokódu a místo 2 cyklů (Intel) trvají 14.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
12. 8. 2022 14:30

cc

Ty jsi úplně mimo mísu, víš vubec něco o compilerech?

GCC ti na nějakou velikost cache úplně kašle. Problém není ani v té nesymetrické architektuře. Radši se k tomu příště nevyjadřuj :)
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Názory k článku Z jádra 6.0 byla odstraněna optimalizace -O3 pro architekturu ARC

Dále u nás najdete

Drony ve Stockholmu budou zachraňovat životy

Itálie má dvě pasti, které už se těší na řidiče mířící na olympiádu

Strojové učení slibuje rychlejší a levnější vývoj baterií

Česká jablka jsou plná pesticidů, ukázal test. Ovocnáři se bouří

Víte, proč byste si měli nechat vyšetřit játra?

Mecha Comet: modulární kapesní počítač s výměnnými prvky

LibreOffice 26.2 vylepšuje kompatibilitu s MS Office

Od vize k výsledkům: Pět pater, která vám srovnají priority

Problémy s lymfou trápí spíš ženy, projevuje se otoky

Začínající podnikatel: Přijímáme zaměstnance

30 % nákladů díky AI dolů, ale nuda v práci jde nahoru

Začínající podnikatel: Základní termíny a marketing

Miliony webů nesplňují zákon o přístupnosti. Jaký hrozí trest?

Digitální squatting je na vzestupu, podvodníci cílí na velké značky

Bitcoinová burza omylem rozdala 40 miliard dolarů

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

České firmy pod náletem kyberútoků. Počet vzrostl o pětinu

Máte plné zuby AI? Firefox má řešení

Divný hrnec, záhadný projektor. Tipněte si, na co se používaly

Agentické nakupování mění pravidla e-commerce

Názory k článku
Z jádra 6.0 byla odstraněna optimalizace -O3 pro architekturu ARC