Vlákno názorů k článku Monitorování procesů a správa paměti v JDK6 a JDK7 (2) od JVM != GCC -O3 - Tak ještě na závěr malé shrnutí. 1. Proč jsem...

Článek je starý, nové názory již nelze přidávat.

17. 1. 2011 12:57

JVM != GCC -O3 (neregistrovaný)

Tak ještě na závěr malé shrnutí.

1. Proč jsem sem psal něco s assemblerem. Nešlo o proovokaci, ani o výplod přeoptimalizovaného mozku:) Prostě jsem se jenom pozastavil nad ocitovaným blokem z článku, že přičítání/odčítání může být náročná operace.

A protože většinou JVM stejně běží na x86, tak jsem použil x86 instrukce, abych ukázal, že to tak být nemusí. Že je to v JVM implementováno jinak, to už je jiný topic.

2. Moderní procesory, a opět viz fakt, že JVM nejčastěji běží na x86, se snaží vykonávat kód dopředu. K tomu potřebují předpovídat skoky, jak už je vysvětleno někde v komentářích. Eliminace skoků, případně využití předvídatelných skoků proti cmov instrukcím/setbl konstrukcím ternárního operátoru pro 32bitů, je klíčem k rychlosti - viz způsob optimalizace ICC např. oproti GCC|MSVC. U bytecode se můžeme bavit jen o skocích, ale i tam to má (alespoň teoreticky) smysl.

Takže závěrečný příklad z praxe. Dostal se mi do ruky Deep-First Search napsaný v Javě se zbytečnými skoky. Když jsem ho doslova přepsal do C, tak bylo většinou rychlejší. Ale na některých datech, když cca méně než 20% uzlů vstupního grafu byly listy, tak byla Java rychlejší. Tady to má souvislost s jedním z komentářů, kde padnul názor, že je lepší psát tupý kód, který chutná překladači provádějícímu optimalizace.

A jak to pokračovalo dál? JVM evidentně dělalo runtime profiling a přepisovalo skoky podle naučené pravděpodobnosti. Jenomže tu se mohlo naučit jenom u těch cca méně než 20%. Takže Java se zbytečnými skoky začala po nějaké době dávat téměř stejné výsledky jako Java bez těch zbytečných skoků.

Když jsem vzal C program a odstranil všechny skoky, tj. podmínky, které tam nemusely být, tak Java na některých datech stále porážela C. Chápu, že něco takového vede některé lidi k úvaze, že JIT je lepší než GCC -O3.

Jenomže, když jsem využil znalost Branch Target Buffer procesoru a přidal podmínku, která tam nemusela být, tak už byl program z C vždy rychlejší než Java. Ve většině případů to urychlení bylo větší než 10x. (Ano, BFS běží ještě rychleji díky absenci rekurze.)

Plus, na řadě dat Javě došla paměť - a měla jí dost.

Takže závěr může znít: čas vynaložený na optimalizaci v Javě snadno může být ztraceným časem, protože JVM si to stejně udělá po svém. Optimalizace v C vhodnou konstrukcí cyklů a podmínek se určitě vyplatí, ale chce to znalosti, které každý nemá.

Je to "levnější vývoj v Javě" vs. "efektivnějíš kód z C".

Má smysl vědět, co JVM dělá, aby program neběžel zbytečně příliš dlouho. Ale pokud je nutné mít efektivní program, pak je prvním krokem k optimalizaci změna jazyka a tím pádem i překladače.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 13:22

Maaartin (neregistrovaný)

Nechcete o tom napsat clanek? Zajimaly by me detajly, jak presne vypadal kod...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 13:30

kert (neregistrovaný)

Přidávám se...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 17:26

JVM != GCC -O3 (neregistrovaný)

I já o tom popřemýšlím:)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 13:44

Vít Šesták (v6ak)

Vpodstatě závěr je to, co jsme tu už říkali - jde jen o to, co potřebujeme. Pro ruční optimalizace je samozřejmě výhodnější jít blíže k procesoru. A někteří hardwaráři by se na to ještě dívali s pohledem "Co to je? Vždyť by bylo mnohem efektivnější si navrhnout vlastní hardware!" Ale nejdůležitější je moct si říct "Mohl jsem to sice napsat v těchto ohledech (cena, následná údržba, rychlost, ...) lépe, ale zase by se to jinde projevilo (cena, následná údržba, rychlost, ...) a nevyplatilo by se to."

Jinak článek by mě taky zajímal. Zvlášť to zrychlení pomocí zbytečné podmínky,
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 17:31

JVM != GCC -O3 (neregistrovaný)

V podstatě šlo o to, že se buď udělal call, nebo ret. K tomu rozhodnutí se dospělo. Takže nebylo nutné přidávat "zbytečný" extra test. Jenomže ten extra test mohl zavolat ret dřív, pokud už to bylo jasné. Takže se ušetřily jednak instrukce a jednak se instruction pointer často pohyboval v blízkosti skoků. On je tam totiž ještě limit na délku kódu, ve kterém se udržuje historie skoků - tohle mi přišlo líp popsané v manuálu od AMD než od Intelu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 15:30

ded kenedy (neregistrovaný)

Jenomže, když jsem využil znalost Branch Target Buffer procesoru a přidal podmínku, která tam nemusela být, tak už byl program z C vždy rychlejší než Java. Ve většině případů to urychlení bylo větší než 10x. (Ano, BFS běží ještě rychleji díky absenci rekurze.)

tak takhle by se teda opravdu programovat nemelo. staci, abys program spustil na necem, kde bude branch prediction udelana jinak (novejsi nebo starsi verze cpu), zkusil program prekompilovat jinde (SPARC, ARM, ...) nebo pouzil jiny prekladac a vsechny tvoje optimalizace nejenze budou k nicemu, ale muzou byt hrube kontrapudiktivni.

Optimalizace v C vhodnou konstrukcí cyklů a podmínek se určitě vyplatí, ale chce to znalosti, které každý nemá.

to je pravda... o par postu vys tu jeden expert tvrdil, ze for cyklus se preklada pomoci dvou skoku a pritom ten smejd gcc si to skompiloval posvem jenom s jednim skokem.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 17:24

JVM != GCC -O3 (neregistrovaný)

A jak jinak by byla branch-prediction udělaná? Že by dokázala předpovídat více skoků a přesněji? Konkrétní detaily ať si udělá překladač. Já mu jenom vycházím vstříc znalostí obecně platných principů.

Njn s GCC, viz můj komentář tamtéž.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
17. 1. 2011 19:15

ded kenedy (neregistrovaný)

nechapes. nektere procesory nemusi mit branch prediction vubec, jine mohou mit udelanou primitivni predikci na zaklade toho jestli se jedna o skok dopredu nebo zpet. a kdyz tam budes cpat zbytecne podminky tak na nich ten vykon pujde do haje.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
18. 1. 2011 9:01

JVM != GCC -O3 (neregistrovaný)

Jak bylo uvedeno někde výše, podmínka je zbytečná v tom smyslu, že pokud tam nebude, tak program bude fungovat taky.

Takže druhé možné přídavné jméno téhle podmínky je spekulativní. Když se vykoná, ušetří se čas vykonává následujících instrukcí, ze kterých se její efektivita zaplatí i na procesoru bez branch prediction.

Vlákno názorů k článku Monitorování procesů a správa paměti v JDK6 a JDK7 (2) od JVM != GCC -O3 - Tak ještě na závěr malé shrnutí. 1. Proč jsem...

Dále u nás najdete

Obětmi růstu cen komponent jsou už i mobily

Hemoroidy zhoršuje vysedávání s mobilem na záchodě

Apple opravil bezpečnostní chybu, která byla v iOS od verze 1.0

Obchody stahují z prodeje dubajskou čokoládu a medy

Filip Sajler vaří obědy pro firmy. Prodávají je chytré lednice

Poslední den na přiznání k dani z nemovitostí a dani silniční

Tuzemské firmy se chrání obstojně, rizikově se chovají lidé

Digitální squatting je na vzestupu, podvodníci cílí na velké značky

Začínající podnikatel: Základní pojmy z účetnictví

Bitcoinová burza omylem rozdala 40 miliard dolarů

17 nejčastějších podvodů na WhatsAppu: kompletní průvodce

Problémy s lymfou trápí spíš ženy, projevuje se otoky

Hrdinství systém nenahradí. Proč se startupy stěhují z ČR?

OSVČ musí podat daňové přiznání elektronicky, nemusí přes datovku

Korekce bitcoinu snížila počet milionářů o téměř 12 tisíc

Začínající podnikatel: Základní pojmy z e-commerce

OSVČ senioři letos v přehledech uplatní slevu na pojistném

LibreOffice 26.2 vylepšuje kompatibilitu s MS Office

Privátní značky se někdy nevyplatí. Nejvíce se dá ušetřit na drogerii

Prima v tichosti zpřísnila podmínky přetáčení reklam