Názory k článku Pohled pod kapotu JVM – základy optimalizace aplikací naprogramovaných v Javě (3)

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

24. 9. 2013 8:48

kvr kvr

Super, díky za článek.

Po předchozím dílu mi ty výsledky přišly docela pomalé. Dneska letmým pohledem na první ArrayTest3.test() to vypadá, že kompilátor má sice snahu unrollovat, ale neuvědomuje si nedostatek registrů. Navíc ani nemá žádnou větší snahu popřeházet instrukce, aby nebyly závislé na předchozí (tedy nevím, jak velkou roli to hraje pro dnešní procesory).

Má tyhle informace kompilátor (včas) k dispozici, nebo to tam na nějaké vyšší vrstvě naplácá bez ohledu na specifika cílové platformy? Skoro mi přijde, že bez unrolling by byl ten cyklus rychlejší...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 9:55

Pavel Tišnovský

Zlatý podporovatel

No na i386 je to docela problem, hotspot na to neni moc staveny, ja zkusim do pristiho dilu dat ukazky,jak to vypada na skutecnych procesorech^W^W RISCech - SPARC apod.

Prehazovani instrukci - to me taky neustale prekvapuje, ne nedela to.

Co se tyce C1 prekladace, tak ten ma takzvanou linearni alokaci registru, coz je na i386 zlo, C2 pouziva pro alokaci registru obarvovani grafu - trosku slozitejsi vec, zkusim to nekdy popsat vice do hloubky.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 10:35

__dark__ (neregistrovaný)

Ten JIT skoro vůbec nepoužívá instrukci LEA, která může nahradit MOV a ADD, a jako jedna z mála může využít 2 zdrojové registry a jeden cílový. Ten loop unrolling je podle mě až moc drastický a může spíš uškodit (zbytečně nafouklý kód). Jinak super článek.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 10:59

Pavel Tišnovský

Zlatý podporovatel

No taky si nekdy s nadsazkou rikam, jestli by nebylo daleko lepsi, kdyby Sun byl koupenej Intelem :-)) [icc]
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 11:01

Pavel Tišnovský

Zlatý podporovatel

Ale podle toho kodu to vypada tak, ze chteji, aby ALU instrukce bezely paralelne s load-store instrukcema, coz by v pripade LEA bylo obtizne ne?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 15:56

kvr kvr

To je recht, třeba by to Intel zachránilo po krachu x86 :-)

Ale k té kompilaci - IMHO by jakýkoli dnešní kompilátor udělal lepší práci. Jsem zvědav na ten C2, jaké budou výsledky...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 11:34

deda.jabko (neregistrovaný)

Co jsem se pred casem dival, tak instrukce LEA je na novejsich procesorech (Core2 Duo, nejaky Atom, ...) pomalejsi nez ADD.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 11:47

Pavel Tišnovský

Zlatý podporovatel

Architekturu Core2 Duo neznam, ale na predchozich cipech to bylo tak, ze LEA byla vykonavana v AGU, zatimco ADD v ALU, takze ne ze by LEA byla nejak extra rychlejsi, ale vypocet se dokazal provest uz v decode fazi a navic bez zatizeni ALU (+cekani na vysledek). Ale dneska uz to asi chce benchmark, chovani modernich cipu je slozite :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 14:58

deda.jabko (neregistrovaný)

Ono je to slozitejsi. Napriklad ve zdrojacich GCC je "...it is ok to optimize an ADD operation to LEA operation to avoid flag register consumation. For most processors, ADD is faster than LEA. For the processors like ATOM, if the destination register of LEA holds an actual address which will be used soon, LEA is better and otherwise ADD is better." Vzhledem k tomu, ze u patche je podepsan clovek @intel.com asi bych to bral jako docela duveryhodnou informaci.

GCC jeste dela to, ze se diva, jestli AGU bude nebo nebude pouzivat jina instrukce a pripadne pouzije LEA nebo ADD. Hrozna alchymie.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 17:25

KarelI

JIT muze v podstate pouzit ruzny instrukce primo dle cpu na kterem to bezi, ovsem je otazka zda tam takova logika je. Pak by se podobne debaty nad kodem museli brat primo s ohledem na to cpu...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 18:54

Pavel Tišnovský

Zlatý podporovatel

Co jsem se dival na zdrojaky HS, tak v tomto ohledu se bohuzel zadne zazraky nekonaji :/ Zjisteni zakladnich parametru CPU tam je, pocet jader atd. ovlivni hlavne GC, ale C1/C2 uz ne do takove miry, jak v cecku ruzne -march= apod.
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Názory k článku Pohled pod kapotu JVM – základy optimalizace aplikací naprogramovaných v Javě (3)

Dále u nás najdete

Preventivní prohlídky 2026: Co se změnilo?

Marcel Divín: S tiskárnami Epson doma i ve firmě

Juraj Polerecký vede český a slovenský marketing Microsoftu

Rozvody 2026: Nový poplatek i nová pravidla

Čistá mzda 2026: Vše, co potřebujete znát

U všech zaměstnanců se bude hlásit dosažené vzdělání

Nepodceňujte ruské hackery, varují britští experti

AI v podnikání: Buzzword, nebo realita?

WhatsApp zavádí bezpečný režim pro ohrožené osoby

Začínající podnikatel: Základní pojmy z firemních financí

Začínající podnikatel: Základní pojmy z e-commerce

Dvanáct vážných chyb v OpenSSL objevila umělá inteligence

Quishing: Myslete, než skenujete, QR kód může být past

Lékaři začnou řešit, kolik mají lidé v pase

Bezdrátové sítě jiné než Wi-Fi: HaLow, Z-Wave, Zigbee a Thread

David Bečvařík přechází z Heureky do Etnetery Core jako nový CTO

Tuzemské firmy se chrání obstojně, rizikově se chovají lidé

Microsoft šest let směroval poštovní provoz k cizí firmě

Poslední den na přiznání k dani z nemovitostí a dani silniční

České Epico slaví úspěch, vstupuje na švýcarský trh