Vlákno názorů k článku Pohled pod kapotu JVM – základy optimalizace aplikací naprogramovaných v Javě (3) od dark - Ten JIT skoro vůbec nepoužívá instrukci LEA, která...

Článek je starý, nové názory již nelze přidávat.

24. 9. 2013 10:35

__dark__ (neregistrovaný)

Ten JIT skoro vůbec nepoužívá instrukci LEA, která může nahradit MOV a ADD, a jako jedna z mála může využít 2 zdrojové registry a jeden cílový. Ten loop unrolling je podle mě až moc drastický a může spíš uškodit (zbytečně nafouklý kód). Jinak super článek.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 10:59

Pavel Tišnovský

Zlatý podporovatel

No taky si nekdy s nadsazkou rikam, jestli by nebylo daleko lepsi, kdyby Sun byl koupenej Intelem :-)) [icc]
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 11:01

Pavel Tišnovský

Zlatý podporovatel

Ale podle toho kodu to vypada tak, ze chteji, aby ALU instrukce bezely paralelne s load-store instrukcema, coz by v pripade LEA bylo obtizne ne?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 15:56

kvr kvr

To je recht, třeba by to Intel zachránilo po krachu x86 :-)

Ale k té kompilaci - IMHO by jakýkoli dnešní kompilátor udělal lepší práci. Jsem zvědav na ten C2, jaké budou výsledky...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 11:34

deda.jabko (neregistrovaný)

Co jsem se pred casem dival, tak instrukce LEA je na novejsich procesorech (Core2 Duo, nejaky Atom, ...) pomalejsi nez ADD.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 11:47

Pavel Tišnovský

Zlatý podporovatel

Architekturu Core2 Duo neznam, ale na predchozich cipech to bylo tak, ze LEA byla vykonavana v AGU, zatimco ADD v ALU, takze ne ze by LEA byla nejak extra rychlejsi, ale vypocet se dokazal provest uz v decode fazi a navic bez zatizeni ALU (+cekani na vysledek). Ale dneska uz to asi chce benchmark, chovani modernich cipu je slozite :)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 14:58

deda.jabko (neregistrovaný)

Ono je to slozitejsi. Napriklad ve zdrojacich GCC je "...it is ok to optimize an ADD operation to LEA operation to avoid flag register consumation. For most processors, ADD is faster than LEA. For the processors like ATOM, if the destination register of LEA holds an actual address which will be used soon, LEA is better and otherwise ADD is better." Vzhledem k tomu, ze u patche je podepsan clovek @intel.com asi bych to bral jako docela duveryhodnou informaci.

GCC jeste dela to, ze se diva, jestli AGU bude nebo nebude pouzivat jina instrukce a pripadne pouzije LEA nebo ADD. Hrozna alchymie.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 17:25

KarelI

JIT muze v podstate pouzit ruzny instrukce primo dle cpu na kterem to bezi, ovsem je otazka zda tam takova logika je. Pak by se podobne debaty nad kodem museli brat primo s ohledem na to cpu...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
24. 9. 2013 18:54

Pavel Tišnovský

Zlatý podporovatel

Co jsem se dival na zdrojaky HS, tak v tomto ohledu se bohuzel zadne zazraky nekonaji :/ Zjisteni zakladnich parametru CPU tam je, pocet jader atd. ovlivni hlavne GC, ale C1/C2 uz ne do takove miry, jak v cecku ruzne -march= apod.

Vlákno názorů k článku Pohled pod kapotu JVM – základy optimalizace aplikací naprogramovaných v Javě (3) od __dark__ - Ten JIT skoro vůbec nepoužívá instrukci LEA, která...

Vlákno názorů k článku Pohled pod kapotu JVM – základy optimalizace aplikací naprogramovaných v Javě (3) od dark - Ten JIT skoro vůbec nepoužívá instrukci LEA, která...