Názory k článku Programovací jazyk Go a assembler (3.část)

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

13. 2. 2020 0:40

Calculon

Dobrý den, určitě jsou len a cap na amd64 a arm64 32-bitové? Já jen že unsafe.Sizeof vrací pro proměnné typu int 8 (a pro řez tedy 24). Ostatně v tom strojáku je pak MOVQ.

Jinak argumenty funkcí se na zásobníku předávají na všech architekturách, mají to tak schválně, aby přepnutí gorutin bylo levné.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 7:53

Pavel Tišnovský

Zlatý podporovatel

To ještě jednou zkontroluji. Předává se (z hlediska Go) int, takže by to mělo být int64 na 64bitových platformách, ale četl jsem, že interně to omezují na 2G prvků. Ale možná to už je neomezené (tedy já z tohoto pohledu považuji 64bitový index za prakticky neomezený :-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 8:31

Calculon

Tohle fixli v září 2012, myslím, že v Go 1.1 :)

(Typ int byl původně v Go 32-bitový i na amd64, ale lidi si furt dokola stěžovali.)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 8:35

Pavel Tišnovský

Zlatý podporovatel

Jo tak to už je skutečně prehistorie :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 8:37

Calculon

Právě, teď už tam to omezení není.

Pardon, že ještě otravuju, ale v části 6 nemá být XORQ místo XORL? Následný inkrement a porovnání je pak quad, takže se asi nevynuluje celý registr.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 8:47

Pavel Tišnovský

Zlatý podporovatel

Jj má (popravdě mě ten assembler v tomto mate, mám zakódováno, že D=double word a L mi tím padá do něčeho "většího", což je špatně). Navíc jsem začínal na opisu kódu generovaného přímo překladačem Go a ten použil XORL. Asi pořád přepokládá len=cap=int? :D
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 8:50

Calculon

Že Vy ještě máte Go 1.0 :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 8:56

Pavel Tišnovský

Zlatý podporovatel

jsem konzervativní, takže staré dobré 1.13 (https://github.com/tisnik/go-root/blob/master/article_56/02_empty_image_asm/go.mod), na 1.14 se necítím (tedy zkouším doma, ale ne pro naše projekty)

Ale pro zasmání jaký jsem exot - relativně velkou codebase ještě udržuji v ANSI C. Dnes v podstatě jen tak z hecu, už by se to klidně dalo přepsat, ale proč si nezavzpomínat.
13. 2. 2020, 08:58 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 9:08

Pavel Tišnovský

Zlatý podporovatel

jaký kód ten první příklad generuje u vás? 0x31 0xd2 je v xor EDX, EDX
13. 2. 2020, 09:08 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 9:31

Calculon

Jo, je tam XORL. Tady mi něco uniká.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 9:41

Calculon

BTW ten "opis kódu" se Vám jednou vymstí, schválně si do asembleru napište CMPQ AX, BX a pak si to prohlédněte přes objdump :) Věděl jste o tom?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 9:43

Pavel Tišnovský

Zlatý podporovatel

Jj hned při prvních hrátkách s go asm, kdy se "zdálo", že všechny podmíněné skoky jsou špatně :-) Prostě celé to přišlo z úplně jiného světa (Plan-9).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 9:50

Calculon

Podle mě by to chtělo jeden článek “Go best practices and WTFs”, jako že je lepší se vyvarovat konverze []byte(...), záludnosti cap a v sekci o asm právě takovéto chytáky.

Ale pokrok se děje, instrukce pro AVX-512 už nějakou dobu nezapisuju pomocí BYTE :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 11:00

Calculon

Na amd64 32-bitový XOR na EAX apod. vynuluje horních 32 bitů a ušetří se jeden bajt opkódu.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 8:40

atarist

Tedy v architektuře AMD64 nejsem kovaný, ale dost mě překvapuje, že ta starodávná instrukce REP STOSD je stejně rychlá jako moderní VMOV.... s 64bitovými přenosy. Tak mě napadá - zarovnává Go správně ta pole pro bitmapy? Nebo je problém v tom, že se to testovalo na mašině s 32bitovými paměťmi?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
13. 2. 2020 20:53

Pavel Tišnovský

Zlatý podporovatel

U těch větších rastrových obrázků se už projevilo úzké hrdlo paměti. Ta data se (IMHO) stejně přenášela v burst režimu.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 2. 2020 12:32

radioing

Ten minimalni rozdil mezi STOSx a VMOV/MOV zase takove prekvapeni neni, nebot prinejmensim na Ivy Bridge a lepsich CPU uz je ERMSB, tzn. ze STOSx /MOVSx instrukce maji vylepseny mikrokod, jehoz funkci si lze v tomto konkretnim pripade predstavit jako sdruzovani 32bitovych zapisu STOSD do jednoho realneho n-bitoveho jiz v jadru. Pak je rychlost brzdena busem, a tedy priblizne stejna, jako pri pouziti 8bajtovych VMOV. Samozrejme to chce ty veci okolo, tzn. zarovnani na 16 bajtu, >= 128 bajtu pro REP prenos...
Mimo jine si toho lze take povsimnout v modernich knihovnach pro memsety a memmovy, kde puvodni kombinace STOSD + (1...3)STOSB, resp. MOVSD + (1...3)MOVSB, jsou nahrazeny STOSB, resp. MOVSB, nebot mikrokodem provadene sdruzovani pristupu na bus do sirky datove sbernice, mensi overhead pri startu REPu a moznost inlajnovani maleho useku kodu tuto konstrukci jasne favorizuje.
Jinymi slovy, s ERMSB je ECX = N, REP STOSD stejne rychle jako ECX = 4*N, REP STOSB.

Z "Intel 64 and IA-32 Architectures Optimization Reference Manual":
3.7.7.3 Memset ConsiderationsThe consideration of code size and throughput also applies for memset() implementations. For processors supporting ERMSB, using REP STOSB will again deliver more compact code size and significantly better performance than the combination of STOSD+B technique described in Section 3.7.6.When the destination buffer is 16-byte aligned, memset() using ERMSB can perform better than SIMD approaches. When the destination buffer is misaligned, memset() performance using ERMSB can degrade about 20% relative to aligned case, for processors based on Intel microarchitecture code named Ivy Bridge. In contrast, SIMD implementation of memset() will experience smaller degradation when the destination is misaligned.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 2. 2020 15:20

tisnik

jj me se to libi, Kdyz uz tam ty vysokourovnove instrukce maji, tak at jsou mega optimalizovany, toto si jadro muze krasne upravit podle architektury.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 2. 2020 19:03

atarist

pěkně to je popsáno. Netušíte, jak je to na AMD? Teď tady máme samé i7, takže to nemám kde vyzkoušet (i kdybych dnes kupoval desktop, tak je volba jasná)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 2. 2020 10:45

radioing

Taktez nemam aktualne pristup k AMD, ale treba na odkazu nize jsou nejake statistiky z 2017. Je pekne videt, jak pocinaje Ivy Bridge (Haswell, Skylake) REP MOVSB drti ostatni techniky memmove (pri zarovnani, >=1k bloky; REP MOVSB ma jistou uvodni rezii). U Ryzen 5 (na konci statistik) se nic prevratneho nekona a namatkou podle cpu-world.com Ryzen 3/5/7/Threadripper Enhanced REP MOVSB/STOSB nenabizi (zdroj CPUID?). Je to ale Intelacka feature, takze to neznamena, ze u AMD nejake to vylepseni neni. Nenasel jsem vsak nic, s cim by se v tomto smeru AMD explicitne chlubilo.
https://groups.google.com/forum/#!topic/comp.arch/ULvFgEM_ZSY
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Názory k článku Programovací jazyk Go a assembler (3.část)

Dále u nás najdete

Investory nejvíce lákají technologie, ale potřebují větší transparentnost

Čech učí s dcerou Ursuly von der Leyen počítače číst planetu

Notepad++ byl šest měsíců pod kontrolou čínských hackerů

Čistá mzda 2026: Vše, co potřebujete znát

Místo líbivých věcí začala prodávat lebky a vnitřnosti. Má vyprodáno

Od Sazky k Allwynu: Připomeňte si 70letý příběh legendární značky

Paušální režim: komu se ještě vyplatí a komu už ne

Obětmi růstu cen komponent jsou už i mobily

Roboty s vlastnostmi lidí firmy nechtějí, jsou příliš nákladné

Poslední den na přiznání k dani z nemovitostí a dani silniční

Google mění podobu Gemini v Chromu

Za tyto značky se kyberútočníci vydávají nejčastěji

Přínosy a rizika používání umělé inteligence v HR

Na magnetické rezonanci nedaleko Prahy mají volno

Proč emoce prodávají víc než slevy? Pohled na vánoční kampaně

Ručí jednatel za daň, kterou nezaplatí firma?

AI v podnikání: Buzzword, nebo realita?

Daně 2026: Návrat k bezlimitnímu osvobození příjmů a nové odpočty

Obchody stahují z prodeje dubajskou čokoládu a medy

Alza začala prodávat organizéry oblíbené mezi bastlíři