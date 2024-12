Obsah

1. Vývoj mikroprocesorů z rodiny 80×86: 32bitové čipy 80386 a 80486

2. Sada 32bitových pracovních registrů

3. Nové segmentové registry





4. Kódování instrukcí s novými segmentovými registry

5. Instrukce PUSH a POP s novými segmentovými registry

6. Práce s novými 32bitovými pracovními registry

7. Kódování instrukcí v šestnáctibitovém režimu mikroprocesorů

8. Kódování instrukcí v 32bitovém režimu mikroprocesorů

9. Rozšíření možností instrukcí skoku

10. Základní varianta: lokální skoky

11. Rozšířená varianta: „blízké“ skoky

12. Krátké vs. blízké skoky z pohledu kódování instrukcí

13. Dlouhé skoky

14. Nové instrukce pro konverzi dat

15. Rozšíření hodnoty bez znaménka při přenosu dat

16. Rozšíření hodnoty se znaménkem při přenosu dat

17. Nové bitové operace

18. Nastavení výsledku pravdivostní operace

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

1. Vývoj mikroprocesorů z rodiny 80×86: 32bitové čipy 80386 a 80486

Na článek o nových instrukcích podporovaných mikroprocesory Intel 80186 a Intel 80286 dnes navážeme. Zabývat se totiž budeme vybranými instrukcemi, které byly přidány do třetí generace mikroprocesorů rodiny 80×86, tj. konkrétně do čipů Intel 80386 (a posléze i Intel 80486). Prozatím se zaměříme především na reálný režim těchto mikroprocesorů, takže nebudeme odbíhat ani k chráněnému režimu ani k režimu virtuálnímu. Dále popsané instrukce jsou sice (většinou) 32bitové, protože dokážou zpracovávat 32bitové operandy, ovšem kvůli omezením reálného režimu měli programátoři stížené adresování paměti nad první megabajt a navíc byli omezeni i adresováním formou segment:offset. Jak bylo možné toto (dosti zásadní) omezení obejít, je problematika, které se budeme věnovat v samostatném článku.

Poznámka: 80386 skutečně přinesla nové užitečné instrukce, což se u rozšíření zavedeném v rámci 80186 úplně říci nedá. Ovšem nové instrukce byly přidány za cenu nutnosti použití prefixů, tj. jednoho nebo dvou bajtů zapsaných před vlastní operační kód instrukce. Některé instrukce povolují i další prefixy, takže jedna instrukce může být zakódována například do deseti bajtů (a pravděpodobně lze nalézt i delší varianty – praktickým limitem je ovšem délka instrukční fronty).

2. Sada 32bitových pracovních registrů

Mikroprocesory 80386 a 80486 jsou nazývány 32bitovými čipy mj. i z toho důvodu, že se u nich rozšířila aritmeticko-logická jednotka tak, aby bylo možné pracovat s 32bitovými operandy. A tomu se musela přizpůsobit i sada pracovních registrů. Společnost Intel se rozhodla, že namísto „párování“ dvou šestnáctibitových registrů do registrů 32bitových rozšíří původní registry ze šestnácti bitů na plných 32 bitů. Týká se to všech čtyř pracovních registrů AX, BX, CX, DX, indexových registrů SI, DI, bázových registrů SP, BP i ukazatele na instrukci IP. Tyto registry byly rozšířeny o horních šestnáct bitů, přičemž je stále možné adresovat spodních 16 bitů původními jmény registrů a/nebo (pouze u pracovních registrů) použít jejich horních a spodních osm bitů zvlášť (AX=AH+AL atd.). V assembleru se 32bitové registry poznají podle toho, že začínají písmenem E:

32bitový registr Spodních 16 bitů Rozdělení horní/dolní bajt Funkce registru EAX AX AH/AL akumulátor EBX BX BH/BL bázový registr ECX CX CH/CL čítač EDX DX DH/DL datový registr ESP SP ukazatel na vrchol zásobníku EBP BP báze zásobníkového rámce ESI SI indexový registr pro zdroj dat EDI DI indexový registr pro cíl dat EIP IP ukazatel na prováděnou instrukci

Poznámka: zachování přístupu k 16bitovým polovinám registrů a dokonce k nejnižšímu bajtu a bajtu nad ním sice může vypadat zvláštně, ovšem tento koncept umožnil relativně dobrou práci s řetězci, což je například u klasických čistě RISCových procesorů sice možné (díky specializovaným instrukcím LOAD a STORE), ale ne plně efektivní.

3. Nové segmentové registry

Mikroprocesory 80386 mají k dispozici taktéž dva nové segmentové registry pojmenované jednoduše FS a GS. Tyto registry lze použít pro adresování libovolného segmentu operační paměti a nemají žádný další speciální význam, na rozdíl od původní čtveřice segmentových registrů CS (kódový segment), DS (datový segment), SS (segment se zásobníkem) a ES (použit u řetězcových a blokových operací). Ovšem pochopitelně u složitějších aplikací mohou být další dva segmentové registry užitečné a mohou je využívat i překladače vyšších programovacích jazyků. S těmito novými registry se pracuje stejně, jako s původní čtveřicí.

Poznámka: pochopitelně je otázkou, zda by nebylo lepší spíše přidat více pracovních registrů, to však původní schéma kódování instrukcí neumožňuje, takže jsme si museli počkat až na 64bitovou architekturu.

4. Kódování instrukcí s novými segmentovými registry

Zajímavé bude zjistit, jak se přidání nových segmentových registrů projevilo v kódování instrukcí, které s těmito registry pracují. Kupodivu k žádnému přidávání nových prefixových bajtů v případě některých instrukcí nedošlo, což si ostatně můžeme snadno ověřit na instrukci MOV:

;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: mov ax, ds mov ax, es mov ax, fs mov ax, gs mov ax, ss mov ax, cs xor ax, ax mov ds, ax mov es, ax mov fs, ax mov gs, ax mov ss, ax mov cs, ax ; toto neni dobry napad!!! wait_key exit

Způsob překladu těchto instrukcí do strojového kódu:

8 ;----------------------------------------------------------------------------- 9 10 BITS 16 ; 16bitovy vystup pro DOS 11 CPU 386 ; specifikace pouziteho instrukcniho souboru 12 13 ; ukonceni procesu a navrat do DOSu 14 %macro exit 0 15 ret 16 %endmacro 17 18 ; vyprazdneni bufferu klavesnice a cekani na klavesu 19 %macro wait_key 0 20 xor ax, ax 21 int 0x16 22 %endmacro 23 24 ;----------------------------------------------------------------------------- 25 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 26 27 start: 28 00000000 8CD8 mov ax, ds 29 00000002 8CC0 mov ax, es 30 00000004 8CE0 mov ax, fs 31 00000006 8CE8 mov ax, gs 32 00000008 8CD0 mov ax, ss 33 0000000A 8CC8 mov ax, cs 34 35 0000000C 31C0 xor ax, ax 36 0000000E 8ED8 mov ds, ax 37 00000010 8EC0 mov es, ax 38 00000012 8EE0 mov fs, ax 39 00000014 8EE8 mov gs, ax 40 00000016 8ED0 mov ss, ax 41 00000018 8EC8 mov cs, ax ; toto neni dobry napad!!! 42 43 wait_key 20 0000001A 31C0 xor ax, ax 21 0000001C CD16 int 0x16 44 exit 15 0000001E C3 ret

Poznámka: všechny instrukce tedy mají stejnou délku i stejný první bajt.

5. Instrukce PUSH a POP s novými segmentovými registry

Při pohledu na demonstrační příklad uvedený v předchozí kapitole by se mohlo zdát, že přidání nových segmentových registrů FS a GS neznamenalo žádné zásadní změny v kódování instrukcí, protože se kódy těchto registrů „vešly“ do stávajícího schématu kódování. Ve skutečnosti tomu tak není ve všech případech, jelikož například u instrukcí PUSH a POP bylo nutné přidat instrukční prefix 0F (který mimochodem znamená, že instrukce POP CS již není podporována – o tom jsme se ostatně zmínili již minule):

Podívejme se tedy na kódování instrukcí PUSH a POP v případě, že jsou tyto instrukce použity společně se segmentovými registry:

;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: push cs push ds push ss push es push fs push gs pop gs pop fs pop es pop ss pop ds pop cs wait_key exit

Z výsledného výpisu je patrné, že u nových segmentových registrů je použit instrukční prefix 0F, takže už tak složité schéma kódování instrukcí se nyní stává ještě složitějším (a to jsme teprve u třetí generace):

7 ;----------------------------------------------------------------------------- 8 9 BITS 16 ; 16bitovy vystup pro DOS 10 CPU 386 ; specifikace pouziteho instrukcniho souboru 11 12 ; ukonceni procesu a navrat do DOSu 13 %macro exit 0 14 ret 15 %endmacro 16 17 ; vyprazdneni bufferu klavesnice a cekani na klavesu 18 %macro wait_key 0 19 xor ax, ax 20 int 0x16 21 %endmacro 22 23 ;----------------------------------------------------------------------------- 24 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 25 26 start: 27 00000000 0E push cs 28 00000001 1E push ds 29 00000002 16 push ss 30 00000003 06 push es 31 00000004 0FA0 push fs 32 00000006 0FA8 push gs 33 34 00000008 0FA9 pop gs 35 0000000A 0FA1 pop fs 36 0000000C 07 pop es 37 0000000D 17 pop ss 38 0000000E 1F pop ds 39 0000000F 0F pop cs 39 ****************** warning: instruction obsolete and removed from the target CPU [-w+obsolete-removed] 40 41 wait_key 19 00000010 31C0 xor ax, ax 20 00000012 CD16 int 0x16 42 exit 14 00000014 C3 ret

6. Práce s novými 32bitovými pracovními registry

V assembleru se s 32bitovými registry pracuje prakticky stejným způsobem, jako s původními registry šestnáctibitovými. To platí pro většinu aritmetických a logických instrukcí, což si ostatně můžeme snadno ukázat na demonstračním příkladu, v němž postupně sečteme dvojici osmibitových hodnot, dále dvojici 16bitových hodnot a konečně dvojici hodnot 32bitových:

; Instrukcni soubor mikroprocesoru Intel 80386. ; ; Tento demonstracni priklad je pouzity v serialu o programovani ; grafickych dem a her na PC v DOSu: ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: mov al, 1 mov ah, 1 add ah, al mov ax, 1 mov bx, 1 add ax, bx mov eax, 1 mov ebx, 1 add eax, ebx wait_key exit

Zajímavé bude zjištění, jak se tyto instrukce přeložily do strojového kódu:

1 ; Instrukcni soubor mikroprocesoru Intel 80386. 2 ; 3 ; Tento demonstracni priklad je pouzity v serialu o programovani 4 ; grafickych dem a her na PC v DOSu: 5 ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ 6 ; 7 ;----------------------------------------------------------------------------- 8 9 BITS 16 ; 16bitovy vystup pro DOS 10 CPU 386 ; specifikace pouziteho instrukcniho souboru 11 12 ; ukonceni procesu a navrat do DOSu 13 %macro exit 0 14 ret 15 %endmacro 16 17 ; vyprazdneni bufferu klavesnice a cekani na klavesu 18 %macro wait_key 0 19 xor ax, ax 20 int 0x16 21 %endmacro 22 23 ;----------------------------------------------------------------------------- 24 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 25 26 start: 27 00000000 B001 mov al, 1 28 00000002 B401 mov ah, 1 29 00000004 00C4 add ah, al 30 31 00000006 B80100 mov ax, 1 32 00000009 BB0100 mov bx, 1 33 0000000C 01D8 add ax, bx 34 35 0000000E 66B801000000 mov eax, 1 36 00000014 66BB01000000 mov ebx, 1 37 0000001A 6601D8 add eax, ebx 38 39 wait_key 19 0000001D 31C0 <1> xor ax, ax 20 0000001F CD16 <1> int 0x16 40 exit 14 00000021 C3 <1> ret

Z výpisu je patrné, že nové 32bitové instrukce obsahují prefix 66H (a jsou tedy poměrně dlouhé, samozřejmě nepočítaje delší konstanty v instrukcích MOV):

B001 mov al, 1 B401 mov ah, 1 00C4 add ah, al B80100 mov ax, 1 BB0100 mov bx, 1 01D8 add ax, bx 66B801000000 mov eax, 1 66BB01000000 mov ebx, 1 6601D8 add eax, ebx

7. Kódování instrukcí v šestnáctibitovém režimu mikroprocesorů

V předchozí kapitole jsme viděli, že se 32bitové instrukce MOV a ADD přeložily takovým způsobem, že samotné instrukční slovo zůstalo stejné jako u 16bitových variant, ovšem před instrukci byl přidán prefix 0×66. Vyzkoušejme si tento koncept ještě na jedné instrukci, která je jednodušší. Jedná se o instrukci INC, která se v kombinaci s registrem AX přeloží do jediného bajtu (optimalizace právě pro akumulátor). Instrukci INC opět použijeme pro osmibitový, šestnáctibitový i 32bitový operand:

; Instrukcni soubor mikroprocesoru Intel 80386. ; ; Tento demonstracni priklad je pouzity v serialu o programovani ; grafickych dem a her na PC v DOSu: ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: xor al, al inc al xor ax, ax inc ax xor eax, eax inc eax wait_key exit

Překlad do strojového kódu může na listingu vyprodukovaného assemblerem vypadat následovně:

1 ; Instrukcni soubor mikroprocesoru Intel 80386. 2 ; 3 ; Tento demonstracni priklad je pouzity v serialu o programovani 4 ; grafickych dem a her na PC v DOSu: 5 ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ 6 ; 7 ;----------------------------------------------------------------------------- 8 9 BITS 16 ; 16bitovy vystup pro DOS 10 CPU 386 ; specifikace pouziteho instrukcniho souboru 11 12 ; ukonceni procesu a navrat do DOSu 13 %macro exit 0 14 ret 15 %endmacro 16 17 ; vyprazdneni bufferu klavesnice a cekani na klavesu 18 %macro wait_key 0 19 xor ax, ax 20 int 0x16 21 %endmacro 22 23 ;----------------------------------------------------------------------------- 24 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 25 26 start: 27 00000000 30C0 xor al, al 28 00000002 FEC0 inc al 29 30 00000004 31C0 xor ax, ax 31 00000006 40 inc ax 32 33 00000007 6631C0 xor eax, eax 34 0000000A 6640 inc eax 35 36 wait_key 19 0000000C 31C0 <1> xor ax, ax 20 0000000E CD16 <1> int 0x16 37 exit 14 00000010 C3 <1> ret

Konkrétně se zaměřme jen na instrukci INC s akumulátorem:

FEC0 inc al 40 inc ax 6640 inc eax

Opět tedy platí, že před 32bitovou variantu byl pouze vložen prefix 0×66.

8. Kódování instrukcí v 32bitovém režimu mikroprocesorů

Mohlo by se zdát, že třetí generace mikroprocesorů sice dokáže provádět 32bitové operace, ale platíme za to dosti vysokou cenu – každá instrukce je o bajt delší, což ovlivňuje využití cache atd. Ve skutečnosti tomu tak je pouze v původním šestnáctibitovém režimu mikroprocesorů. Pokud se mikroprocesor nachází v režimu 32bitovém (čehož ovšem není zcela snadné dosáhnout), bude situace prakticky opačná. Jak by situace vypadala v 32bitovém režimu, si můžeme ověřit překladem následujícího příkladu, v němž jsme pozměnili specifikaci BITS 16 na BITS 32. Výsledný binární soubor sice nebude v DOSu přímo spustitelný, ovšem nás nyní zajímá především způsob zakódování 32bitových instrukcí:

; Instrukcni soubor mikroprocesoru Intel 80386. ; ; Tento demonstracni priklad je pouzity v serialu o programovani ; grafickych dem a her na PC v DOSu: ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ ; ;----------------------------------------------------------------------------- BITS 32 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: xor al, al inc al xor ax, ax inc ax xor eax, eax inc eax wait_key exit

Listing vyprodukovaný assemblerem:

1 ; Instrukcni soubor mikroprocesoru Intel 80386. 2 ; 3 ; Tento demonstracni priklad je pouzity v serialu o programovani 4 ; grafickych dem a her na PC v DOSu: 5 ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ 6 ; 7 ;----------------------------------------------------------------------------- 8 9 BITS 32 ; 16bitovy vystup pro DOS 10 CPU 386 ; specifikace pouziteho instrukcniho souboru 11 12 ; ukonceni procesu a navrat do DOSu 13 %macro exit 0 14 ret 15 %endmacro 16 17 ; vyprazdneni bufferu klavesnice a cekani na klavesu 18 %macro wait_key 0 19 xor ax, ax 20 int 0x16 21 %endmacro 22 23 ;----------------------------------------------------------------------------- 24 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 25 26 start: 27 00000000 30C0 xor al, al 28 00000002 FEC0 inc al 29 30 00000004 6631C0 xor ax, ax 31 00000007 6640 inc ax 32 33 00000009 31C0 xor eax, eax 34 0000000B 40 inc eax 35 36 wait_key 19 0000000C 6631C0 <1> xor ax, ax 20 0000000F CD16 <1> int 0x16 37 exit 14 00000011 C3 <1> ret

Opět se zaměřme pouze na instrukce INC s akumulátorem. Oproti šestnáctibitové variantě se situace otočila – nyní mají prefix 0×66 šestnáctibitové operace (jsou tedy delší) zatímco operace 32bitové tento prefix nemají. Osmibitových variant se přepnutí režimu mikroprocesoru nijak nedotklo:

FEC0 inc al 6640 inc ax 40 inc eax

Poznámka: tato změna se týká i mnoha dalších instrukcí, které byly rozšířeny tak, aby dokázaly pracovat s 32bitovými operandy.

9. Rozšíření možností instrukcí skoku

V instrukčním souboru mikroprocesorů řady Intel 80386 došlo i k rozšíření instrukcí pro nepodmíněné a podmíněné skoky. Z hlediska relativně malých programů (tedy i programů typu COM) je důležité především rozšíření původně pouze lokálních (krátkých) skoků na takzvané „blízké“ (near) skoky, což se týká především podmíněných skoků. Připomeňme si, že původně byly cílové adresy těchto skoků omezeny na relativní rozsah –128 až 127 od aktuální hodnoty registru IP. To vyhovuje spíše pro malé subrutiny, ovšem zejména při překladu programů z vyšších programovacích jazyků do strojového kódu může být tento rozsah nedostatečný. Blízké skoky tento problém řeší, protože skok je možné provést na libovolnou adresu v aktuálně nastaveném kódovém segmentu (CS). Proto se někdy tyto skoky nazývají intrasegment jump. A konečně je nově možné provést i dlouhé skoky (far jump) mimo aktuální segment. Tyto skoky se z tohoto důvodu nazývají intersegment jump.

10. Základní varianta: lokální skoky

Pro krátké zopakování se podívejme na jednoduchý demonstrační příklad, který po svém spuštění vypíše na terminál desetkrát tu samou zprávu. Interně je v tomto příkladu realizována programová smyčka instrukcí JMP, ze které je možné po dosáhnutí konečné hodnoty čítače vyskočit instrukcí JZ. Tento příklad je plně kompatibilní s původními mikroprocesory řady Intel 8086 a Intel 8088 a pochopitelně je dopředně kompatibilní i s dalšími typy mikroprocesorů:

; Instrukcni soubor mikroprocesoru Intel 8088 a Intel 8086 ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 8086 ; specifikace pouziteho instrukcniho souboru ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: mov cx, 10 ; pocatecni hodnota pocitadla opak: ; tisk retezce na obrazovku mov dx, message mov ah, 9 int 0x21 dec cx ; snizeni pocitadla o jednicku jz konec ; skok, pokus se dosahne nuly jmp opak ; opakujeme smycku konec: ; ukonceni procesu a navrat do DOSu mov ah, 0x4c int 0x21 ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) message db "Hello, world!", 0x0d, 0x0a, "$"

Způsob překladu do strojového kódu nám osvětlí listing vygenerovaný assemblerem v průběhu překladu:

1 ; Instrukcni soubor mikroprocesoru Intel 8088 a Intel 8086 2 ; 3 ; Tento demonstracni priklad je pouzity v serialu o programovani 4 ; grafickych dem a her na PC v DOSu: 5 ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ 6 ; 7 ;----------------------------------------------------------------------------- 8 9 BITS 16 ; 16bitovy vystup pro DOS 10 CPU 8086 ; specifikace pouziteho instrukcniho souboru 11 12 ;----------------------------------------------------------------------------- 13 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 14 15 start: 16 00000000 B90A00 mov cx, 10 ; pocatecni hodnota pocitadla 17 opak: 18 ; tisk retezce na obrazovku 19 00000003 BA[1300] mov dx, message 20 00000006 B409 mov ah, 9 21 00000008 CD21 int 0x21 22 23 0000000A 49 dec cx ; snizeni pocitadla o jednicku 24 0000000B 7402 jz konec ; skok, pokus se dosahne nuly 25 26 0000000D EBF4 jmp opak ; opakujeme smycku 27 konec: 28 ; ukonceni procesu a navrat do DOSu 29 0000000F B44C mov ah, 0x4c 30 00000011 CD21 int 0x21 31 32 33 ; retezec ukonceny znakem $ 34 ; (tato data jsou soucasti vysledneho souboru typu COM) 35 00000013 48656C6C6F2C20776F- message db "Hello, world!", 0x0d, 0x0a, "$" 35 0000001C 726C64210D0A24

Zaměřme se na instrukce skoku. Ty jsou přeloženy do instrukcí s délkou pouhé dva bajty, přičemž v prvním bajtu je uložen operační kód instrukce a v bajtu druhém je relativní osmibitová adresa. Takto zakódované skoky jsou tedy omezeny na lokální rozsah –128 až 127 přičtený k aktuální hodnotě registru IP (Instruction Pointer):

7402 jz konec ; skok, pokus se dosahne nuly EBF4 jmp opak ; opakujeme smycku

11. Rozšířená varianta: „blízké“ skoky

U mikroprocesorů řady 80386 (a vyšších) lze použít i takzvané blízké skoky neboli near jumps, které umožňují provedení skoku na libovolné místo v kódovém segmentu. Adresa takového skoku je pochopitelně šestnáctibitová a díky tomu, že platí v rámci segmentu, není nutné provádět žádné testy, zda skok náhodou neporušuje izolaci programu (což se týká chráněného režimu). Blízké skoky dokáže assembler generovat automaticky ve chvíli, kdy je cíl skoku vzdálenější než relativní offset –128 až 127. Ovšem blízký skok si můžeme i vynutit modifikátorem near. Tento koncept je ukázán v následujícím demonstračním příkladu:

; Instrukcni soubor mikroprocesoru Intel 80386. ; ; Tento demonstracni priklad je pouzity v serialu o programovani ; grafickych dem a her na PC v DOSu: ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: mov cx, 10 ; pocatecni hodnota pocitadla opak: ; tisk retezce na obrazovku mov dx, message mov ah, 9 int 0x21 dec cx ; snizeni pocitadla o jednicku jz near konec ; skok, pokus se dosahne nuly jmp near opak ; opakujeme smycku konec: ; ukonceni procesu a navrat do DOSu mov ah, 0x4c int 0x21 ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) message db "Hello, world!", 0x0d, 0x0a, "$"

Způsob překladu do strojového kódu opět zjistíme z listingu:

1 ; Instrukcni soubor mikroprocesoru Intel 80386. 2 ; 3 ; Tento demonstracni priklad je pouzity v serialu o programovani 4 ; grafickych dem a her na PC v DOSu: 5 ; https://www.root.cz/serialy/vyvoj-her-a-grafickych-dem-pro-platformu-pc/ 6 ; 7 ;----------------------------------------------------------------------------- 8 9 BITS 16 ; 16bitovy vystup pro DOS 10 CPU 386 ; specifikace pouziteho instrukcniho souboru 11 12 ;----------------------------------------------------------------------------- 13 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 14 15 start: 16 00000000 B90A00 mov cx, 10 ; pocatecni hodnota pocitadla 17 opak: 18 ; tisk retezce na obrazovku 19 00000003 BA[1600] mov dx, message 20 00000006 B409 mov ah, 9 21 00000008 CD21 int 0x21 22 23 0000000A 49 dec cx ; snizeni pocitadla o jednicku 24 0000000B 0F840300 jz near konec ; skok, pokus se dosahne nuly 25 26 0000000F E9F1FF jmp near opak ; opakujeme smycku 27 konec: 28 ; ukonceni procesu a navrat do DOSu 29 00000012 B44C mov ah, 0x4c 30 00000014 CD21 int 0x21 31 32 33 ; retezec ukonceny znakem $ 34 ; (tato data jsou soucasti vysledneho souboru typu COM) 35 00000016 48656C6C6F2C20776F- message db "Hello, world!", 0x0d, 0x0a, "$" 35 0000001F 726C64210D0A24

Povšimněte si, jak jsou nyní instrukce skoku zakódovány. Problematický je především první skok, který má namísto dvou bajtů délku celých čtyř bajtů:

0000000B 0F840300 jz near konec ; skok, pokus se dosahne nuly 0000000F E9F1FF jmp near opak ; opakujeme smycku

12. Krátké vs. blízké skoky z pohledu kódování instrukcí

Zatímco u rozšíření instrukcí zmíněných v předchozím textu většinou došlo pouze k přidání prefixu před operační kód instrukce, je tomu u blízkých skoků jinak, protože se kromě prefixu (ten zde stále existuje a má hodnotu 0F) změní i samotný operační kód instrukce. Tato nepravidelnost je patrná z následující tabulky se základními formami skoků. Pro úplnost uvádím i všechny alternativy jmen instrukcí:

Instrukce Význam Testovaná podmínka Krátký skok Blízký skok JO Jump if Overflow OF = 1 70 0F 80 JNO Jump if Not Overflow OF = 0 71 0F 81 JS Jump if Sign SF = 1 78 0F 88 JNS Jump if Not Sign SF = 0 79 0F 89 JE Jump if Equal ZF = 1 74 0F 84 JZ Jump if Zero ZF = 1 74 0F 84 JNE Jump if Not Equal ZF = 0 75 0F 85 JNZ Jump if Not Zero ZF = 0 75 0F 85 JB Jump if Below CF = 1 72 0F 82 JNAE Jump if Not Above or Equal CF = 1 72 0F 82 JC Jump if Carry CF = 1 72 0F 82 JNB Jump if Not Below CF = 0 73 0F 83 JAE Jump if Above or Equal CF = 0 73 0F 83 JNC Jump if Not Carry CF = 0 73 0F 83 JBE Jump if Below or Equal CF = 1 | ZF = 1 76 0F 86 JNA Jump if Not Above CF = 1 | ZF = 1 76 0F 86 JA Jump if Above CF = 0 & ZF = 0 77 0F 87 JNBE Jump if Not Below or Equal CF = 0 & ZF = 0 77 0F 87 JL Jump if Less SF <> OF 7C 0F 8C JNGE Jump if Not Greater or Equal SF <> OF 7C 0F 8C JGE Jump if Greater or Equal SF = OF 7D 0F 8D JNL Jump if Not Less SF = OF 7D 0F 8D JLE Jump if Less or Equal ZF = 1 | SF <> OF 7E 0F 8E JNG Jump if Not Greater ZF = 1 | SF <> OF 7E 0F 8E JG Jump if Greater ZF = 0 & SF = OF 7F 0F 8F JNLE Jump if Not Less or Equal ZF = 0 & SF = OF 7F 0F 8F JP Jump if Parity PF = 1 7A 0F 8A JPE Jump if Parity Even PF = 1 7A 0F 8A JNP Jump if Not Parity PF = 0 7B 0F 8B JPO Jump if Parity Odd PF = 0 7B 0F 8B

13. Dlouhé skoky

Provádět je možné i takzvané dlouhé skoky, tj. skoky, při nichž se mění jak hodnota registru EIP (ano i tento registr je nyní 32bitový), tak i hodnota CS (kódový segment). Adresa cíle skoku nyní musí obsahovat plný ukazatel (tj. segment+16bitový offset nebo dokonce segment+32bitový offset) a může být zadána buď skutečně jako absolutní adresa, nebo jako adresa na ukazatel obsahující vlastní adresu cíle skoku. V prvním případě je pochopitelně adresa součástí instrukčního slova (4 bajty nebo šest bajtů), ve druhém případě se jedná o čtyřbajtovou nebo šestibajtovou adresu ukazatele. S podrobnostmi se seznámíme příště při popisu způsobů adresace paměti, která přesahuje základní 1MB.

14. Nové instrukce pro konverzi dat

Procesory ze třetí generace čipů 80×86 mají rozšířenou sadu instrukcí určenou pro konverze dat. Těmito instrukcemi jsme se prozatím v tomto seriálu podrobněji nezabývali, takže si nyní vypišme všechny dostupné varianty i s jejich stručným popisem. To, zda se jedná o nové instrukce či nikoli, je patrné z obsahu druhého sloupce:

Instrukce Kompatibilita Stručný popis instrukce CBW 8086 znaménkové rozšíření AL→AX CWD 8086 znaménkové rozšíření AX→DX:AX CWDE 80386 znaménkové rozšíření AX→EAX CDQ 80386 znaménkové rozšíření EAX→EDX:EAX

Tyto instrukce původní osmibitovou, 16bitovou či 32bitovou hodnotu rozšíří na dvojnásobnou šířku, přičemž berou v úvahu znaménko (nejedná se tedy o pouhé vynulování horních bitů registru či dvojice registrů). V rámci čipů 80386 byly přidány instrukce CWDE a CDQ. Zajímavé je, že tyto instrukce trvají dva cykly, zatímco instrukce původní (jednodušší) trvají cykly tři.

Kódování těchto instrukcí v šestnáctibitovém režimu:

98 cbw 99 cwd 6698 cwde 6699 cdq

Opět zde tedy můžeme vidět prefix 66.

15. Rozšíření hodnoty bez znaménka při přenosu dat

Instrukce uvedené v předchozí kapitole pracují pouze s akumulátorem popř. s dvojicí registrů D:A (DX:AX nebo EDX:EAX). Čipy 80386 jsou ale doplněny i obecnějšími instrukcemi určenými pro rozšíření hodnoty při přenosu dat z/do jiných registrů nebo z operační paměti. Jedná se tedy o variantu obecné přenosové instrukce MOV nazvanou MOVZX, ovšem s tím, že se horních osm bitů resp. šestnáct bitů vynuluje:

Instrukce Operandy Stručný popis instrukce MOVZX reg16, reg8 přenos z osmibitového registru do registru 16bitového s vynulováním horních osmi bitů MOVZX reg32, reg16 přenos z 16bitového registru do registru 32bitového s vynulováním horních šestnácti bitů MOVZX reg16, mem přenos osmi bitů z operační paměti s vynulováním horních osmi bitů MOVZX reg32, mem přenos šestnácti bitů z operační paměti s vynulováním horních šestnácti bitů

Poznámka: další adresovací režimy podporované instrukcí MOV nejsou u MOVZX podporovány.

16. Rozšíření hodnoty z šestnáctibitového registru do registru 32bitového

K dispozici je i instrukce nazvaná MOVSX umožňující přenosy dat se znaménkovým rozšířením. Pro kladné hodnoty (nejvyšší bit je nulový) je tato instrukce totožná s výše uvedenou MOVZX, pro hodnoty záporné (nejvyšší bit nastaven na jedničku) se pak vyšší polovina cílového registru taktéž nastaví na jedničku:

Instrukce Operandy Stručný popis instrukce MOVSX reg16, reg8 přenos z osmibitového registru do registru 16bitového se znaménkovým rozšířením do horních osmi bitů MOVSX reg32, reg16 přenos z 16bitového registru do registru 32bitového se znaménkovým rozšířením do horních šestnácti bitů MOVSX reg16, mem přenos osmi bitů z operační paměti se znaménkovým rozšířením do horních osmi bitů MOVSX reg32, mem přenos šestnácti bitů z operační paměti se znaménkovým rozšířením do horních šestnácti bitů

Pro zajímavost se podívejme na způsob zakódování těchto instrukcí do strojového kódu:

0FB6DB movzx bx, bl 660FB6DB movzx ebx, bl 660FB7DB movzx ebx, bx 0FB61E[0000] movzx bx, byte [data] 660FB71E[0000] movzx ebx, word [data] 0FBEDB movsx bx, bl 660FBEDB movsx ebx, bl 660FBFDB movsx ebx, bx 0FBE1E[0000] movsx bx, byte [data] 660FBF1E[0000] movsx ebx, word [data]

Poznámka: nyní jsou u některých kombinací použity dokonce dva instrukční prefixy 66 i 0F.

17. Nové bitové operace

Mikroprocesory 80386 mají k dispozici i instrukce pro provádění různých bitových operací. Jedná se velmi užitečné nízkoúrovňové operace a podobné instrukce nalezneme například v mnoha mikrořadičích:

Instrukce Operandy Stručný popis instrukce BT src, n n-tý bit se zkopíruje do příznaku Carry BTC src, n negace n-tého bitu se zkopíruje do příznaku Carry BTR src, n jako instrukce BT, ale bit se poté vynuluje BTS src, n jako instrukce BT, ale bit se poté nastaví na 1 BSF dest, src hledá první nenulový bit od bitu nejnižšího BSR dest, src hledá první nenulový bit od bitu nejvyššího

Pro zajímavost si uveďme program, který zjistí index prvního nenulového bitu při procházení slovem zprava doleva, tj. od nejnižšího bitu směrem k bitu nejvyššímu. Instrukce, která tuto činnost provádí, se jmenuje BSF neboli celým jménem Bit Scan Forward:

; Instrukcni soubor mikroprocesoru Intel 80386. ; Test instrukce BSF. ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ; tisk retezce na obrazovku %macro print 1 mov dx, %1 mov ah, 9 int 0x21 %endmacro ; tisk hexadecimalni hodnoty %macro print_hex 1 mov bx, hex_digits mov cl, %1 ; zapamatovat si predanou hodnotu mov al, cl ; do AL se vlozi horni hexa cifra and al, 0xf0 shr al, 1 shr al, 1 shr al, 1 shr al, 1 xlat ; prevod hodnoty 0-15 na ASCII znak mov [message], al ; zapis ASCII znaku do retezce mov al, cl ; do BL se vlozi dolni hexa cifra and al, 0x0f xlat ; prevod hodnoty 0-15 na ASCII znak mov [message + 1], al ; zapis ASCII znaku do retezce print message %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: mov ebx, 0x00030000 ; nastavení bitu bsf eax, ebx ; vyhledání prvního nenulového bitu print_hex al ; výsledek je v EAX, ovšem nám stačí jen AL wait_key exit ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) message db 0x01, 0x01, 0x0d, 0x0a, "$" ; prevodni tabulka hodnoty 0-15 na ASCII znak hex_digits db "0123456789abcdef"

Tento program po svém spuštění vypíše hexadecimální hodnotu 10, protože první nenulový bit zprava je skutečně na pozici číslo 16 (počítáno od nuly). Ovšem pokud zaměníme instrukci BSF za BSR, vypíše se hexadecimální hodnota 11, jelikož hledáme první nenulový bit zleva (od nejvyššího bitu). Tato varianta příkladu vypadá následovně:

; Instrukcni soubor mikroprocesoru Intel 80386. ; Test instrukce BSR. ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 386 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ; tisk retezce na obrazovku %macro print 1 mov dx, %1 mov ah, 9 int 0x21 %endmacro ; tisk hexadecimalni hodnoty %macro print_hex 1 mov bx, hex_digits mov cl, %1 ; zapamatovat si predanou hodnotu mov al, cl ; do AL se vlozi horni hexa cifra and al, 0xf0 shr al, 1 shr al, 1 shr al, 1 shr al, 1 xlat ; prevod hodnoty 0-15 na ASCII znak mov [message], al ; zapis ASCII znaku do retezce mov al, cl ; do BL se vlozi dolni hexa cifra and al, 0x0f xlat ; prevod hodnoty 0-15 na ASCII znak mov [message + 1], al ; zapis ASCII znaku do retezce print message %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: mov ebx, 0x00030000 ; nastavení bitu bsr eax, ebx ; vyhledání prvního nenulového bitu print_hex al ; výsledek je v EAX, ovšem nám stačí jen AL wait_key exit ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) message db 0x01, 0x01, 0x0d, 0x0a, "$" ; prevodni tabulka hodnoty 0-15 na ASCII znak hex_digits db "0123456789abcdef"

18. Nastavení výsledku pravdivostní operace

Poslední sada instrukcí, které si dnes popíšeme, slouží pro nastavení hodnoty 0 nebo 1 do zvoleného osmibitového registru nebo do adresy v operační paměti. To, jaká hodnota se zapíše, záleží na vyhodnocení podmínky, přičemž samotné podmínky jsou naprosto stejné, jako u podmíněných skoků. Nastavením 0/1 se vlastně instrukční sada mikroprocesorů řady 80386 přibližuje požadavkům vyšších programovacích jazyků, zejména pak klasického céčka. V následující tabulce jsou uvedeny všechny jmenné aliasy instrukcí (mnohé instrukce mají stejný význam, jen odlišné jméno):

Instrukce Operandy Stručný popis instrukce SETO Set to 1 if Overflow OF = 1 SETNO Set to 1 if Not Overflow OF = 0 SETS Set to 1 if Sign SF = 1 SETNS Set to 1 if Not Sign SF = 0 SETE Set to 1 if Equal ZF = 1 SETZ Set to 1 if Zero ZF = 1 SETNE Set to 1 if Not Equal ZF = 0 SETNZ Set to 1 if Not Zero ZF = 0 SETB Set to 1 if Below CF = 1 SETNAE Set to 1 if Not Above or Equal CF = 1 SETC Set to 1 if Carry CF = 1 SETNB Set to 1 if Not Below CF = 0 SETAE Set to 1 if Above or Equal CF = 0 SETNC Set to 1 if Not Carry CF = 0 SETBE Set to 1 if Below or Equal CF = 1 | ZF = 1 SETNA Set to 1 if Not Above CF = 1 | ZF = 1 SETA Set to 1 if Above CF = 0 & ZF = 0 SETNBE Set to 1 if Not Below or Equal CF = 0 & ZF = 0 SETL Set to 1 if Less SF <> OF SETNGE Set to 1 if Not Greater or Equal SF <> OF SETGE Set to 1 if Greater or Equal SF = OF SETNL Set to 1 if Not Less SF = OF SETLE Set to 1 if Less or Equal ZF = 1 | SF <> OF SETNG Set to 1 if Not Greater ZF = 1 | SF <> OF SETG Set to 1 if Greater ZF = 0 & SF = OF SETNLE Set to 1 if Not Less or Equal ZF = 0 & SF = OF SETP Set to 1 if Parity PF = 1 SETPE Set to 1 if Parity Even PF = 1 SETNP Set to 1 if Not Parity PF = 0 SETPO Set to 1 if Parity Odd PF = 0

19. Repositář s demonstračními příklady

Demonstrační příklady napsané v assembleru, které jsou určené pro překlad s využitím assembleru NASM, byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/8bit-fame. Jednotlivé demonstrační příklady si můžete v případě potřeby stáhnout i jednotlivě bez nutnosti klonovat celý (dnes již poměrně rozsáhlý) repositář:

20. Odkazy na Internetu