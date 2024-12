Obsah

1. Kvantitativní a kvalitativní vývoj mikroprocesorů z rodiny 80×86

2. První čtyři generace: od původního Intelu 8086 až k 80486DX4

3. Splňuje rodina 80×86 Moorův zákon?





4. Interní optimalizace: zlepšující se rychlost vykonávání instrukcí

5. Nové instrukce podporované čipem Intel 80186

6. Instrukce PUSH konstanta

7. Ukázka použití instrukce PUSH konstanta

8. Instrukce PUSHA a POPA

9. Ukázka použití instrukcí PUSHA a POPA

10. Znaménkové násobení konstantou

11. Použití instrukce pro znaménkové násobení konstantou

12. Krátká odbočka: instrukce INTO

13. Provedení aritmetické operace s testem na přetečení výsledku

14. Instrukce BOUND pro test, zda index nepřesahuje meze pole

15. Naivní, ovšem nekorektní přerušovací rutina pro instrukci BOUND

16. Korektní varianta přerušovací rutiny pro instrukci BOUND

17. Bitové posuny a rotace o konstantu větší než 1

18. Nepodporované instrukce: POP CS

19. Repositář s demonstračními příklady

20. Odkazy na Internetu

1. Kvantitativní a kvalitativní vývoj mikroprocesorů z rodiny 80×86

Prozatím jsme v tomto seriálu v naprosté většině demonstračních příkladů využívali instrukční sadu původních šestnáctibitových mikroprocesorů Intel 8086 a Intel 8088 (ty jsou z hlediska instrukcí i jejich délky prakticky totožné). Připomeňme si, že se dnes jedná o historické čipy, které byly na trh uvedeny v letech 1978 a 1979. O přibližně dva roky později použila společnost IBM mikroprocesor Intel 8088 jako základní prvek osobního mikropočítače IBM PC, z něhož se postupně vyvinula celá platforma PC, jež se dodnes vyvíjí a používá (se všemi výhodami a zápornými vlastnostmi tohoto vývoje).

Ovšem postupně se vyvíjely i mikroprocesory odvozené od původního poměrně primitivního Intelu 8086 (resp. jeho ořezané varianty Intel 8088). Rozšiřovala se instrukční sada o nové instrukce a adresovací režimy, přidávaly se nové pracovní registry, přidávaly se nové režimy činnosti mikroprocesoru (chráněný režim 286, odlišný chráněný režim 386, virtuální režim) atd. Ovšem současně se kromě těchto kvantitativních změn vylepšovala i interní architektura mikroprocesorů, což například vedlo k urychlení instrukcí. U řady instrukcí jsme tak postupně došli od jejich vykonání v několika desítkách strojových cyklů například na jediný strojový cyklus a poté na možnost dokončit v jednom cyklu více souběžně prováděných instrukcí.

2. První čtyři generace: od původního Intelu 8086 až k 80486DX4

V řadě x86 nalezneme několik desítek (dnes možná i několik set) různých mikroprocesorů. Zaměřme se tedy nejprve na první čtyři generace řady x86, která začíná již výše zmíněným mikroprocesorem Intel 8086 a končí mikroprocesorem 80486DX4, jenž je z pohledu frekvence přibližně dvacetkrát rychlejší, než původní 8086, ovšem díky optimalizacím ve skutečnosti dosahuje více než osmdesátinásobného(!) výpočetního výkonu v porovnání s první verzí 8086 (nehledě na to, že v 80486DX4 je i matematický koprocesor a rapidně se zvýšilo i množství adresovatelné paměti).

Podívejme se na následující tabulku, v níž jsou vypsány všechny důležité mikroprocesory řady x86 (neboli, pokud použijeme alternativní označení, rodiny 80×86) vyráběné společností Intel a patřící do prvních čtyř generací:

Mikroprocesor Rok uvedení Frekvence (MHz) Tranzistorů Poznámka 8086 1978 5, 8, 10 29000 praotec celé rodiny 80×86 8088 1979 4,77 a 8 29000 byl použit v původním IBM PC 80186 1982 6 55000 využíván jako mikrořadič, nikoli jako procesor v počítačích 80188 1982 6 55000 varianta 80186 s osmibitovou vnější sběrnicí 80286 1982 6, 8, 12,5, 16, 20, 25 134000 použit v PC AT 80386DX 1985 16, 20, 25, 33 275000 první 32bitový čip z rodiny 80×86 80386SX 1988 16, 20, 25, 33 275000 varianta 80386DX se šestnáctibitovou datovou sběrnicí 80386SL 1990 20, 25 855000 obsahuje i cache a řadiče sběrnice a paměti 80486DX 1989 25, 33, 50 1200000 cca 50× výkonnější, než původní 8088 80486SX 1991 16, 20, 25, 33 1185000 bez povoleného matematického koprocesoru (nebo zcela bez FPU) 80486DX2 1992 40, 50, 66 1185000 dvojnásobná interní frekvence oproti frekvenci externí 80486SL 1992 20, 25, 33 1400000 určeno pro notebooky 80486DX4 1994 75, 100 1600000 trojnásobná (!) interní frekvence oproti frekvenci externí

Poznámka: DX4 tedy neznamená čtyřnásobnou frekvenci oproti původnímu DX (což platilo jen u DX2).

3. Splňuje rodina 80×86 Moorův zákon?

Do tabulky uvedené v předchozí kapitole byly zapsány i přibližné počty tranzistorů u jednotlivých typů mikroprocesorů. Vzhledem k tomu, že se jedná o mikroprocesory společnosti Intel, jejímž zakladatelem je Gordon Moore, bude zajímavé zjistit, jestli i mikroprocesory řady x86 dobře odpovídají Moorovu zákonu, který říká (říkal), že každé dva roky dochází ke zdvojnásobení počtu tranzistorů na čipech s velkou integrací (a sem mikroprocesory pochopitelně spadají). Zkusme si tedy vykreslit grafy s počty tranzistorů u prvních čtyř generací mikroprocesorů řady x86 a současně teoretické počty tranzistorů odpovídajících Moorovu zákonu v případě, že v roce 1978 začneme s 10000 tranzistory resp. s 25000 tranzistory (začneme tedy o něco níže, než 29000 tranzistorů u původního Intelu 8086).

Zobrazíme si jak graf s lineárním měřítkem na vertikální ose, tak i přehlednější graf, který má na vertikální ose měřítko logaritmické:

Obrázek 1: Počet tranzistorů na mikroprocesorech rodiny 80×86 vs. Moorův zákon (lineární měřítko na y-ové ose).

Obrázek 2: Počet tranzistorů na mikroprocesorech rodiny 80×86 vs. Moorův zákon (logaritmické měřítko na y-ové ose).

Poznámka: na konci je patrné „zpoždění“ řady x86, což je ovšem poněkud zavádějící, protože současně s nejvýkonnějšími čipy DX4 bylo vydáno i první Pentinum s přibližně třemi miliony tranzistorů. Z tohoto pohledu je DX4 jen pokusem o co největší „vytěžení“ možností této čtvrté generace, protože Pentium už představovalo v některých ohledech nově koncipovaný čip (i když původní P5 toho mělo s řadou 486 mnoho společného).

4. Interní optimalizace: zlepšující se rychlost vykonávání instrukcí

Postupně rostoucí počet tranzistorů sám o sobě ovšem nic nevypovídá o skutečné rychlosti mikroprocesoru, protože do značné míry záleží na tom, jakým způsobem jsou tyto tranzistory využity. Postupně rostoucí kvalita implementace instrukcí (například přidáním nové specializované sčítačky pro výpočty adres, přidání fronty instrukcí, možnost takzvaného prefetchingu instrukcí, implementace RISCové pipeline atd.) vedla k tomu, že se postupně snižoval počet cyklů nutných pro dokončení instrukcí. To tedy znamená, že i když mohl být jak mikroprocesor Intel 8086, tak i Intel 80286 provozován na stejné frekvenci 8MHz, bude 80286 ve skutečnosti rychlejší. Ukažme si to například na základní instrukci součtu dvou osmibitových nebo šestnáctibitových hodnot – ADD. Délka výpočtů se odlišuje podle typů operandů a taktéž podle typu mikroprocesoru (čím menší číslo je v tabulce uvedeno, tím lépe):

Operandy 8086/88 186 286 386 486 Pentium reg, reg 3 3 2 2 1 1 mem, reg 24+EA 10 7 7 3 3 reg, mem 13+EA 10 7 6 2 2 reg, imm 4 4 3 2 1 1 mem, imm 23+EA 16 7 7 3 3 acc, imm 4 4 3 2 1 1

Přičemž u čipů 8086/8088 se přidává několik cyklů pro EA neboli pro výpočet efektivní adresy:

Adresování Počet cyklů EA reg+offset 5 přímá adresa 6 BP+DI nebo BX+SI 7 BX+DI nebo BP+SI 8 BP+DI+disp nebo BX+SI+disp 11 BX+DI+disp nebo BP+SI+disp 12

Navíc, pokud se mění (explicitně specifikuje) segmentový registr, je nutné přičíst další dva hodinové cykly.

Poznámka: už u čipu 186 byla přidána samostatná sčítačka pro výpočty adresy, takže se nemusela používat universální ALU. Díky tomu už výpočet efektivní adresy nebyl tak pomalý.

5. Nové instrukce podporované čipem Intel 80186

Po mikroprocesorech Intel 8086 a Intel 8088 (1978 a 1979) následoval v roce 1982 mikroprocesor Intel 80186. Ten se používal spíše ve funkci mikrořadiče, takže z pohledu vývoje IBM PC je poněkud méně zajímavý. Ovšem důležité je, že právě do 80186 byly přidány některé instrukce, které v původní instrukční sadě relativně citelně chyběly. Jedná se o instrukce, o nichž se stále (chybně) píše jako o instrukcích přidaných až v 80286. Ovšem ve skutečnosti byly do 80286 přidány „jen“ instrukce související s chráněným režimem.

V následující tabulce jsou vypsány ty instrukce, které bylo možné použít již v mikroprocesoru 80186:

Instrukce Operandy Stručný popis IMUL konstanta násobení se znaménkem se specifikací konstanty jako druhého operandu PUSH konstanta uložení šestnáctibitové hodnoty na zásobník PUSHA uložení pracovních registrů na zásobník POPA obnovení pracovních registrů ze zásobníku INS (implicitní DX) přečtení bajtu nebo slova z portu do ES , zvýšení DI OUTS (implicitní DX) zápis bajtu nebo slova z DS na port, zvýšení SI ENTER size, počet nastavení zásobníkového rámce LEAVE obnovení SP a BP do doby před instrukcí ENTER BOUND registr, paměť kontrola, zda hodnota uložená v registru nepřesahuje limity RCL/RCR/ROL/ROR/SHL/SHR/SAL/SAR registr, konstanta rotace nebo bitový posun o zadaný počet bitů doleva nebo doprava

6. Instrukce PUSH konstanta

První novou instrukcí, s níž se dnes setkáme, je instrukce PUSH konstanta, což je varianta instrukce určené pro uložení nějaké hodnoty na zásobník. Původní čipy 8086/8088 podporovaly uložení obsahu libovolného šestnáctibitového registru, uložení obsahu segmentového registru nebo uložení šestnáctibitové hodnoty přečtené z paměti. Nová forma podporuje i uložení šestnáctibitové konstanty.

Instrukci PUSH, která dokáže na zásobník uložit šestnáctibitovou konstantu, můžeme použít například ve chvíli, kdy je zapotřebí konstantu přenést do nějakého segmentového registru. Taková operace by se mohla provést instrukcí MOV, jenže varianta MOV segment_registr, konstanta není dostupná, a to ani v dalších třech generacích čipů rodiny 80×86.

7. Ukázka použití instrukce PUSH konstanta

Podívejme se na příklad, který jsme si již v tomto seriálu ukazovali. Tento příklad po svém spuštění naplní obrazovou paměť v textovém režimu různými hodnotami znaků+atributů. Přitom se obrazová paměť adresuje přes segmentový registr ES. V původní variantě jsme prováděli naplnění ES takto:

mov ax, 0xb800 ; video RAM v textovem rezimu mov es, ax

Nyní provedeme odlišnou sekvenci operací a nezničíme si tak obsah registru AX (ovšem na úkor rychlosti – tato varianta trvá delší počet cyklů):

push 0xb800 ; video RAM v textovem rezimu pop es

Délka obou řešení je rozdílná, protože druhé řešení je o jeden bajt kratší:

B800B8 mov ax, 0xb800 8EC0 mov es, ax 6800B8 push 0xb800 07 pop es

Upravený zdrojový kód demonstračního příkladu vypadá následovně:

;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 286 ; specifikace pouziteho instrukcniho souboru ;----------------------------------------------------------------------------- ; ukonceni procesu a navrat do DOSu %macro exit 0 mov ah, 0x4c int 0x21 %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ; nastaveni grafickeho rezimu %macro gfx_mode 1 mov ah, 0 mov al, %1 int 0x10 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: gfx_mode 3 ; nastaveni standardniho textoveho rezimu 80x25 znaku push 0xb800 ; video RAM v textovem rezimu pop es mov di, 0 ; nyni ES:DI obsahuje adresu prvniho znaku ve video RAM mov cx, 80*25 ; pocet zapisovanych znaku mov al, 0 ; kod zapisovaneho znaku opak: stosb ; zapis znaku + atributu stosb inc al ; dalsi znak/atribut loop opak ; opakujeme CX-krat mov dx, 0x3d8 ; port s rizenim graficke palety mov al, 0x18 ; pozadi neblika, meni se intenzita out dx, al ; pres port 0x3d9 wait_key mov dx, 0x3d8 ; port s rizenim graficke palety mov al, 0x38 ; pozadi opet blika, nizka intenzita out dx, al ; pres port 0x3d9 wait_key wait_key ; cekani na klavesu exit ; navrat do DOSu

8. Instrukce PUSHA a POPA

V mnoha situacích se setkáme s nutností uložení většího množství registrů na zásobník. Tato operace trvá na 80186 deset cyklů a na 80286 tři cykly. Pokud je zapotřebí uložit více registrů, použije se více těchto instrukcí a časy se pochopitelně sčítají. Instrukce PUSHA naproti tomu uloží všechny pracovní registry v pořadí AX, CX, DX, BX, SP, BP, SI, DI a celková doba jejího trvání je 36 resp. 17 cyklů (v dalších generacích ještě méně).

Podobně instrukce POP jednoho registru trvá 10 resp. 5 cyklů pro každý registr, zatímco POPA provede obnovení registrů v pořadí DI, SI, BP, SP, BX, DX, CX, AX a celková doba jejího trvání je 51 resp. 19 cyklů. To znamená, že pokud ukládáme/obnovujeme čtyři nebo více registrů, je výhodnější použít PUSHA+POPA, což je i mnohem kratší řešení z pohledu délky strojového kódu.

9. Ukázka použití instrukcí PUSHA a POPA

S instrukcemi PUSHA a POPA jsme se setkali při programování obsluhy nějakého přerušení. Typická přerušovací rutina totiž na svém začátku uloží všechny v ní použité registry na zásobník a na konci je zase obnoví. V případě, že se nám nechce sledovat, které registry uložit (a poté obnovit) sekvencí instrukcí PUSH a posléze POP, nebo pokud je registrů větší množství, použijeme právě PUSHA a POPA. Připomeňme si, jak taková rutina může vypadat:

int8_handler: ; nova obsluha preruseni pusha ; ulozit vsechny registry print_char 't' ; t=tick mov al, 0x20 out 0x20, al ; oznameni, ze preruseni je u konce radici preruseni popa ; obnovit vsechny registry sti ; povoleni maskovatelnych preruseni iret ; navrat z preruseni

Způsob překladu do strojového kódu naznačuje, jak krátké (z pohledu obsazení paměti) tyto instrukce ve skutečnosti jsou:

int8_handler: ; nova obsluha preruseni 60 pusha ; ulozit vsechny registry print_char 't' ; t=tick B402 mov ah, 0x02 B274 mov dl, %1 CD21 int 0x21 B020 mov al, 0x20 E620 out 0x20, al ; oznameni, ze preruseni je u konce radici preruseni 61 popa ; obnovit vsechny registry FB sti ; povoleni maskovatelnych preruseni CF iret ; navrat z preruseni

10. Znaménkové násobení konstantou

Další nová varianta instrukce, se kterou jsme se mohli setkat u čipů Intel 80186 (a samozřejmě i u všech mikroprocesorů, které následovaly) je násobení se znaménkem, v podobě, kdy je druhým operandem konstanta a kdy je specifikován i registr, do kterého se má uložit výsledek. Jedná se o instrukci IMUL, která má velké množství variant. Vypišme si jen osmibitové a šestnáctibitové varianty. V poznámce je uvedeno, od jakého čipu jsou tyto varianty dostupné:

IMUL reg8 IMUL reg16 IMUL mem8 IMUL mem16 IMUL reg16, konstanta ; od 286 IMUL reg16, reg16, konstanta ; od 186 IMUL reg16, mem16, konstanta ; od 186 IMUL reg16, reg16 ; od 386 IMUL reg16, mem16 ; od 386

11. Použití instrukce pro znaménkové násobení konstantou

Vlastní použití instrukce IMUL reg16, reg16, konstanta je snadné, jak je to ostatně patrné i z následujícího demonstračního příkladu, v němž vynásobíme obsah registru BX dvěma, takže výsledkem bude hexadecimální hodnota 0×06:

; Instrukcni soubor mikroprocesoru Intel 80286. ; Test instrukce IMUL s konstantnim operandem. ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 286 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ; tisk retezce na obrazovku %macro print 1 mov dx, %1 mov ah, 9 int 0x21 %endmacro ; tisk hexadecimalni hodnoty %macro print_hex 1 mov bx, hex_digits mov cl, %1 ; zapamatovat si predanou hodnotu mov al, cl ; do AL se vlozi horni hexa cifra and al, 0xf0 shr al, 1 shr al, 1 shr al, 1 shr al, 1 xlat ; prevod hodnoty 0-15 na ASCII znak mov [message], al ; zapis ASCII znaku do retezce mov al, cl ; do BL se vlozi dolni hexa cifra and al, 0x0f xlat ; prevod hodnoty 0-15 na ASCII znak mov [message + 1], al ; zapis ASCII znaku do retezce print message %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: xor ax, ax ; výsledný registr mov bx, 0x03 ; první operand imul ax, bx, 2 ; násobení konstantou print_hex al ; výsledek je v AX wait_key exit ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) message db 0x01, 0x01, 0x0d, 0x0a, "$" ; prevodni tabulka hodnoty 0-15 na ASCII znak hex_digits db "0123456789abcdef"

Výše uvedená varianta IMUL je přeložena do tříbajtové sekvence:

58 00000000 31C0 xor ax, ax ; výsledný registr 59 00000002 BB0300 mov bx, 0x03 ; první operand 60 00000005 6BC302 imul ax, bx, 2 ; násobení konstantou

12. Krátká odbočka: instrukce INTO

Ještě před popisem dalších instrukcí, které byly přidány do instrukčního souboru mikroprocesoru Intel 80186 se na chvíli zastavme u instrukce původního Intelu 8086, kterou jsme si ještě nepopsali. Jedná se o instrukci nazvanou INTO, což je instrukce, jejíž mnemotechnická zkratka vznikla ze slov „(call) interrupt procedure if overflow“. Tato instrukce zkontroluje obsah příznakového bitu overflow (OF) a pokud je tento bit nastaven, vyvolá se přerušení číslo 4, tj. provede se vlastně instrukce INT 4. Tuto instrukci tedy může do programového kódu vkládat například překladač vyššího programovacího jazyka ve chvíli, kdy je povolena kontrola přetečení výsledků (příkladem může být Pascal atd.) a kdy se má vždy vyvolat stejná přerušovací rutina. Není tedy nutné provádět instrukce JO/JNO, které jsou zbytečně dlouhé, protože instrukce INTO je zakódována do jediného bajtu.

13. Provedení aritmetické operace s testem na přetečení výsledku

Vyzkoušejme si nyní, jak vlastně může vypadat obsluha přerušení, která vypíše nějaké hlášení ve chvíli, kdy při výpočtech dojde k přetečení:

int4_handler: ; obsluha preruseni cislo 4 pusha ; ulozit vsechny registry print overflow_msg popa ; obnovit vsechny registry sti ; povoleni maskovatelnych preruseni iret ; navrat z preruseni

Tuto přerušovací rutinu musíme pochopitelně zapsat do tabulky vektorů přerušení:

INT_4_VECTOR equ 4*4 ; adresa vektoru preruseni xor ax, ax mov es, ax mov di, INT_4_VECTOR ; ES:DI obsahuje adresu, na ktere je adresa obsluhy preruseni 4 cli ; zakaz preruseni lea ax, int4_handler ; zmena offsetove casti adresy mov es:[di], ax mov ax, cs ; zmena segmentove casti adresy mov es:[di+2], ax sti ; povoleni preruseni

A následně již můžeme po výpočtech použít instrukci INTO pro test, zda došlo k přetečení či nikoli:

mov al, 10 add al, al ; soucet dvou hodnot into ; test na preteceni -> vyvolani preruseni

popř.

mov al, 100 add al, al ; soucet dvou hodnot into ; test na preteceni -> vyvolani preruseni

14. Instrukce BOUND pro test, zda index nepřesahuje meze pole

Další instrukcí určenou primárně pro strojový kód generovaný překladači vyšších programovacích jazyků je instrukce nazvaná BOUND. Tato instrukce kontroluje, zda nějaký šestnáctibitový index uložený v libovolném pracovním registru nepřesahuje dolní nebo horní mez rozsahu pole, přičemž tento rozsah je uložen v operační paměti na specifikované adrese (první dva bajty obsahují dolní index, další dva bajty obsahují index horní). Představme si například zdrojový kód napsaný v Pascalu, v němž je možné specifikovat horní i dolní meze indexů polí:

arr : Array[10..20] Of Integer;

Povolené indexy tedy začínají od 10 a končí u 20. Pokud je pole v operační paměti uloženo takovým způsobem, že první čtyři bajty obsahují meze indexů polí (což je poměrně triviální a přitom praktický způsob uložení pole) a pokud je index, s nímž pracujeme, uložen například v registru AX, můžeme zkontrolovat, jestli je index korektní, takto:

bound ax, [pole]

V případě, že index leží v potřebném rozsahu, instrukce po 35(!) taktech skončí. Pokud však index leží mimo rozsah, vyvolá se přerušení INT 5 (nikoli INT 4, jako u INTO). A samozřejmě i na tuto skutečnost můžeme potřebným způsobem reagovat vlastní přerušovací rutinou.

15. Naivní, ovšem nekorektní přerušovací rutina pro instrukci BOUND

Zkusme si nyní zaregistrovat rutinu nazvanou int5_handler, která bude zavolána ve chvíli, kdy dojde k přerušení číslo 5, ať již vlivem instrukce INT 5 nebo nepřímo přes instrukci BOUND. Samotná registrace takové rutiny se nijak neliší od registrace rutiny pro přerušení číslo 4, pochopitelně se však bude provádět zápis na jiné místo tabulky přerušovacích vektorů:

INT_5_VECTOR equ 5*4 ; adresa vektoru preruseni xor ax, ax mov es, ax mov di, INT_5_VECTOR ; ES:DI obsahuje adresu, na ktere je adresa obsluhy preruseni 5 cli ; zakaz preruseni lea ax, int5_handler ; zmena offsetove casti adresy mov es:[di], ax mov ax, cs ; zmena segmentove casti adresy mov es:[di+2], ax sti ; povoleni preruseni

První verze rutiny s obsluhou přerušení může vypadat následovně – pouze vypíšeme zprávu „index out of bounds!“ a subrutinu následně ukončíme:

int5_handler: ; obsluha preruseni cislo 5 pusha ; ulozit vsechny registry print index_out_of_bounds_msg popa ; obnovit vsechny registry sti ; povoleni maskovatelnych preruseni iret ; navrat z preruseni -> nyni se vracime zpet na instrukci BOUND

Pokusme se nyní tuto subrutinu zavolat – index 100 leží mimo povolený rozsah 0 až 99:

mov ax, 100 ; nacteni indexu bound ax, [bounds] ; test indexu bounds dw 0, 99

Pokud takto upravený demonstrační příklad přeložíme a spustíme, začne se na terminál neustále dokola vypisovat zpráva:

index out of bounds! index out of bounds! index out of bounds! ... ... ...

Proč tomu tak je a jak bude možné tento příklad opravit, si řekneme v navazující kapitole. Nyní bude pro úplnost ukázán celý zdrojový kód tohoto demonstračního příkladu:

; Instrukcni soubor mikroprocesoru Intel 80286. ; Instrukce BOUND - nekorektni verze programu. ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 286 ; specifikace pouziteho instrukcniho souboru INT_5_VECTOR equ 5*4 ; adresa vektoru preruseni ;----------------------------------------------------------------------------- ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ; tisk retezce na obrazovku %macro print 1 mov dx, %1 mov ah, 9 int 0x21 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: xor ax, ax mov es, ax mov di, INT_5_VECTOR ; ES:DI obsahuje adresu, na ktere je adresa obsluhy preruseni 5 cli ; zakaz preruseni lea ax, int5_handler ; zmena offsetove casti adresy mov es:[di], ax mov ax, cs ; zmena segmentove casti adresy mov es:[di+2], ax sti ; povoleni preruseni mov ax, 100 ; nacteni indexu bound ax, [bounds] ; test indexu print done_msg ; vypis zpravy, ze koncime wait_key exit ; a skutecne skoncime int5_handler: ; obsluha preruseni cislo 5 pusha ; ulozit vsechny registry print index_out_of_bounds_msg popa ; obnovit vsechny registry sti ; povoleni maskovatelnych preruseni iret ; navrat z preruseni -> nyni se vracime zpet na instrukci BOUND ;----------------------------------------------------------------------------- bounds dw 0, 99 ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) index_out_of_bounds_msg db "index out of bounds!", 13, 10, "$" ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) done_msg db "done.", 13, 10, "$"

16. Korektní varianta přerušovací rutiny pro instrukci BOUND

Důvod, proč jsme se ocitli de facto v nekonečné smyčce, spočívá v tom, že instrukce BOUND před vyvoláním přerušovací rutiny uloží na zásobník adresu instrukce BOUND a nikoli adresu následující instrukce. To znamená, že po dokončení přerušovací rutiny instrukcí IRET se znovu provede test indexu 100 na meze 0..99 a znovu se vyvolá ta stejná subrutina. Musíme se tedy vrátit nikoli přímo na instrukci BOUND, ale za ni. Tato instrukce má délku čtyř bajtů (operační kód + bajt s určením registru + dva bajty s adresou), takže musíme ze zásobníku získat původní adresu a tu zvýšit o hodnotu 4. Jedno z možných řešení může vypadat následovně:

int5_handler: ; obsluha preruseni cislo 5 pusha ; ulozit vsechny registry print index_out_of_bounds_msg popa ; obnovit vsechny registry pop ax add ax, 4 ; preskocit samotnou instrukci BOUND push ax sti ; povoleni maskovatelnych preruseni iret ; navrat z preruseni -> nyni se ovsem vracime ZA instrukci BOUND

Nyní už by se při spuštění programu mělo na terminálu objevit pouze:

index out of bounds! done.

Následuje úplný výpis zdrojového kódu tohoto demonstračního příkladu:

; Instrukcni soubor mikroprocesoru Intel 80286. ; Instrukce BOUND - korektni verze programu. ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 286 ; specifikace pouziteho instrukcniho souboru INT_5_VECTOR equ 5*4 ; adresa vektoru preruseni ;----------------------------------------------------------------------------- ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ; tisk retezce na obrazovku %macro print 1 mov dx, %1 mov ah, 9 int 0x21 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: xor ax, ax mov es, ax mov di, INT_5_VECTOR ; ES:DI obsahuje adresu, na ktere je adresa obsluhy preruseni 5 cli ; zakaz preruseni lea ax, int5_handler ; zmena offsetove casti adresy mov es:[di], ax mov ax, cs ; zmena segmentove casti adresy mov es:[di+2], ax sti ; povoleni preruseni mov ax, 99 ; nacteni indexu bound ax, [bounds] ; test indexu mov ax, 100 ; nacteni indexu bound ax, [bounds] ; test indexu mov ax, 101 ; nacteni indexu bound ax, [bounds] ; test indexu print done_msg ; vypis zpravy, ze koncime wait_key exit ; a skutecne skoncime int5_handler: ; obsluha preruseni cislo 5 pusha ; ulozit vsechny registry print index_out_of_bounds_msg popa ; obnovit vsechny registry pop ax add ax, 4 ; preskocit samotnou instrukci BOUND push ax sti ; povoleni maskovatelnych preruseni iret ; navrat z preruseni -> nyni se ovsem vracime ZA instrukci BOUND ;----------------------------------------------------------------------------- bounds dw 0, 99 ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) index_out_of_bounds_msg db "index out of bounds!", 13, 10, "$" ; retezec ukonceny znakem $ ; (tato data jsou soucasti vysledneho souboru typu COM) done_msg db "done.", 13, 10, "$"

17. Bitové posuny a rotace o konstantu větší než 1

Mikroprocesory Intel 8086 a Intel 8088 podporovaly úplnou sadu instrukcí pro bitové posuny a rotace:

Instrukce Význam SHL posun bitů doleva SAL aritmetický posun bitů doleva (stejné jako předchozí instrukce) SHR bitový posun doprava SAR aritmetický posun doprava ROL rotace doleva ROR rotace doprava RCL rotace doleva přes Carry RCR rotace doprava přes Carry

Posun či rotace je přitom provedena o jeden bit nebo o CL bitů (CL je spodních osm bitů registru CX). U mikroprocesorů 80186 byla navíc přidána možnost posunů a rotací o n bitů, kde n je celočíselná konstanta. Program je tedy možné zkrátit, ovšem pozor je nutné dát na to, že zatímco rotace/posun o jeden bit trvá 2 takty, rotace/posun o n bitů trvá 5+n taktů, což například v praxi znamená, že posun doprava o dva bity je výhodnější provést dvojicí instrukci SHR registr, 1 a nikoli jedinou instrukcí SHR registr, 2.

Podívejme se nyní na úpravu subrutiny pro obarvení pixelu v režimu 320×200×256, v níž namísto několika posunů o jeden bit použijeme posuny o větší počet bitů:

; Vykresleni pixelu ; AX - x-ova souradnice ; BX - y-ova souradnice (staci len BL) ; CL - barva putpixel: mov dx, 0xa000 ; zacatek stranky video RAM mov es, dx ; nyni obsahuje ES stranku video RAM mov di, ax ; horizontalni posun pocitany v bajtech mov ax, bx ; y-ova souradnice shl ax, 6 ; y*64 add di, ax ; pricist cast y-oveho posunu shl ax, 2 ; y*256 add di, ax ; pricist zbytek y-oveho posunu ; -> y*64 + y*256 = y*320 mov [es:di], cl ; vlastni vykresleni pixelu ret

Poznámka: druhé SHL je vhodné rozepsat na dvojici SHL AX, 1.

Celý program, který nastaví grafický režim 320×200×256 a následně vykreslí několik úseček, lze upravit následovně:

; Graficky rezim karty VGA s rozlisenim 320x200 pixelu. ; Pouziti predpocitane tabulky. ; Vykresleni barevnych usecek. ; Urceno pro 80286 a vyssi. ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 286 ; specifikace pouziteho instrukcniho souboru ;----------------------------------------------------------------------------- ; ukonceni procesu a navrat do DOSu %macro exit 0 mov ah, 0x4c int 0x21 %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ; nastaveni grafickeho rezimu %macro gfx_mode 1 mov ah, 0 mov al, %1 int 0x10 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: gfx_mode 0x13 ; nastaveni rezimu 320x200 s 256 barvami push 0xa000 ; video RAM v textovem rezimu pop es xor di, di ; nyni ES:DI obsahuje adresu prvniho pixelu ve video RAM mov ax, 0 opak: mov bx, ax ; y-ová souřadnice push ax mov cl, al ; barva call putpixel ; vykreslení pixelu pop ax push ax mov cl, al ; barva add ax, 10 ; horizontalni posun useky call putpixel ; vykreslení pixelu pop ax push ax mov cl, al ; barva add ax, 20 ; horizontalni posun useky call putpixel ; vykreslení pixelu pop ax inc ax ; pusun x+=1, y+=1 cmp ax, 200 ; hranice obrazovky? jne opak ; ne-opakujeme wait_key ; cekani na klavesu exit ; navrat do DOSu ; Vykresleni pixelu ; AX - x-ova souradnice ; BX - y-ova souradnice (staci len BL) ; CL - barva putpixel: mov dx, 0xa000 ; zacatek stranky video RAM mov es, dx ; nyni obsahuje ES stranku video RAM mov di, ax ; horizontalni posun pocitany v bajtech mov ax, bx ; y-ova souradnice shl ax, 6 ; y*64 add di, ax ; pricist cast y-oveho posunu shl ax, 2 ; y*256 add di, ax ; pricist zbytek y-oveho posunu ; -> y*64 + y*256 = y*320 mov [es:di], cl ; vlastni vykresleni pixelu ret

18. Nepodporované instrukce: POP CS

V rámci postupného rozšiřování instrukční sady mikroprocesorů rodiny 80×86 se ukázalo, že některé instrukce nejsou užitečné a je tak možné jejich instrukční kód použít pro odlišné účely. Při přechodu z Intelu 8086/8088 na 80186/80286 došlo k jediné takové úpravě, která se konkrétně týkala instrukce POP CS s operačním kódem 0×0F. Tato instrukce ze zásobníku přečte šestnáctibitovou hodnotu a tu vloží do segmentového registru CS, čímž se ovlivní i adresa další instrukce, která se má přečíst z adresy CS:IP. POP CS sama o sobě prakticky nedává smysl, protože většinou bude na zásobníku plná adresa segment:offset a v tomto případě lze použít plnohodnotný „dlouhý“ RET. Proto byla instrukce POP CS odstraněna a její operační kód je v novějších typech mikroprocesorů použit pro odlišné účely.

Assemblery nás většinou budou varovat, pokud se POP CS pokusíme použít a současně budeme specifikovat, že cílový procesor je odlišný od původního 8086. Nicméně příslušný instrukční kód většinou do výsledného binárního programu vloží:

; Instrukcni soubor mikroprocesoru Intel 80386. ; ;----------------------------------------------------------------------------- BITS 16 ; 16bitovy vystup pro DOS CPU 286 ; specifikace pouziteho instrukcniho souboru ; ukonceni procesu a navrat do DOSu %macro exit 0 ret %endmacro ; vyprazdneni bufferu klavesnice a cekani na klavesu %macro wait_key 0 xor ax, ax int 0x16 %endmacro ;----------------------------------------------------------------------------- org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) start: push cs push ds push ss push es pop es pop ss pop ds pop cs wait_key exit

Ve výsledném programu (resp. v binárním souboru typu COM) bude na třicátém pátém bajtu skutečně operační kód instrukce POP CS:

35 00000007 0F pop cs

Nicméně současně nás bude assembler varovat, že výsledek nebude plně kompatibilní s cílovým procesorem:

35 ****************** warning: instruction obsolete and removed from the target CPU [-w+obsolete-removed]

Pro úplnost – takto vypadá výpis listingu vytvořeného assemblerem při překladu:

1 ; Instrukcni soubor mikroprocesoru Intel 80386. 2 ; 7 ;----------------------------------------------------------------------------- 8 9 BITS 16 ; 16bitovy vystup pro DOS 10 CPU 286 ; specifikace pouziteho instrukcniho souboru 11 12 ; ukonceni procesu a navrat do DOSu 13 %macro exit 0 14 ret 15 %endmacro 16 17 ; vyprazdneni bufferu klavesnice a cekani na klavesu 18 %macro wait_key 0 19 xor ax, ax 20 int 0x16 21 %endmacro 22 23 ;----------------------------------------------------------------------------- 24 org 0x100 ; zacatek kodu pro programy typu COM (vzdy se zacina na 256) 25 26 start: 27 00000000 0E push cs 28 00000001 1E push ds 29 00000002 16 push ss 30 00000003 06 push es 31 32 00000004 07 pop es 33 00000005 17 pop ss 34 00000006 1F pop ds 35 00000007 0F pop cs 35 ****************** warning: instruction obsolete and removed from the target CPU [-w+obsolete-removed] 36 37 wait_key 19 00000008 31C0 <1> xor ax, ax 20 0000000A CD16 <1> int 0x16 38 14 0000000C C3 <1> ret

19. Repositář s demonstračními příklady

Demonstrační příklady napsané v assembleru, které jsou určené pro překlad s využitím assembleru NASM, byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/8bit-fame. Jednotlivé demonstrační příklady si můžete v případě potřeby stáhnout i jednotlivě bez nutnosti klonovat celý (dnes již poměrně rozsáhlý) repositář:

