Obsah
1. SIMD instrukce v rozšíření SSE (2. část)
2. Skalární a vektorový rozdíl: instrukce SUBSS a SUBPS
3. Součin prvků vektorů instrukcí MULPS
4. Podíl prvků vektorů instrukcí DIVPS
5. Numerické unární operace podporované instrukční sadou SSE
6. Výpočet převrácených hodnot prvků vektoru
7. Výpočet druhé odmocniny prvků vektorů
8. Výpočet převrácené hodnoty odmocniny
9. Nalezení prvků s menší či větší hodnotou instrukcemi MINPS a MAXPS
10. Univerzální instrukce pro porovnání prvků dvou vektorů
11. Porovnání prvků vektorů na rovnost
12. Porovnání prvků vektorů na relaci „menší než“
14. Ukázka výpočtu, který vrací nekonečna a hodnoty NaN
15. Zjištění, které prvky vektorů jsou porovnatelné a které nikoli
16. Formáty SSE instrukcí (druhý pohled)
17. Tři formáty kódování instrukcí SSE
18. Seznam všech popsaných instrukcí SSE
19. Repositář s demonstračními příklady
1. SIMD instrukce v rozšíření SSE (2. část)
Na předchozí článek o využití SSE instrukcí v assembleru dnes navážeme. Popíšeme si totiž všechny ostatní unární i binární instrukce určené pro provádění numerických výpočtů, a to včetně instrukcí pro výpočet aproximace převrácené hodnoty, druhé odmocniny, hledání větších či menších prvků atd. Taktéž se zmíníme o instrukci pro porovnání prvků vektorů, která má celkem osm různých variant. A nezapomeneme ani na problematiku nekonečných hodnot a hodnot NaN (Not A Number), se kterými se můžeme při výpočtech s FP hodnotami relativně často setkat a které je nutné umět detekovat a pracovat s nimi.
2. Skalární a vektorový rozdíl: instrukce SUBSS a SUBPS
V předchozím článku jsme si mj. popsali i dvojici instrukcí nazvaných ADDSS a ADDPS. Připomeňme si ve stručnosti, že první z těchto instrukcí sečte nejnižší dva prvky vektorů, které jsou v SSE typu single. Z tohoto důvodu název příslušné instrukce končí na dvě „S“, protože se jedná o zkratku single scalar. Naproti tomu instrukce ADDPS sečte všechny čtyři dvojice prvků vektorů, takže koncové dva znaky „PS“ zde značí packed single.
Naprosto stejným způsobem vznikly názvy instrukcí SUBSS a SUBPS. Snadno rozpoznáme, že první z těchto instrukcí odečte nejnižší dva prvky vektorů (tedy jde o skalární rozdíl), zatímco druhá instrukce provede rozdíl všech dvojic prvků vektorů a uloží výsledek do prvního XMM registru.
Podívejme se nejdříve na způsob činnosti instrukce SUBSS:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, -1.0, 2.0
sse_val_2 dd 1.0, 1.0, 1.0, 1.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
subss xmm0, xmm1 ; rozdil skalarnich hodnot
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky vypsané po překladu a spuštění tohoto příkladu:
XMM0: 40000000 BF800000 3F800000 00000000
XMM1: 3F800000 3F800000 3F800000 3F800000
-----------------------------------
rozdíl: 40000000 BF800000 3F800000 BF800000
Což si můžeme transformovat do FP hodnot:
XMM0: 2.0 -1.0 1.0 0.0
XMM1: 1.0 1.0 1.0 1.0
------------------
rozdíl: 2.0 -1.0 1.0 -1.0
změna: ^^^
Podobným způsobem si můžeme otestovat instrukci SUBPS pro výpočet rozdílu všech prvků vektorů:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, -1.0, 2.0
sse_val_2 dd 1.0, 1.0, 1.0, 1.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
subps xmm0, xmm1 ; rozdil vektoru
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky:
XMM0: 40000000 BF800000 3F800000 00000000
XMM1: 3F800000 3F800000 3F800000 3F800000
-----------------------------------
rozdíl: 3F800000 C0000000 00000000 BF800000
Po transformaci do FP hodnot:
XMM0: 2.0 -1.0 1.0 0.0
XMM1: 1.0 1.0 1.0 1.0
------------------
rozdíl: 1.0 -2.0 0.0 -1.0
změna: ^^^ ^^^ ^^^ ^^^
3. Součin prvků vektorů instrukcí MULPS
V instrukční sadě SSE nalezneme i instrukce nazvané MULSS a MULPS, které provádí součin skalárních hodnot, resp. součin odpovídajících si prvků vektorů. V rámci stručnosti si ukážeme pouze instrukci MULPS, která (podle očekávání) všechny čtyři součiny provádí paralelně a tudíž i (na většině CPU) velmi rychle:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, -1.0, 2.0
sse_val_2 dd 2.0, 2.0, 2.0, 2.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
mulps xmm0, xmm1 ; soucin prvku vektou
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Opět se podívejme na výsledky, které získáme po překladu a spuštění tohoto demonstračního příkladu:
XMM0: 40000000 BF800000 3F800000 00000000
XMM1: 40000000 40000000 40000000 40000000
-----------------------------------
součin: 40800000 C0000000 40000000 00000000
Po transformaci na FP hodnoty:
XMM0: 2.0 -1.0 1.0 0.0
XMM1: 2.0 1.0 2.0 1.0
------------------
součin: 4.0 -2.0 2.0 0.0
změna: ^^^ ^^^ ^^^ ^^^
4. Podíl prvků vektorů instrukcí DIVPS
Poslední základní aritmetickou instrukcí implementovanou v rámci instrukční sady SSE je instrukce DIVSS a její vektorová varianta DIVPS (výpočet zbytku po dělení není podporován, to však v oblasti reálných čísel vlastně příliš nechybí). Ukážeme si pouze použití vektorové varianty podílu, tedy instrukci DIVPS. Příslušný demonstrační příklad vypadá následovně:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, -1.0, 2.0
sse_val_2 dd 2.0, 2.0, 2.0, 2.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
divps xmm0, xmm1 ; podil prvku vektou
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky by měly vypadat následovně:
XMM0: 40000000 BF800000 3F800000 00000000
XMM1: 40000000 40000000 40000000 40000000
-----------------------------------
podíl: 3F800000 BF000000 3F000000 00000000
Po transformaci na FP hodnoty:
XMM0: 2.0 -1.0 1.0 0.0
XMM1: 2.0 2.0 2.0 1.0
------------------
podíl: 1.0 -0.5 0.5 0.0
změna: ^^^ ^^^ ^^^ ^^^
5. Numerické unární operace podporované instrukční sadou SSE
Kromě všech čtyř základních aritmetických binárních operací součtu, rozdílu, součinu a podílu (skalárního i aplikovaného na jednotlivé prvky vektorů) nalezneme v instrukční sadě SSE i několik instrukcí určených pro provedení unárních numerických operací, tj. takových operací, které na vstupu vyžadují pouze jeden operand. Jedná se o následující operace:
| # | Instrukce se skalárními operandy | Instrukce pracující s vektory | Význam instrukce |
|---|---|---|---|
| 1 | RCPSS | RCPPS | převrácená hodnota (aproximace) |
| 2 | SQRTSS | SQRTPS | druhá odmocnina |
| 3 | RSQRTSS | RSQRTPS | převrácená hodnota z druhé odmocniny (aproximace) |
Tyto operace nebyly vybrány náhodně, ale s ohledem na to, že se s nimi často setkáme například při výpočtech s reálnými vektory (2D a 3D transformace, normalizace, výpočty vzdáleností atd.). Zajímavé je, že výpočty převrácených hodnot nejsou zcela přesné, ovšem mělo by být zaručeno, že relativní chyba bude menší než 1.5×2−12, což by například v oblasti 3D grafiky (normalizace vektorů, výpočet vzdálenosti) mělo být dostačující.
6. Výpočet převrácených hodnot prvků vektoru
Nejprve si otestujeme chování instrukce RCPPS, která vypočítá převrácené hodnoty všech čtyř prvků vektoru. Povšimněte si, že tato instrukce má stále dva argumenty – zdrojový registr se vstupním vektorem a cílový registr s vektorem výstupním. V syntaxi společnosti Intel se instrukce zapisuje způsobem:
RCPSS cílový_registr, zdrojový_registr
Demonstrační příklad:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, -1.0, 2.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
rcpps xmm0, xmm0 ; vypocet prevracenych hodnot
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky:
vstup: 40000000 BF800000 3F800000 00000000 výstup: 3EFFF000 BF7FF000 3F7FF000 7F800000
Po transformaci na FP hodnoty:
vstup: 2.0 -1.0 1.0 0.0 výstup: 0.49987793 -0.99975586 0.99975586 inf
7. Výpočet druhé odmocniny prvků vektorů
Instrukce SQRTSS dokáže vypočítat druhou odmocninu z nejnižšího prvku vektoru, který je předán ve zdrojovém XMM registru. A pochopitelně instrukce SQRTPS provádí stejný výpočet, ovšem paralelně pro všechny čtyři prvky vektoru. Podívejme se tedy na způsob použití instrukce SQRTPS, které předáme vektor, jenž mj. obsahuje i prvek se zápornou hodnotou:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, -1.0, 2.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
sqrtps xmm0, xmm0 ; vypocet druhe odmocniny
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky:
vstup: 40000000 BF800000 3F800000 00000000 výstup: 3FB504F3 FFC00000 3F800000 00000000
Po transformaci na FP hodnoty:
vstup: 2.0 -1.0 1.0 0.0 výstup: 1.4142135 NaN 1.0 0.0
Ze zobrazených výsledků je patrné, že se skutečně vypočítala druhá odmocnina, a to s dobrou přesností (pro dvojku na vstupu jsou platné všechny číslice, i když poslední by mohla být kvůli zaokrouhlení nastavena na 6). Navíc se při pokusu o výpočet druhé odmocniny ze záporné hodnoty vrátila konstanta NaN značící, že tento výpočet nemá v oboru reálných čísel platný výsledek.
Zkusme si pro úplnost vypočítat druhé odmocniny hodnot 2, 4, 16 a 100:
vstup: 40000000 40800000 41800000 42C80000 výstup: 3FB504F3 40000000 40800000 41200000
Po transformaci na FP hodnoty dostaneme očekávané výsledky:
vstup: 2.0 4.0 16.0 100.0 výstup: 1.4142135 2.0 4.0 10.0
8. Výpočet převrácené hodnoty odmocniny
Instrukce RSQRTPS kombinuje výpočty prováděné instrukcemi SQRTPS (výpočet druhých odmocnin prvků vstupního vektoru) a RCPPS (výpočet převrácené hodnoty prvků vstupního vektoru). Jedná se o poměrně často používanou instrukci, která nalezne své využití například při normalizaci vektorů. A podobně jako u RCPPS je výsledek pouze aproximací, takže nejnižší cifry vypočtené hodnoty nebudou přesné. Interně se totiž používá zkomprimovaná převodní tabulka a nikoli skutečné dělení.
Vyzkoušejme si to:
vstup: 40000000 40800000 41800000 42C80000 výstup: 3F34F800 3EFFF000 3E7FF000 3DCCC800
Po transformaci na FP hodnoty:
vstup: 2.0 4.0 16.0 100.0 výstup: 0.7069092 0.49987793 0.24993896 0.099990845 má být: 0.7071068 0.50000000 0.25000000 0.100000000
9. Nalezení prvků s menší či větší hodnotou instrukcemi MINPS a MAXPS
Další dvojice instrukcí se jmenuje MINPS a MAXPS. Tyto instrukce porovnávají prvky dvou vektorů a pro každou porovnávanou dvojici (dvojice jsou pochopitelně celkem čtyři) vyberou prvek s menší, resp. naopak s větší hodnotou. Způsob použití těchto instrukcí si ukážeme v jednom demonstračním příkladu:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, 2.0, 3.0
sse_val_2 dd 1.5, 1.5, 1.5, 1.5
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
maxps xmm0, xmm1 ; vyber vetsich prvku
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
minps xmm0, xmm1 ; vyber mensich prvku
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Opět se podívejme na vypočtené výsledky:
vstup1: 40400000 40000000 3F800000 00000000
vstup2: 3FC00000 3FC00000 3FC00000 3FC00000
-----------------------------------
maxima: 40400000 40000000 3FC00000 3FC00000
minima: 3FC00000 3FC00000 3F800000 00000000
Po transformaci na FP hodnoty:
vstup1: 3.0 2.0 1.0 0.0
vstup2: 1.5 1.5 1.5 1.5
---------------------
maxima: 3.0 2.0 1.5 1.5
minima: 1.5 1.5 1.0 0.0
Jak se bude tato instrukce chovat pro záporné hodnoty zjistíme taktéž snadno:
vstup1: C0400000 C0000000 BF800000 80000000
vstup2: BFC00000 BFC00000 BFC00000 BFC00000
-----------------------------------
maxima: BFC00000 BFC00000 BF800000 80000000
minima: C0400000 C0000000 BFC00000 BFC00000
vstup1: -3.0 -2.0 -1.0 -0.0
vstup2: -1.5 -1.5 -1.5 -1.5
----------------------
maxima: -1.5 -1.5 -1.0 -0.0
minima: -3.0 -2.0 -1.5 -1.5
10. Univerzální instrukce pro porovnání prvků dvou vektorů
Další instrukcí, o které se v dnešním článku zmíníme, je instrukce, která dokáže porovnat odpovídající si prvky dvou vektorů. Tato instrukce se jmenuje CMPPS a má tři operandy: první zdrojový (a současně i cílový) registr, druhý zdrojový registr a třetím operandem je konstanta 0–7, která určuje, jaké porovnání se má vlastně provádět. Zápis v assembleru tedy může vypadat následovně:
CMPPS xmm0, xmm1, 6
Naprostá většina assemblerů navíc umožňuje namísto explicitní specifikace konstanty 0–7 použít pseudoinstrukce, které se interně transformují na výše zmíněnou instrukci CMPSS. Tyto pseudoinstrukce mají následující názvy:
| # | Instrukce | Stručný popis instrukce |
|---|---|---|
| 1 | CMPEQPS | porovnání příslušných dvojic prvků vektorů na relaci „je rovno“ |
| 2 | CMPLTPS | porovnání příslušných dvojic prvků vektorů na relaci „menší než“ |
| 3 | CMPLEPS | porovnání příslušných dvojic prvků vektorů na relaci „menší nebo rovno“ |
| 4 | CMPUNORDPS | zjištění, zda jsou dvojice prvků vektorů porovnatelné |
| 5 | CMPNEQPS | porovnání příslušných dvojic prvků vektorů na negaci relace „je rovno“ |
| 6 | CMPNLTPS | porovnání příslušných dvojic prvků vektorů na negaci relace „menší než“ |
| 7 | CMPNLEPS | porovnání příslušných dvojic prvků vektorů na negaci relace „menší nebo rovno“ |
| 8 | CMPORDPS | zjištění, zda jsou dvojice prvků vektorů porovnatelné |
To tedy znamená, že například zápis:
CMPORDPS xmm0, xmm1
se přeloží jako:
CMPPS xmm0, xmm1, 7
Podobně i pro dalších sedm pseudoinstrukcí.
11. Porovnání prvků vektorů na rovnost
Začneme tou nejlépe pochopitelnou instrukcí určenou pro porovnání prvků vektorů. Pokusíme se zjistit, které prvky jsou totožné a které nikoli. Pro tento účel použijeme porovnávací instrukci CMPEQPS, která naplní 32bitové hodnoty cílového registru na samé nuly v případě nerovnosti a naopak na samé jedničky v případě rovnosti:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, 2.0, 3.0
sse_val_2 dd 1.0, 1.0, 1.0, 1.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
cmpeqps xmm0, xmm1 ; porovnani prvku vektoru
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky získané po spuštění tohoto příkladu jasně ukazují, jakým způsobem tato instrukce provádí porovnání:
vstup1: 40400000 40000000 3F800000 00000000
vstup2: 3F800000 3F800000 3F800000 3F800000
-----------------------------------
výsledky: 00000000 00000000 FFFFFFFF 00000000
rovnost?: ne ne ano ne
12. Porovnání prvků vektorů na relaci „menší než“
Další varianta instrukce CMPPS se jmenuje CMPLTPS. Znaky „LT“ v názvu této varianty naznačují, že se provádí test prvků vektorů na relaci „menší než“. Přitom se testuje ostrá nerovnost < a nikoli ≤. A výsledky se ukládají stejně, jako v případě instrukce CMPEQPS – pokud je nerovnost splněna, nastaví se všech šestnáct bitů prvku cílového vektoru. V opačném případě je těchto šestnáct prvků vynulováno.
Vše si vyzkoušíme v následujícím příkladu:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, 2.0, 3.0
sse_val_2 dd 1.0, 1.0, 1.0, 1.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
cmpltps xmm0, xmm1 ; porovnani prvku vektoru
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky získané tímto příkladem by měly vypadat následovně:
vstup1: 40400000 40000000 3F800000 00000000
vstup2: 3F800000 3F800000 3F800000 3F800000
-----------------------------------
výsledky: 00000000 00000000 00000000 FFFFFFFF
menší než?: ne ne ne ano
13. Nekonečna a hodnoty NaN
V souvislosti s popisem vlastností klasických matematických koprocesorů řady 80×87 a normy IEEE 754 jsme se zmínili o problematice nekonečen a taktéž hodnot NaN (Not a Number). I v případě SSE instrukcí, které pracují s numerickými hodnotami typu single/float (a do určité míry je podporována norma IEEE 754) se s nekonečny a „nečísly“ taktéž setkáme. Připomeňme si, že nekonečno může být kladné nebo záporné, protože znaménko hodnoty je uloženo v samostatném bitu. „Nečísla“ se pak rozdělují do několika kategorií (signalling, quiet).
A jaké operace vedou k tomu, že se tyto hodnoty uloží do cílových vektorů? Příkladem je výpočet 1.0/0.0 resp. -1.0/0.0, který vede k uložení kladného nebo záporného nekonečna. A NaN získáme například výpočtem 0.0/0.0 nebo pokusem o vyhodnocení odmocniny ze záporného vstupu. V případě hodnot NaN pak platí, že tyto hodnoty nejsou porovnatelné (ordered, k čemuž se dnes ještě vrátíme.
14. Ukázka výpočtu, který vrací nekonečna a hodnoty NaN
V předchozí kapitole jsme si mj. řekli, že nekonečna i NaN lze získat pouhým podílem prvků vektorů. Tento postup je ukázán v dalším demonstračním příkladu, v němž vypočteme podíl prvků vektorů, které obsahují různé kombinace konstant 0.0 a 1.0:
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, 0.0, 1.0
sse_val_2 dd 0.0, 0.0, 1.0, 1.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
divps xmm0, xmm1 ; nejdrive podelime prvky vektoru
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM1
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky v hexadecimálním vyjádření:
vstup1: 3F800000 00000000 3F800000 00000000
vstup2: 3F800000 3F800000 00000000 00000000
-----------------------------------
podíl: 3F800000 00000000 7F800000 FFC00000
Lepší bude převod na FP formát:
vstup1: 1.0 0.0 1.0 0.0
vstup2: 1.0 1.0 0.0 0.0
---------------------
podíl: 1.0 0.0 ∞ NaN
Z těchto výsledků je patrné, že chování SSE subsystému odpovídá očekávání.
15. Zjištění, které prvky vektorů jsou porovnatelné a které nikoli
Nyní již víme, že v SSE vektorech mohou být uložena nekonečna a NaN. Některé z kombinací těchto hodnot nejsou porovnatelné (ordered), což lze zjistit instrukcí CMPORDPS, resp. její negací CMPUNORDPS. Vyzkoušejme si tedy tuto instrukci pro vektory, které v některých prvcích obsahují běžné numerické hodnoty a v dalších pak nekonečno a NaN (tyto hodnoty vypočteme podílem):
[bits 32]
%include "linux_macros.asm"
;-----------------------------------------------------------------------------
section .data
hex_message:
times 8 db '?'
db ' '
hex_message_length equ $ - hex_message
align 16
sse_val_1 dd 0.0, 1.0, 0.0, 1.0
sse_val_2 dd 0.0, 0.0, 1.0, 1.0
;-----------------------------------------------------------------------------
section .bss
sse_tmp resb 16
;-----------------------------------------------------------------------------
section .text
global _start ; tento symbol ma byt dostupny i linkeru
_start:
mov ebx, sse_val_1
movaps xmm0, [ebx] ; nacteni prvni hodnoty do registru XMM0
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
mov ebx, sse_val_2
movaps xmm1, [ebx] ; nacteni druhe hodnoty do registru XMM1
print_sse_reg_as_hex xmm1 ; tisk hodnoty registru XMM1
divps xmm0, xmm1 ; nejdrive podelime prvky vektoru
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM1
cmpordps xmm0, xmm1 ; porovnani prvku vektoru
print_sse_reg_as_hex xmm0 ; tisk hodnoty registru XMM0
exit ; ukonceni procesu
%include "hex2string.asm"
Výsledky získané v hexadecimální podobě vypadají takto:
xmm0: 3F800000 00000000 7F800000 FFC00000
xmm1: 3F800000 3F800000 00000000 00000000
-----------------------------------
ordered: FFFFFFFF FFFFFFFF FFFFFFFF 00000000
Opět proveďme převod do čitelného FP formátu, ze kterého bude zřejmé, které kombinace hodnot nejsou porovnatelné:
xmm0: 1.0 0.0 ∞ NaN
xmm0: 1.0 1.0 0.0 0.0
---------------------
ordered: ano ano ano ne
Otázka pro čtenáře: jaký výsledek získáme při porovnání NaN==NaN ve vyšších programovacích jazycích?
16. Formáty SSE instrukcí (druhý pohled)
V tomto okamžiku již známe poměrně velké množství nových SSE instrukcí, takže se znovu podívejme na způsob jejich zakódování do strojového kódu. Všechny prozatím popsané instrukce jsou použity v následujícím (zcela umělém) příkladu, u kterého nás bude zajímat nikoli jeho funkcionalita (nelze spustit), ale způsob výsledného zakódování instrukcí:
[bits 32]
;-----------------------------------------------------------------------------
section .text
movups xmm0, [ebx] ; nacteni hodnoty do registru XMM0
movaps xmm0, [ebx] ; nacteni hodnoty do registru XMM0
movups xmm0, xmm1 ; prenosy mezi registry
addps xmm0, xmm1 ; soucet prvku vektoru
subps xmm0, xmm1 ; rozdil prvku vektoru
mulps xmm0, xmm1 ; soucin prvku vektoru
divps xmm0, xmm1 ; podil prvku vektoru
maxps xmm0, xmm1 ; vyber vetsich prvku
minps xmm0, xmm1 ; vyber mensich prvku
sqrtps xmm0, xmm0 ; vypocet druhe odmocniny
rcpps xmm0, xmm0 ; vypocet prevracenych hodnot
addss xmm0, xmm1 ; skalarni soucet
subss xmm0, xmm1 ; rozdil skalaru
mulss xmm0, xmm1 ; soucin skalaru
divss xmm0, xmm1 ; podil skalaru
maxss xmm0, xmm1 ; vyber vetsich skalaru
maxss xmm0, xmm1 ; vyber mensich skalaru
cmpeqps xmm0, xmm1 ; porovnani prvku vektoru
cmpltps xmm0, xmm1 ; porovnani prvku vektoru
cmpleps xmm0, xmm1 ; porovnani prvku vektoru
cmpunordps xmm0, xmm1 ; porovnani prvku vektoru
cmpneqps xmm0, xmm1 ; porovnani prvku vektoru
cmpnltps xmm0, xmm1 ; porovnani prvku vektoru
cmpnleps xmm0, xmm1 ; porovnani prvku vektoru
cmpordps xmm0, xmm1 ; porovnani prvku vektoru
17. Tři formáty kódování instrukcí SSE
Výsledek překladu s použitím přepínače -l (vytvoření lisingu) vypadá takto:
13 ;-----------------------------------------------------------------------------
14 section .text
15 00000000 0F1003 movups xmm0, [ebx] ; nacteni hodnoty do registru XMM0
16 00000003 0F2803 movaps xmm0, [ebx] ; nacteni hodnoty do registru XMM0
17 00000006 0F10C1 movups xmm0, xmm1 ; prenosy mezi registry
18
19 00000009 0F58C1 addps xmm0, xmm1 ; soucet prvku vektoru
20 0000000C 0F5CC1 subps xmm0, xmm1 ; rozdil prvku vektoru
21 0000000F 0F59C1 mulps xmm0, xmm1 ; soucin prvku vektoru
22 00000012 0F5EC1 divps xmm0, xmm1 ; podil prvku vektoru
23 00000015 0F5FC1 maxps xmm0, xmm1 ; vyber vetsich prvku
24 00000018 0F5DC1 minps xmm0, xmm1 ; vyber mensich prvku
25 0000001B 0F51C0 sqrtps xmm0, xmm0 ; vypocet druhe odmocniny
26 0000001E 0F53C0 rcpps xmm0, xmm0 ; vypocet prevracenych hodnot
27
28 00000021 F30F58C1 addss xmm0, xmm1 ; skalarni soucet
29 00000025 F30F5CC1 subss xmm0, xmm1 ; rozdil skalaru
30 00000029 F30F59C1 mulss xmm0, xmm1 ; soucin skalaru
31 0000002D F30F5EC1 divss xmm0, xmm1 ; podil skalaru
32 00000031 F30F5FC1 maxss xmm0, xmm1 ; vyber vetsich skalaru
33 00000035 F30F5FC1 maxss xmm0, xmm1 ; vyber mensich skalaru
34
35 00000039 0FC2C100 cmpeqps xmm0, xmm1 ; porovnani prvku vektoru
36 0000003D 0FC2C101 cmpltps xmm0, xmm1 ; porovnani prvku vektoru
37 00000041 0FC2C102 cmpleps xmm0, xmm1 ; porovnani prvku vektoru
38 00000045 0FC2C103 cmpunordps xmm0, xmm1 ; porovnani prvku vektoru
39 00000049 0FC2C104 cmpneqps xmm0, xmm1 ; porovnani prvku vektoru
40 0000004D 0FC2C105 cmpnltps xmm0, xmm1 ; porovnani prvku vektoru
41 00000051 0FC2C106 cmpnleps xmm0, xmm1 ; porovnani prvku vektoru
42 00000055 0FC2C107 cmpordps xmm0, xmm1 ; porovnani prvku vektoru
Z tohoto výpisu je patrné, že kódy instrukcí mají jednotné formáty, které je možné rozdělit do tří kategorií:
- Běžné vektorové instrukce mají délku tří bajtů a začínají prefixem 0×0F (což jsme si již řekli minule)
- Skalární instrukce začínají prefixem 0×F3 následovaným 0×0F, přičemž další dva bajty jsou totožné, jako u vektorové verze instrukce. Například ADDSS je zakódována do F30F58C1 a ADDPS do 0F58C1.
- Všech osm instrukcí pro porovnání jsou ve skutečnosti tvořeny jedinou instrukcí CMPPS. Této instrukci se předává dvojice XMM registrů, které se mají porovnat (popř. registr a buňky v paměti) a taktéž konstanta 0–7, která je připojena na konec instrukčního slova.
18. Seznam všech popsaných instrukcí SSE
Seznam již popsaných instrukcí SSE se od předchozího článku, v němž jsme si popsali pouze čtyři instrukce, rozšířil, což je ostatně dobře patrné z následující tabulky:
| # | Instrukce | Stručný popis instrukce |
|---|---|---|
| 1 | MOVUPS | načtení či zápis 128bitové hodnoty do oblasti paměti, která nemusí být zarovnaná |
| 2 | MOVAPS | načtení či zápis 128bitové hodnoty do paměti, která musí být zarovnaná |
| 3 | ADDSS | součet dolních 32bitů 128bitového vektoru; tyto bity jsou chápány jako hodnota single |
| 4 | ADDPS | součet čtveřice 32bitových hodnot typu single uložených ve 128bitových vektorech |
| 5 | SUBSS | rozdíl dolních 32bitů 128bitového vektoru; tyto bity jsou chápány jako hodnota single |
| 6 | SUBPS | rozdíl čtveřice 32bitových hodnot typu single uložených ve 128bitových vektorech |
| 7 | MULSS | součin dolních 32bitů 128bitového vektoru; tyto bity jsou chápány jako hodnota single |
| 8 | MULPS | součin čtveřice 32bitových hodnot typu single uložených ve 128bitových vektorech |
| 9 | DIVSS | podíl dolních 32bitů 128bitového vektoru; tyto bity jsou chápány jako hodnota single |
| 10 | DIVPS | podíl čtveřice 32bitových hodnot typu single uložených ve 128bitových vektorech |
| 11 | MAXPS | výběr větší hodnoty z každé porovnávané dvojice |
| 12 | MINPS | výběr menší hodnoty z každé porovnávané dvojice |
| 13 | SQRTPS | výpočet druhé odmocniny všech čtyř prvků vstupního vektoru |
| 14 | RCPPS | přibližný výpočet převrácené hodnoty všech čtyř prvků vstupního vektoru |
| 15 | CMPEQPS | porovnání příslušných dvojic prvků vektorů na relaci „je rovno“ |
| 16 | CMPLTPS | porovnání příslušných dvojic prvků vektorů na relaci „menší než“ |
| 17 | CMPLEPS | porovnání příslušných dvojic prvků vektorů na relaci „menší nebo rovno“ |
| 18 | CMPUNORDPS | zjištění, zda jsou dvojice prvků vektorů porovnatelné |
| 19 | CMPNEQPS | porovnání příslušných dvojic prvků vektorů na negaci relace „je rovno“ |
| 20 | CMPNLTPS | porovnání příslušných dvojic prvků vektorů na negaci relace „menší než“ |
| 21 | CMPNLEPS | porovnání příslušných dvojic prvků vektorů na negaci relace „menší nebo rovno“ |
| 22 | CMPORDPS | zjištění, zda jsou dvojice prvků vektorů porovnatelné |
19. Repositář s demonstračními příklady
Demonstrační příklady napsané v assembleru, které jsou určené pro překlad s využitím assembleru NASM, byly uloženy do Git repositáře, který je dostupný na adrese https://github.com/tisnik/8bit-fame. Jednotlivé demonstrační příklady si můžete v případě potřeby stáhnout i jednotlivě bez nutnosti klonovat celý (dnes již poměrně rozsáhlý) repositář:
| # | Příklad | Stručný popis | Adresa |
|---|---|---|---|
| 1 | hello.asm | program typu „Hello world“ naprogramovaný v assembleru pro systém DOS | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hello.asm |
| 2 | hello_shorter.asm | kratší varianta výskoku z procesu zpět do DOSu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hello_shorter.asm |
| 3 | hello_wait.asm | čekání na stisk klávesy | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hello_wait.asm |
| 4 | hello_macros.asm | realizace jednotlivých částí programu makrem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hello_macros.asm |
| 5 | gfx4_putpixel.asm | vykreslení pixelu v grafickém režimu 4 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_putpixel.asm |
| 6 | gfx6_putpixel.asm | vykreslení pixelu v grafickém režimu 6 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_putpixel.asm |
| 7 | gfx4_line.asm | vykreslení úsečky v grafickém režimu 4 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_line.asm |
| 8 | gfx6_line.asm | vykreslení úsečky v grafickém režimu 6 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_line.asm |
| 9 | gfx6_fill1.asm | vyplnění obrazovky v grafickém režimu, základní varianta | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_fill1.asm |
| 10 | gfx6_fill2.asm | vyplnění obrazovky v grafickém režimu, varianta s instrukcí LOOP | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_fill2.asm |
| 11 | gfx6_fill3.asm | vyplnění obrazovky instrukcí REP STOSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_fill3.asm |
| 12 | gfx6_fill4.asm | vyplnění obrazovky, synchronizace vykreslování s paprskem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_fill4.asm |
| 13 | gfx4_image1.asm | vykreslení rastrového obrázku získaného z binárních dat, základní varianta | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image1.asm |
| 14 | gfx4_image2.asm | varianta vykreslení rastrového obrázku s využitím instrukce REP MOVSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image2.asm |
| 15 | gfx4_image3.asm | varianta vykreslení rastrového obrázku s využitím instrukce REP MOVSW | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image3.asm |
| 16 | gfx4_image4.asm | korektní vykreslení všech sudých řádků bitmapy | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image4.asm |
| 17 | gfx4_image5.asm | korektní vykreslení všech sudých i lichých řádků bitmapy | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image5.asm |
| 18 | gfx4_image6.asm | nastavení barvové palety před vykreslením obrázku | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image6.asm |
| 19 | gfx4_image7.asm | nastavení barvové palety před vykreslením obrázku, snížená intenzita barev | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image7.asm |
| 20 | gfx4_image8.asm | postupná změna barvy pozadí | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx4_image8.asm |
| 21 | gfx6_putpixel1.asm | vykreslení pixelu, základní varianta se 16bitovým násobením | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_putpixel1.asm |
| 22 | gfx6_putpixel2.asm | vykreslení pixelu, varianta s osmibitovým násobením | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_putpixel2.asm |
| 23 | gfx6_putpixel3.asm | vykreslení pixelu, varianta bez násobení | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_putpixel3.asm |
| 24 | gfx6_putpixel4.asm | vykreslení pixelu přes obrázek, nekorektní chování (přepis obrázku) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_putpixel4.asm |
| 25 | gfx6_putpixel5.asm | vykreslení pixelu přes obrázek, korektní varianta pro bílé pixely | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/gfx6_putpixel5.asm |
| 26 | cga_text_mode1.asm | standardní textový režim s rozlišením 40×25 znaků | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/cga_text_mode1.asm |
| 27 | cga_text_mode3.asm | standardní textový režim s rozlišením 80×25 znaků | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/cga_text_mode3.asm |
| 28 | cga_text_mode_intensity.asm | změna významu nejvyššího bitu atributového bajtu: vyšší intenzita namísto blikání | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/cga_text_mode_intensity.asm |
| 29 | cga_text_mode_cursor.asm | změna tvaru textového kurzoru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/cga_text_mode_cursor.asm |
| 30 | cga_text_gfx1.asm | zobrazení „rastrové mřížky“: pseudografický režim 160×25 pixelů (interně textový režim) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/cga_text_gfx1.asm |
| 31 | cga_text_mode_char_height.asm | změna výšky znaků | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/cga_text_mode_char_height.asm |
| 32 | cga_text_160×100.asm | grafický režim 160×100 se šestnácti barvami (interně upravený textový režim) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/cga_text_160×100.asm |
| 33 | hercules_text_mode1.asm | využití standardního textového režimu společně s kartou Hercules | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hercules_text_mode1.asm |
| 34 | hercules_text_mode2.asm | zákaz blikání v textových režimech | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hercules_text_mode2.asm |
| 35 | hercules_turn_off.asm | vypnutí generování video signálu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hercules_turn_off.asm |
| 36 | hercules_gfx_mode1.asm | přepnutí karty Hercules do grafického režimu (základní varianta) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hercules_gfx_mode1.asm |
| 37 | hercules_gfx_mode2.asm | přepnutí karty Hercules do grafického režimu (vylepšená varianta) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hercules_gfx_mode2.asm |
| 38 | hercules_putpixel.asm | subrutina pro vykreslení jediného pixelu na kartě Hercules | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/hercules_putpixel.asm |
| 39 | ega_text_mode_80×25.asm | standardní textový režim 80×25 znaků na kartě EGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_text_mode_80×25.asm |
| 40 | ega_text_mode_80×43.asm | zobrazení 43 textových řádků na kartě EGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_text_mode_80×43.asm |
| 41 | ega_gfx_mode_320×200.asm | přepnutí do grafického režimu 320×200 pixelů se šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_gfx_mode_320×200.asm |
| 42 | ega_gfx_mode_640×200.asm | přepnutí do grafického režimu 640×200 pixelů se šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_gfx_mode_640×200.asm |
| 43 | ega_gfx_mode_640×350.asm | přepnutí do grafického režimu 640×350 pixelů se čtyřmi nebo šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_gfx_mode_640×350.asm |
| 44 | ega_gfx_mode_bitplanes1.asm | ovládání zápisu do bitových rovin v planárních grafických režimech (základní způsob) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_gfx_mode_bitplanes1.asm |
| 45 | ega_gfx_mode_bitplanes2.asm | ovládání zápisu do bitových rovin v planárních grafických režimech (rychlejší způsob) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_gfx_mode_bitplanes2.asm |
| 46 | ega_320×200_putpixel.asm | vykreslení pixelu v grafickém režimu 320×200 pixelů se šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_320×200_putpixel.asm |
| 47 | ega_640×350_putpixel.asm | vykreslení pixelu v grafickém režimu 640×350 pixelů se šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_640×350_putpixel.asm |
| 48 | ega_standard_font.asm | použití standardního fontu grafické karty EGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_standard_font.asm |
| 49 | ega_custom_font.asm | načtení vlastního fontu s jeho zobrazením | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_custom_font.asm |
| 50 | ega_palette1.asm | změna barvové palety (všech 16 barev) v grafickém režimu 320×200 se šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_palette1.asm |
| 51 | ega_palette2.asm | změna barvové palety (všech 16 barev) v grafickém režimu 640×350 se šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_palette2.asm |
| 52 | ega_palette3.asm | změna všech barev v barvové paletě s využitím programové smyčky | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_palette3.asm |
| 53 | ega_palette4.asm | změna všech barev, včetně barvy okraje, v barvové paletě voláním funkce BIOSu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ega_palette4.asm |
| 54 | vga_text_mode_80×25.asm | standardní textový režim 80×25 znaků na kartě VGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_text_mode_80×25.asm |
| 55 | vga_text_mode_80×50.asm | zobrazení 50 a taktéž 28 textových řádků na kartě VGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_text_mode_80×50.asm |
| 56 | vga_text_mode_intensity1.asm | změna chování atributového bitu pro blikání (nebezpečná varianta změny registrů) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_text_mode_intensity1.asm |
| 57 | vga_text_mode_intensity2.asm | změna chování atributového bitu pro blikání (bezpečnější varianta změny registrů) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_text_mode_intensity2.asm |
| 58 | vga_text_mode_9th_column.asm | modifikace způsobu zobrazení devátého sloupce ve znakových režimech (720 pixelů na řádku) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_text_mode_9th_column.asm |
| 59 | vga_text_mode_cursor_shape.asm | změna tvaru textového kurzoru na grafické kartě VGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_text_mode_cursor_shape.asm |
| 60 | vga_text_mode_custom_font.asm | načtení vlastního fontu s jeho zobrazením | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_text_mode_custom_font.asm |
| 61 | vga_gfx_mode_640×480.asm | přepnutí do grafického režimu 640×480 pixelů se šestnácti barvami, vykreslení vzorků | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_640×480.asm |
| 62 | vga_gfx_mode_320×200.asm | přepnutí do grafického režimu 320×200 pixelů s 256 barvami, vykreslení vzorků | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_320×200.asm |
| 63 | vga_gfx_mode_palette.asm | změna všech barev v barvové paletě grafické karty VGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_palette.asm |
| 64 | vga_gfx_mode_dac1.asm | využití DAC (neočekávané výsledky) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_dac1.asm |
| 65 | vga_gfx_mode_dac2.asm | využití DAC (očekávané výsledky) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_dac2.asm |
| 66 | vga_640×480_putpixel.asm | realizace algoritmu pro vykreslení pixelu v grafickém režimu 640×480 pixelů se šestnácti barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_640×480_putpixel.asm |
| 67 | vga_320×200_putpixel1.asm | realizace algoritmu pro vykreslení pixelu v grafickém režimu 320×200 s 256 barvami (základní varianta) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_putpixel1.asm |
| 68 | vga_320×200_putpixel2.asm | realizace algoritmu pro vykreslení pixelu v grafickém režimu 320×200 s 256 barvami (rychlejší varianta) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_putpixel2.asm |
| 69 | vga_gfx_mode_dac3.asm | přímé využití DAC v grafickém režimu 13h | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_dac3.asm |
| 70 | vga_gfx_mode_unchained_step1.asm | zobrazení barevných pruhů v režimu 13h | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_unchained_step1.asm |
| 71 | vga_gfx_mode_unchained_step2.asm | vypnutí zřetězení bitových rovin a změna způsobu adresování pixelů | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_unchained_step2.asm |
| 72 | vga_gfx_mode_unchained_step3.asm | vykreslení barevných pruhů do vybraných bitových rovin | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_unchained_step3.asm |
| 73 | vga_gfx_mode_320×400.asm | nestandardní grafický režim s rozlišením 320×400 pixelů a 256 barvami | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_gfx_mode_320×400.asm |
| 74 | vga_320×200_image.asm | zobrazení rastrového obrázku ve standardním grafickém režimu 320×200 pixelů | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image.asm |
| 75 | vga_320×200_unchained_image1.asm | zobrazení rastrového obrázku v režimu s nezřetězenými rovinami (nekorektní řešení) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_unchained_image1.asm |
| 76 | vga_320×200_unchained_image2.asm | zobrazení rastrového obrázku v režimu s nezřetězenými rovinami (korektní řešení) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_unchained_image2.asm |
| 77 | vga_320×400_unchained_image.asm | zobrazení rastrového obrázku v nestandardním režimu 320×400 pixelů | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×400_unchained_image.asm |
| 78 | vga_vertical_scroll1.asm | vertikální scrolling na kartě VGA v režimu s rozlišením 320×200 pixelů | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_vertical_scroll1.asm |
| 79 | vga_vertical_scroll2.asm | vertikální scrolling na kartě VGA v režimu s rozlišením 320×400 pixelů | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_vertical_scroll2.asm |
| 80 | vga_split_screen1.asm | režim split-screen a scrolling, nefunční varianta | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_split_screen1.asm |
| 81 | vga_split_screen2.asm | režim split-screen a scrolling, plně funkční varianta | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_split_screen2.asm |
| 82 | vga_horizontal_scroll1.asm | horizontální scrolling bez rozšíření počtu pixelů na virtuálním řádku | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_horizontal_scroll1.asm |
| 83 | vga_horizontal_scroll2.asm | horizontální scrolling s rozšířením počtu pixelů na virtuálním řádku | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_horizontal_scroll2.asm |
| 84 | vga_horizontal_scroll3.asm | jemný horizontální scrolling s rozšířením počtu pixelů na virtuálním řádku | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_horizontal_scroll3.asm |
| 85 | vga_320×240_image.asm | nastavení grafického režimu Mode-X, načtení a vykreslení obrázku, scrolling | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×240_image.asm |
| 86 | io.asm | knihovna maker pro I/O operace | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/io.asm |
| 87 | vga_lib.asm | knihovna maker a podprogramů pro programování karty VGA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_lib.asm |
| 88 | vga_320×240_lib.asm | nastavení grafického režimu Mode-X, tentokrát knihovními funkcemi | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×240_lib.asm |
| 89 | vga_bitblt1.asm | první (naivní) implementace operace BitBLT | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_bitblt1.asm |
| 90 | vga_bitblt2.asm | operace BitBLT s výběrem bitových rovin pro zápis | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_bitblt2.asm |
| 91 | vga_bitblt3.asm | operace BitBLT s výběrem bitových rovin pro čtení i zápis | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_bitblt3.asm |
| 92 | vga_bitblt4.asm | korektní BitBLT pro 16barevný režim, realizace makry | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_bitblt4.asm |
| 93 | vga_bitblt5.asm | korektní BitBLT pro 16barevný režim, realizace podprogramem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_bitblt5.asm |
| 94 | vga_bitblt_rotate.asm | zápisový režim s rotací bajtu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_bitblt_rotate.asm |
| 95 | vga_bitblt_fast.asm | rychlá korektní 32bitová operace typu BitBLT | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_bitblt_fast.asm |
| 96 | vga_320×400_bitblt1.asm | přenos obrázku v režimu 320×400 operací BitBLT (neúplná varianta) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×400_bitblt1.asm |
| 97 | vga_320×400_bitblt2.asm | přenos obrázku v režimu 320×400 operací BitBLT (úplná varianta) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×400_bitblt2.asm |
| 98 | vga_write_modes1.asm | volitelné zápisové režimy grafické karty VGA, zápis bez úpravy latche | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_write_modes1.asm |
| 99 | vga_write_modes2.asm | volitelné zápisové režimy grafické karty VGA, zápis s modifikací latche | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_write_modes2.asm |
| 100 | vga_write_modes3.asm | volitelné zápisové režimy grafické karty VGA, cílená modifikace latche vzorkem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_write_modes3.asm |
| 101 | instruction_jump.asm | použití instrukce JMP | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_jump.asm |
| 102 | instruction_jnz.asm | použití instrukce JNZ pro realizaci programové smyčky | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_jnz.asm |
| 103 | instruction_jz_jmp.asm | použití instrukcí JZ a JMP pro realizaci programové smyčky | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_jz_jmp.asm |
| 104 | instruction_loop.asm | použití instrukce LOOP pro realizaci programové smyčky | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_loop.asm |
| 105 | instruction_template.asm | šablona všech následujících demonstračních příkladů | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_template.asm |
| 106 | instruction_print_hex.asm | tisk osmibitové hexadecimální hodnoty | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_print_hex.asm |
| 107 | instruction_xlat.asm | využití instrukce XLAT pro získání tisknutelné hexadecimální cifry | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_xlat.asm |
| 108 | instruction_daa.asm | operace součtu s využitím binární i BCD aritmetiky | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_daa.asm |
| 109 | instruction_daa_sub.asm | instrukce DAA po provedení operace rozdílu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_daa_sub.asm |
| 110 | instruction_das.asm | instrukce DAS po provedení operace rozdílu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_das.asm |
| 111 | instruction_aaa.asm | korekce výsledku na jedinou BCD cifru operací AAA | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_aaa.asm |
| 112 | instruction_mul.asm | ukázka výpočtu součinu dvou osmibitových hodnot | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_mul.asm |
| 113 | instruction_aam.asm | BCD korekce po výpočtu součinu instrukcí AAM | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_aam.asm |
| 114 | instruction_stosb.asm | blokový zápis dat instrukcí STOSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_stosb.asm |
| 115 | instruction_rep_stosb.asm | opakované provádění instrukce STOSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_rep_stosb.asm |
| 116 | instruction_lodsb.asm | čtení dat instrukcí LODSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_lodsb.asm |
| 117 | instruction_movsb.asm | přenos jednoho bajtu instrukcí MOVSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_movsb.asm |
| 118 | instruction_rep_movsb.asm | blokový přenos po bajtech instrukcí MOVSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_rep_movsb.asm |
| 119 | instruction_rep_scas.asm | vyhledávání v řetězci instrukcí SCAS | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_rep_scas.asm |
| 120 | vga_320×200_image_0B.asm | výsledek blokového přenosu ve chvíli, kdy je CX=0 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_0B.asm |
| 121 | vga_320×200_image_64kB.asm | výsledek blokového přenosu ve chvíli, kdy je CX=0×ffff | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_64kB.asm |
| 122 | vga_320×200_image_movsb.asm | blokový přenos v rámci obrazové paměti instrukcí REP MOVSB | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_movsb.asm |
| 123 | vga_320×200_image_movsw.asm | blokový přenos v rámci obrazové paměti instrukcí REP MOVSW | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_movsw.asm |
| 124 | vga_320×200_image_movsd.asm | blokový přenos v rámci obrazové paměti instrukcí REP MOVSD | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_movsd.asm |
| 125 | vga_320×200_image_movsb_forward.asm | blokový přenos překrývajících se bloků paměti (zvyšující se adresy) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_movsb_forward.asm |
| 126 | vga_320×200_image_movsb_backward1.asm | blokový přenos překrývajících se bloků paměti (snižující se adresy, nekorektní nastavení) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_movsb_backward1.asm |
| 127 | vga_320×200_image_movsb_backward2.asm | blokový přenos překrývajících se bloků paměti (snižující se adresy, korektní nastavení) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_image_movsb_backward2.asm |
| 128 | sound_bell.asm | přehrání zvuku pomocí tisku ASCII znaku BELL | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_bell.asm |
| 129 | sound_beep.asm | přehrání zvuku o zadané frekvenci na PC Speakeru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_beep.asm |
| 130 | sound_play_pitch.asm | přehrání zvuku o zadané frekvenci na PC Speakeru, použití maker | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_play_pitch.asm |
| 131 | sound_opl2_basic.asm | přehrání komorního A na OPL2 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl2_basic.asm |
| 132 | sound_opl2_table.asm | přehrání komorního A na OPL2, použití tabulky s hodnotami registrů | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl2_table.asm |
| 133 | sound_opl2_table2.asm | přepis tabulky s obsahy registrů pro přehrání komorního A | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl2_table2.asm |
| 134 | sound_key_on.asm | přímé ovládání bitu KEY ON mezerníkem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_key_on.asm |
| 135 | sound_adsr.asm | nastavení obálky pro tón přehrávaný prvním kanálem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_adsr.asm |
| 136 | sound_modulation.asm | řízení frekvence modulátoru klávesami 1 a 0 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_modulation.asm |
| 137 | keyboard_basic.asm | přímá práce s klávesnicí IBM PC | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/keyboard_basic.asm |
| 138 | sound_stereo_opl2.asm | stereo zvuk v konfiguraci DualOPL2 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_stereo_opl2.asm |
| 139 | sound_opl2_multichannel.asm | vícekanálový zvuk na OPL2 (klávesy), delší varianta | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl2_multichannel.asm |
| 140 | sound_opl2_multichannel2.asm | vícekanálový zvuk na OPL2 (klávesy), kratší varianta | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl2_multichannel2.asm |
| 141 | sound_opl3_stereo1.asm | stereo výstup na OPL3 (v kompatibilním režimu) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_stereo1.asm |
| 142 | sound_opl3_stereo2.asm | stereo výstup na OPL3 (v režimu OPL3) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_stereo2.asm |
| 143 | sound_opl3_multichannel.asm | vícekanálový zvuk na OPL3 (klávesy) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_multichannel.asm |
| 144 | sound_opl3_waveform1.asm | interaktivní modifikace tvaru vlny u prvního operátoru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_waveform1.asm |
| 145 | sound_opl3_waveform2.asm | oprava chyby: povolení režimu kompatibilního s OPL3 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_waveform2.asm |
| 146 | sound_opl3_waveform3.asm | vliv tvaru vln na zvukový kanál s FM syntézou | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_waveform3.asm |
| 147 | sound_opl3_waveform4.asm | modifikace tvaru vlny nosné vlny i modulátoru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_waveform4.asm |
| 148 | sound_opl3_4operators1.asm | výběr AM/FM režimu ve čtyřoperátorovém nastavení | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_4operators1.asm |
| 149 | sound_opl3_4operators2.asm | výběr AM/FM režimu ve čtyřoperátorovém nastavení | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/sound_opl3_4operators2.asm |
| 150 | timer_basic.asm | základní obsluha přerušení od časovače/čítače | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/timer_basic.asm |
| 151 | timer_restore.asm | obnovení původní obsluhy přerušení při ukončování aplikace | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/timer_restore.asm |
| 152 | timer_restore_better_structure.asm | refaktoring předchozího demonstračního příkladu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/timer_restore_better_structure.asm |
| 153 | timer_faster_clock.asm | zrychlení čítače na 100 přerušení za sekundu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/timer_faster_clock.asm |
| 154 | instruction_push_imm.asm | instrukce PUSH s konstantou | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_push_imm.asm |
| 155 | instruction_imul_imm.asm | instrukce IMUL s konstantou | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_imul_imm.asm |
| 156 | instruction_into1.asm | instrukce INTO s obsluhou přerušení | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_into1.asm |
| 157 | instruction_into2.asm | instrukce INTO s obsluhou přerušení | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_into2.asm |
| 158 | instruction_bound1.asm | instrukce BOUND s obsluhou přerušení (nekorektní řešení) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_bound1.asm |
| 159 | instruction_bound2.asm | instrukce BOUND s obsluhou přerušení (korektní řešení) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_bound2.asm |
| 160 | vga_320×200_putpixel286.asm | instrukce bitového posunu s konstantou větší než 1 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_putpixel286.asm |
| 161 | instruction_push_pop.asm | instrukce PUSH a POP se všemi pracovními registry | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_push_pop.asm |
| 162 | instruction_push_pop_B.asm | instrukce s novými segmentovými registry | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_push_pop_B.asm |
| 163 | instruction_near_jz_jmp.asm | blízké skoky | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_near_jz_jmp.asm |
| 164 | instruction_bsf.asm | nová instrukce BSF | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_bsf.asm |
| 165 | instruction_bsr.asm | nová instrukce BSR | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_bsr.asm |
| 166 | instruction_add_32bit.asm | 32bitový součet | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_add_32bit.asm |
| 167 | instruction_inc_32bit.asm | 32bitová instrukce INC v šestnáctibitovém režimu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_inc_32bit.asm |
| 168 | instruction_inc_32bit_B.asm | 32bitová instrukce INC v 32bitovém režimu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/instruction_inc_32bit_B.asm |
| 169 | ems_status.asm | zjištění stavu (emulace) paměti EMS | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ems_status.asm |
| 170 | ems_total_mem.asm | získání celkové kapacity paměti EMS v blocích | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ems_total_mem.asm |
| 171 | ems_free_mem.asm | získání volné kapacity paměti EMS v blocích | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/ems_free_mem.asm |
| 172 | xms_free_mem.asm | získání volné kapacity paměti XMS v blocích | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/xms_free_mem.asm |
| 173 | vga_320×200_short_address1.asm | blokový přenos provedený v rámci prostoru segmentu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_short_address1.asm |
| 174 | vga_320×200_short_address2.asm | rozepsaný blokový přenos provedený v rámci prostoru segmentu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_short_address2.asm |
| 175 | vga_320×200_short_address3.asm | přenos nelze provést přes hranici offsetu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_short_address3.asm |
| 176 | vga_320×200_short_address4.asm | přenos nelze provést přes hranici offsetu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_short_address4.asm |
| 177 | vga_320×200_long_address1.asm | 32bitový blokový přenos | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_long_address1.asm |
| 178 | vga_320×200_long_address2.asm | rozepsaný 32bitový blokový přenos provedený v rámci prostoru segmentu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_long_address2.asm |
| 179 | vga_320×200_long_address3.asm | přístup do obrazové paměti přes segment 0×0000 a 32bitový offset | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_long_address3.asm |
| 180 | vga_320×200_long_address4.asm | otestování, jak lze přenášet data s využitím 32bitového offsetu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/vga_320×200_long_address4.asm |
| 181 | print_msw.asm | přečtení a zobrazení obsahu speciálního registru MSW | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/print_msw.asm |
| 182 | print_cr0.asm | přečtení a zobrazení obsahu speciálního registru CR0 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/print_cr0.asm |
| 183 | prot_mode286.asm | přechod do chráněného režimu na čipech Intel 80286 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/prot_mode286.asm |
| 184 | prot_mode386.asm | přechod do chráněného režimu na čipech Intel 80386 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/prot_mode386.asm |
| 185 | prot_mode_back_to_real_mode286.asm | přechod mezi reálným režimem a chráněným režimem i zpět na čipech Intel 80286 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/prot_mode_back_to_real_mode286.asm |
| 186 | prot_mode_back_to_real_mode386.asm | přechod mezi reálným režimem a chráněným režimem i zpět na čipech Intel 80386 | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/prot_mode_back_to_real_mode386.asm |
| 187 | prot_mode_check.asm | test, zda se mikroprocesor již nachází v chráněném režimu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/prot_mode_check.asm |
| 188 | unreal_mode.asm | nastavení nereálného režimu (platné pro Intel 80386) | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/unreal_mode.asm |
| 189 | float32_constants.asm | vytištění základních FP konstant typu single | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/float32_constants.asm |
| 190 | float64_constants.asm | vytištění základních FP konstant typu double | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/float64_constants.asm |
| 191 | fpu_arithmetic.asm | základní aritmetické operace prováděné matematickým koprocesorem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_arithmetic.asm |
| 192 | fpu_divide_by_zero.asm | dělení nulou matematickým koprocesorem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_divide_by_zero.asm |
| 193 | fpu_divide_by_neg_zero.asm | dělení záporné hodnoty nulou matematickým koprocesorem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_divide_by_neg_zero.asm |
| 194 | fpu_divide_by_neg_zero2.asm | dělení hodnoty zápornou nulou matematickým koprocesorem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_divide_by_neg_zero2.asm |
| 195 | fpu_divide_zero_by_zero.asm | výpočet 0/0 matematickým koprocesorem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_divide_zero_by_zero.asm |
| 196 | io.asm | pomocná makra pro komunikaci s DOSem a BIOSem | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/io.asm |
| 197 | print.asm | pomocná makra pro tisk FPU hodnot typu single a double v hexadecimálním tvaru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/print.asm |
| 198 | fpu_divide.asm | operace podílu | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_divide.asm |
| 199 | fpu_divide_r.asm | operace podílu s prohozenými operandy | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_divide_r.asm |
| 200 | fpu_sqrt.asm | výpočet druhé odmocniny | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_sqrt.asm |
| 201 | fpu_sqrt_neg_value.asm | výpočet druhé odmocniny ze záporné hodnoty | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_sqrt_neg_value.asm |
| 202 | fpu_check.asm | detekce typu matematického koprocesoru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_check.asm |
| 203 | fpu_compare.asm | porovnání dvou hodnot s vyhodnocením výsledku | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_compare.asm |
| 204 | fpu_status_word.asm | tisk obsahu stavového slova koprocesoru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_status_word.asm |
| 205 | fpu_status_word_stack.asm | tisk obsahu stavového slova koprocesoru | https://github.com/tisnik/8bit-fame/blob/master/pc-dos/fpu_status_word_stack.asm |
| 206 | Makefile | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/Makefile | |
| 207 | hex2string.asm | subrutina pro převod 32bitové hexadecimální hodnoty na řetězec | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/hex2string.asm |
| 208 | linux_macros.asm | pomocná makra pro tvorbu aplikací psaných v assembleru pro Linux | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/linux_macros.asm |
| 209 | mmx_init.asm | inicializace subsystému MMX | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_init.asm |
| 210 | mmx_paddb1.asm | zavolání MMX instrukce pro součet vektorů bajtů (bez přetečení) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddb1.asm |
| 211 | mmx_paddb2.asm | zavolání MMX instrukce pro součet vektorů bajtů (s přetečením) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddb2.asm |
| 212 | mmx_paddusb.asm | zavolání MMX instrukce pro součet vektorů bajtů se saturací | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddusb.asm |
| 213 | mmx_paddw.asm | zavolání MMX instrukce pro součet vektorů šestnáctibitových slov | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddw.asm |
| 214 | mmx_paddd.asm | zavolání MMX instrukce pro součet vektorů 32bitových slov | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddd.asm |
| 215 | mmx_paddq.asm | zavolání MMX instrukce pro součet 64bitových slov | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddq.asm |
| 216 | mmx_paddx.asm | porovnání operací součtu pro vektory s prvky různých typů | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddx.asm |
| 217 | mmx_support.asm | zjištění, zda je MMX podporována | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_support.asm |
| 218 | mmx_paddx_saturation.asm | součet osmiprvkových a čtyřprvkových vektorů se saturací | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_paddx_saturation.asm |
| 219 | mmx_psubx.asm | rozdíl vektorů s různým počtem a šířkou prvků | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_psubx.asm |
| 220 | mmx_pmullw1.asm | součin vektorů prvek po prvku se získáním spodních 16 bitů výsledků (varianta bez přetečení) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_pmullw1.asm |
| 221 | mmx_pmullw2.asm | součin vektorů prvek po prvku se získáním spodních 16 bitů výsledků (varianta s přetečením) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_pmullw2.asm |
| 222 | mmx_pmulhw.asm | součin vektorů prvek po prvku se získáním horních 16 bitů výsledků (varianta s přetečením) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_pmulhw.asm |
| 223 | mmx_pmaddwd.asm | součin vektorů prvek po prvku, součet mezivýsledků | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_pmaddwd.asm |
| 224 | mmx_logical.asm | logické instrukce MMX | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_logical.asm |
| 225 | mmx_shift_left.asm | logické posuny prvků vektorů doleva | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_shift_left.asm |
| 226 | mmx_shift_right.asm | logické posuny prvků vektorů doprava | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_shift_right.asm |
| 227 | mmx_arithmetic_right.asm | aritmetické posuny prvků vektorů doprava | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_arithmetic_right.asm |
| 228 | mmx_cmpeq.asm | porovnání prvků vektorů na rovnost | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_cmpeq.asm |
| 229 | mmx_cmpgt.asm | porovnání prvků vektorů na relaci „větší než“ | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_cmpgt.asm |
| 230 | mmx_unpack_bytes.asm | rozbalení bajtů z vektorů | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_unpack_bytes.asm |
| 231 | mmx_unpack_words.asm | rozbalení slov z vektorů | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_unpack_words.asm |
| 232 | mmx_unpack_dwords.asm | rozbalení dvojslov z vektorů | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_unpack_dwords.asm |
| 233 | mmx_pack_into_bytes1.asm | zabalení vektorů slov do vektoru bajtů | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_pack_into_bytes1.asm |
| 234 | mmx_pack_into_bytes2.asm | řešení přetečení při zabalování vektorů | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/mmx_pack_into_bytes2.asm |
| 235 | sse_support.asm | detekce, zda mikroprocesor podporuje instrukce SSE | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_support.asm |
| 236 | sse_instr_formats.asm | instrukční formát SSE | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_instr_formats.asm |
| 237 | sse_value_unaligned1.asm | načtení konstanty do XMM registru (nezarovnaná adresa) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_value_unaligned1.asm |
| 238 | sse_value_unaligned2.asm | načtení konstanty do XMM registru (nezarovnaná adresa, ovšem vyžadováno je zarovnání) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_value_unaligned2.asm |
| 239 | sse_value_aligned.asm | načtení konstanty do XMM registru (zarovnaná adresa) | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_value_aligned.asm |
| 240 | sse_addss.asm | skalární součet instrukcí ADDSS | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_addss.asm |
| 241 | sse_addps.asm | vektorový součet instrukcí ADDPS | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_addps.asm |
| 242 | sse_subss.asm | skalární rozdíl instrukcí SUBSS | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_subss.asm |
| 243 | sse_subps.asm | skalární rozdíl instrukcí SUBPS | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_subps.asm |
| 244 | sse_mulps.asm | součin prvků vektorů instrukcí MULPS | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_mulps.asm |
| 245 | sse_divps.asm | podíl prvků vektorů instrukcí DIVPS | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_divps.asm |
| 246 | sse_maxmin.asm | porovnání a výběr větších, resp. menších prvků z dvojice vektorů | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_maxmin.asm |
| 247 | sse_reciprocal.asm | přibližný výpočet převrácené hodnoty | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_reciprocal.asm |
| 248 | sse_sqrt.asm | výpočet druhé odmocniny prvků | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_sqrt.asm |
| 249 | sse_cmpeqps.asm | porovnání prvků vektorů na rovnost | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_cmpeqps.asm |
| 250 | sse_cmpltps.asm | porovnání prvků vektorů na relaci „menší než“ | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_cmpltps.asm |
| 251 | sse_inf_nan.asm | speciální hodnoty nekonečno a NaN v instrukčním souboru SSE | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_inf_nan.asm |
| 252 | sse_ordered.asm | zjištění, které prvky vektorů jsou porovnatelné | https://github.com/tisnik/8bit-fame/blob/master/pc-linux/sse_ordered.asm |
20. Odkazy na Internetu
- The Intel 8088 Architecture and Instruction Set
https://people.ece.ubc.ca/~edc/464/lectures/lec4.pdf - x86 Opcode Structure and Instruction Overview
https://pnx.tf/files/x86_opcode_structure_and_instruction_overview.pdf - x86 instruction listings (Wikipedia)
https://en.wikipedia.org/wiki/X86_instruction_listings - x86 assembly language (Wikipedia)
https://en.wikipedia.org/wiki/X86_assembly_language - Intel Assembler (Cheat sheet)
http://www.jegerlehner.ch/intel/IntelCodeTable.pdf - 25 Microchips That Shook the World
https://spectrum.ieee.org/tech-history/silicon-revolution/25-microchips-that-shook-the-world - Chip Hall of Fame: MOS Technology 6502 Microprocessor
https://spectrum.ieee.org/tech-history/silicon-revolution/chip-hall-of-fame-mos-technology-6502-microprocessor - Chip Hall of Fame: Intel 8088 Microprocessor
https://spectrum.ieee.org/tech-history/silicon-revolution/chip-hall-of-fame-intel-8088-microprocessor - Jak se zrodil procesor?
https://www.root.cz/clanky/jak-se-zrodil-procesor/ - Apple II History Home
http://apple2history.org/ - The 8086/8088 Primer
https://www.stevemorse.org/8086/index.html - flat assembler: Assembly language resources
https://flatassembler.net/ - FASM na Wikipedii
https://en.wikipedia.org/wiki/FASM - Fresh IDE FASM inside
https://fresh.flatassembler.net/ - MS-DOS Version 4.0 Programmer's Reference
https://www.pcjs.org/documents/books/mspl13/msdos/dosref40/ - DOS API (Wikipedia)
https://en.wikipedia.org/wiki/DOS_API - Bit banging
https://en.wikipedia.org/wiki/Bit_banging - IBM Basic assembly language and successors (Wikipedia)
https://en.wikipedia.org/wiki/IBM_Basic_assembly_language_and_successors - X86 Assembly/Bootloaders
https://en.wikibooks.org/wiki/X86_Assembly/Bootloaders - Počátky grafiky na PC: grafické karty CGA a Hercules
https://www.root.cz/clanky/pocatky-grafiky-na-pc-graficke-karty-cga-a-hercules/ - Co mají společného Commodore PET/4000, BBC Micro, Amstrad CPC i grafické karty MDA, CGA a Hercules?
https://www.root.cz/clanky/co-maji-spolecneho-commodore-pet-4000-bbc-micro-amstrad-cpc-i-graficke-karty-mda-cga-a-hercules/ - Karta EGA: první použitelná barevná grafika na PC
https://www.root.cz/clanky/karta-ega-prvni-pouzitelna-barevna-grafika-na-pc/ - RGB Classic Games
https://www.classicdosgames.com/ - Turbo Assembler (Wikipedia)
https://en.wikipedia.org/wiki/Turbo_Assembler - Microsoft Macro Assembler
https://en.wikipedia.org/wiki/Microsoft_Macro_Assembler - IBM Personal Computer (Wikipedia)
https://en.wikipedia.org/wiki/IBM_Personal_Computer - Intel 8251
https://en.wikipedia.org/wiki/Intel_8251 - Intel 8253
https://en.wikipedia.org/wiki/Intel_8253 - Intel 8255
https://en.wikipedia.org/wiki/Intel_8255 - Intel 8257
https://en.wikipedia.org/wiki/Intel_8257 - Intel 8259
https://en.wikipedia.org/wiki/Intel_8259 - Support/peripheral/other chips – 6800 family
http://www.cpu-world.com/Support/6800.html - Motorola 6845
http://en.wikipedia.org/wiki/Motorola_6845 - The 6845 Cathode Ray Tube Controller (CRTC)
http://www.tinyvga.com/6845 - CRTC operation
http://www.6502.org/users/andre/hwinfo/crtc/crtc.html - The 6845 Cathode Ray Tube Controller (CRTC)
http://www.tinyvga.com/6845 - Motorola 6845 and bitwise graphics
https://retrocomputing.stackexchange.com/questions/10996/motorola-6845-and-bitwise-graphics - IBM Monochrome Display Adapter
http://en.wikipedia.org/wiki/Monochrome_Display_Adapter - Color Graphics Adapter
http://en.wikipedia.org/wiki/Color_Graphics_Adapter - Color Graphics Adapter and the Brown color in IBM 5153 Color Display
https://www.aceinnova.com/en/electronics/cga-and-the-brown-color-in-ibm-5153-color-display/ - The Modern Retrocomputer: An Arduino Driven 6845 CRT Controller
https://hackaday.com/2017/05/14/the-modern-retrocomputer-an-arduino-driven-6845-crt-controller/ - flat assembler: Assembly language resources
https://flatassembler.net/ - FASM na Wikipedii
https://en.wikipedia.org/wiki/FASM - Fresh IDE FASM inside
https://fresh.flatassembler.net/ - MS-DOS Version 4.0 Programmer's Reference
https://www.pcjs.org/documents/books/mspl13/msdos/dosref40/ - DOS API (Wikipedia)
https://en.wikipedia.org/wiki/DOS_API - IBM Basic assembly language and successors (Wikipedia)
https://en.wikipedia.org/wiki/IBM_Basic_assembly_language_and_successors - X86 Assembly/Arithmetic
https://en.wikibooks.org/wiki/X86_Assembly/Arithmetic - Art of Assembly – Arithmetic Instructions
http://oopweb.com/Assembly/Documents/ArtOfAssembly/Volume/Chapter6/CH06–2.html - ASM Flags
http://www.cavestory.org/guides/csasm/guide/asm_flags.html - Status Register
https://en.wikipedia.org/wiki/Status_register - Linux assemblers: A comparison of GAS and NASM
http://www.ibm.com/developerworks/library/l-gas-nasm/index.html - Programovani v assembleru na OS Linux
http://www.cs.vsb.cz/grygarek/asm/asmlinux.html - Is it worthwhile to learn x86 assembly language today?
https://www.quora.com/Is-it-worthwhile-to-learn-x86-assembly-language-today?share=1 - Why Learn Assembly Language?
http://www.codeproject.com/Articles/89460/Why-Learn-Assembly-Language - Is Assembly still relevant?
http://programmers.stackexchange.com/questions/95836/is-assembly-still-relevant - Why Learning Assembly Language Is Still a Good Idea
http://www.onlamp.com/pub/a/onlamp/2004/05/06/writegreatcode.html - Assembly language today
http://beust.com/weblog/2004/06/23/assembly-language-today/ - Assembler: Význam assembleru dnes
http://www.builder.cz/rubriky/assembler/vyznam-assembleru-dnes-155960cz - Programming from the Ground Up Book – Summary
http://savannah.nongnu.org/projects/pgubook/ - DOSBox
https://www.dosbox.com/ - The C Programming Language
https://en.wikipedia.org/wiki/The_C_Programming_Language - Hercules Graphics Card (HCG)
https://en.wikipedia.org/wiki/Hercules_Graphics_Card - Complete 8086 instruction set
https://content.ctcd.edu/courses/cosc2325/m22/docs/emu8086ins.pdf - Complete 8086 instruction set
https://yassinebridi.github.io/asm-docs/8086_instruction_set.html - 8088 MPH by Hornet + CRTC + DESiRE (final version)
https://www.youtube.com/watch?v=hNRO7lno_DM - Area 5150 by CRTC & Hornet (Party Version) / IBM PC+CGA Demo, Hardware Capture
https://www.youtube.com/watch?v=fWDxdoRTZPc - 80×86 Integer Instruction Set Timings (8088 – Pentium)
http://aturing.umcs.maine.edu/~meadow/courses/cos335/80×86-Integer-Instruction-Set-Clocks.pdf - Colour Graphics Adapter: Notes
https://www.seasip.info/VintagePC/cga.html - Restoring A Vintage CGA Card With Homebrew HASL
https://hackaday.com/2024/06/12/restoring-a-vintage-cga-card-with-homebrew-hasl/ - Demoing An 8088
https://hackaday.com/2015/04/10/demoing-an-8088/ - Video Memory Layouts
http://www.techhelpmanual.com/89-video_memory_layouts.html - Screen Attributes
http://www.techhelpmanual.com/87-screen_attributes.html - IBM PC Family – BIOS Video Modes
https://www.minuszerodegrees.net/video/bios_video_modes.htm - EGA Functions
https://cosmodoc.org/topics/ega-functions/#the-hierarchy-of-the-ega - Why the EGA can only use 16 of its 64 colours in 200-line modes
https://www.reenigne.org/blog/why-the-ega-can-only-use-16-of-its-64-colours-in-200-line-modes/ - How 16 colors saved PC gaming – the story of EGA graphics
https://www.custompc.com/retro-tech/ega-graphics - List of 16-bit computer color palettes
https://en.wikipedia.org/wiki/List_of16-bit_computer_color_palettes - Why were those colors chosen to be the default palette for 256-color VGA?
https://retrocomputing.stackexchange.com/questions/27994/why-were-those-colors-chosen-to-be-the-default-palette-for-256-color-vga - VGA Color Palettes
https://www.fountainware.com/EXPL/vga_color_palettes.htm - Hardware Level VGA and SVGA Video Programming Information Page
http://www.osdever.net/FreeVGA/vga/vga.htm - Hardware Level VGA and SVGA Video Programming Information Page – sequencer
http://www.osdever.net/FreeVGA/vga/seqreg.htm - VGA Basics
http://www.brackeen.com/vga/basics.html - Introduction to VGA Mode ‚X‘
https://web.archive.org/web/20160414072210/http://fly.srk.fer.hr/GDM/articles/vgamodex/vgamx1.html - VGA Mode-X
https://web.archive.org/web/20070123192523/http://www.gamedev.net/reference/articles/article356.asp - Mode-X: 256-Color VGA Magic
https://downloads.gamedev.net/pdf/gpbb/gpbb47.pdf - Instruction Format in 8086 Microprocessor
https://www.includehelp.com/embedded-system/instruction-format-in-8086-microprocessor.aspx - How to use „AND,“ „OR,“ and „XOR“ modes for VGA Drawing
https://retrocomputing.stackexchange.com/questions/21936/how-to-use-and-or-and-xor-modes-for-vga-drawing - VGA Hardware
https://wiki.osdev.org/VGA_Hardware - Programmer's Guide to Yamaha YMF 262/OPL3 FM Music Synthesizer
https://moddingwiki.shikadi.net/wiki/OPL_chip - Does anybody understand how OPL2 percussion mode works?
https://forum.vcfed.org/index.php?threads/does-anybody-understand-how-opl2-percussion-mode-works.60925/ - Yamaha YMF262 OPL3 music – MoonDriver for OPL3 DEMO [Oscilloscope View]
https://www.youtube.com/watch?v=a7I-QmrkAak - Yamaha OPL vs OPL2 vs OPL3 comparison
https://www.youtube.com/watch?v=5knetge5Gs0 - OPL3 Music Crockett's Theme
https://www.youtube.com/watch?v=HXS008pkgSQ - Bad Apple (Adlib Tracker – OPL3)
https://www.youtube.com/watch?v=2lEPH6Y3Luo - FM Synthesis Chips, Codecs and DACs
https://www.dosdays.co.uk/topics/fm_synthesizers.php - The Zen Challenge – YMF262 OPL3 Original (For an upcoming game)
https://www.youtube.com/watch?v=6JlFIFz1CFY - [adlib tracker II techno music – opl3] orbit around alpha andromedae I
https://www.youtube.com/watch?v=YqxJCu_WFuA - [adlib tracker 2 music – opl3 techno] hybridisation process on procyon-ii
https://www.youtube.com/watch?v=daSV5mN0sJ4 - Hyper Duel – Black Rain (YMF262 OPL3 Cover)
https://www.youtube.com/watch?v=pu_mzRRq8Ho - IBM 5155–5160 Technical Reference
https://www.minuszerodegrees.net/manuals/IBM/IBM_5155_5160_Technical_Reference_6280089_MAR86.pdf - a ymf262/opl3+pc speaker thing i made
https://www.youtube.com/watch?v=E-Mx0lEmnZ0 - [OPL3] Like a Thunder
https://www.youtube.com/watch?v=MHf06AGr8SU - (PC SPEAKER) bad apple
https://www.youtube.com/watch?v=LezmKIIHyUg - Powering devices from PC parallel port
http://www.epanorama.net/circuits/lptpower.html - Magic Mushroom (demo pro PC s DOSem)
http://www.crossfire-designs.de/download/articles/soundcards//mushroom.rar - Píseň Magic Mushroom – originál
http://www.crossfire-designs.de/download/articles/soundcards/speaker_mushroom_converted.mp3 - Píseň Magic Mushroom – hráno na PC Speakeru
http://www.crossfire-designs.de/download/articles/soundcards/speaker_mushroom_speaker.mp3 - Pulse Width Modulation (PWM) Simulation Example
http://decibel.ni.com/content/docs/DOC-4599 - Resistor/Pulse Width Modulation DAC
http://www.k9spud.com/traxmod/pwmdac.php - Class D Amplifier
http://en.wikipedia.org/wiki/Electronic_amplifier#Class_D - Covox Speech Thing / Disney Sound Source (1986)
http://www.crossfire-designs.de/index.php?lang=en&what=articles&name=showarticle.htm&article=soundcards/&page=5 - Covox Digital-Analog Converter (Rusky, obsahuje schémata)
http://phantom.sannata.ru/konkurs/netskater002.shtml - PC-GPE on the Web
http://bespin.org/~qz/pc-gpe/ - Keyboard Synthesizer
http://www.solarnavigator.net/music/instruments/keyboards.htm - FMS – Fully Modular Synthesizer
http://fmsynth.sourceforge.net/ - Javasynth
http://javasynth.sourceforge.net/ - Software Sound Synthesis & Music Composition Packages
http://www.linux-sound.org/swss.html - Mx44.1 Download Page (software synthesizer for linux)
http://hem.passagen.se/ja_linux/ - Software synthesizer
http://en.wikipedia.org/wiki/Software_synthesizer - Frequency modulation synthesis
http://en.wikipedia.org/wiki/Frequency_modulation_synthesis - Yamaha DX7
http://en.wikipedia.org/wiki/Yamaha_DX7 - Wave of the Future
http://www.wired.com/wired/archive/2.03/waveguides_pr.html - Analog synthesizer
http://en.wikipedia.org/wiki/Analog_synthesizer - Minimoog
http://en.wikipedia.org/wiki/Minimoog - Moog synthesizer
http://en.wikipedia.org/wiki/Moog_synthesizer - Tutorial for Frequency Modulation Synthesis
http://www.sfu.ca/~truax/fmtut.html - An Introduction To FM
http://ccrma.stanford.edu/software/snd/snd/fm.html - John Chowning
http://en.wikipedia.org/wiki/John_Chowning - I'm Impressed, Adlib Music is AMAZING!
https://www.youtube.com/watch?v=PJNjQYp1ras - Milinda- Diode Milliampere ( OPL3 )
https://www.youtube.com/watch?v=oNhazT5HG0E - Dune 2 – Roland MT-32 Soundtrack
https://www.youtube.com/watch?v=kQADZeB-z8M - Interrupts
https://wiki.osdev.org/Interrupts#Types_of_Interrupts - Assembly8086SoundBlasterDmaSingleCycleMode
https://github.com/leonardo-ono/Assembly8086SoundBlasterDmaSingleCycleMode/blob/master/sbsc.asm - Interrupts in 8086 microprocessor
https://www.geeksforgeeks.org/interrupts-in-8086-microprocessor/ - Interrupt Structure of 8086
https://www.eeeguide.com/interrupt-structure-of-8086/ - A20 line
https://en.wikipedia.org/wiki/A20_line - Extended memory
https://en.wikipedia.org/wiki/Extended_memory#eXtended_Memory_Specification_(XMS) - Expanded memory
https://en.wikipedia.org/wiki/Expanded_memory - Protected mode
https://en.wikipedia.org/wiki/Protected_mode - Virtual 8086 mode
https://en.wikipedia.org/wiki/Virtual_8086_mode - Unreal mode
https://en.wikipedia.org/wiki/Unreal_mode - DOS memory management
https://en.wikipedia.org/wiki/DOS_memory_management - Upper memory area
https://en.wikipedia.org/wiki/Upper_memory_area - Removing the Mystery from SEGMENT : OFFSET Addressing
https://thestarman.pcministry.com/asm/debug/Segments.html - Segment descriptor
https://en.wikipedia.org/wiki/Segment_descriptor - When using a 32-bit register to address memory in the real mode, contents of the register must never exceed 0000FFFFH. Why?
https://stackoverflow.com/questions/45094696/when-using-a-32-bit-register-to-address-memory-in-the-real-mode-contents-of-the - A Brief History of Unreal Mode
https://www.os2museum.com/wp/a-brief-history-of-unreal-mode/ - Segment Limits
https://wiki.osdev.org/Segment_Limits - How do 32 bit addresses in real mode work?
https://forum.osdev.org/viewtopic.php?t=30642 - The LOADALL Instruction by Robert Collins
https://www.rcollins.org/articles/loadall/tspec_a3_doc.html - How do you put a 286 in Protected Mode?
https://retrocomputing.stackexchange.com/questions/7683/how-do-you-put-a-286-in-protected-mode - Control register
https://en.wikipedia.org/wiki/Control_register - CPU Registers x86
https://wiki.osdev.org/CPU_Registers_x86 - x86 Assembly/Protected Mode
https://en.wikibooks.org/wiki/X86_Assembly/Protected_Mode - MSW: Machine Status Word
https://web.itu.edu.tr/kesgin/mul06/intel/intel_msw.html - 80×87 Floating Point Opcodes
http://www.techhelpmanual.com/876–80×87_floating_point_opcodes.html - Page Translation
https://pdos.csail.mit.edu/6.828/2005/readings/i386/s05_02.htm - 80386 Paging and Segmenation
https://stackoverflow.com/questions/38229741/80386-paging-and-segmenation - 80386 Memory Management
https://tldp.org/LDP/khg/HyperNews/get/memory/80386mm.html - DOSEMU
http://www.dosemu.org/ - Intel 80386, a revolutionary CPU
https://www.xtof.info/intel80386.html - PAI Unit 3 Paging in 80386 Microporcessor
https://www.slideshare.net/KanchanPatil34/pai-unit-3-paging-in-80386-microporcessor - 64 Terabytes of virtual memory for 32-bit x86 using segmentation: how?
https://stackoverflow.com/questions/5444984/64-terabytes-of-virtual-memory-for-32-bit-x86-using-segmentation-how - Pi in the Pentium: reverse-engineering the constants in its floating-point unit
http://www.righto.com/2025/01/pentium-floating-point-ROM.html - Simply FPU
http://www.website.masmforum.com/tutorials/fptute/ - Art of Assembly language programming: The 80×87 Floating Point Coprocessors
https://courses.engr.illinois.edu/ece390/books/artofasm/CH14/CH14–3.html - Art of Assembly language programming: The FPU Instruction Set
https://courses.engr.illinois.edu/ece390/books/artofasm/CH14/CH14–4.html - INTEL 80387 PROGRAMMER'S REFERENCE MANUAL
http://www.ragestorm.net/downloads/387intel.txt - x86 Instruction Set Reference: FLD
http://x86.renejeschke.de/html/file_module_x86_id100.html - x86 Instruction Set Reference: FLD1/FLDL2T/FLDL2E/FLDPI/FLDLG2/FLDLN2/FLDZ
http://x86.renejeschke.de/html/file_module_x86_id101.html - X86 Assembly/Arithmetic
https://en.wikibooks.org/wiki/X86_Assembly/Arithmetic - 8087 Numeric Data Processor
https://www.eeeguide.com/8087-numeric-data-processor/ - Data Types and Instruction Set of 8087 co-processor
https://www.eeeguide.com/data-types-and-instruction-set-of-8087-co-processor/ - 8087 instruction set and examples
https://studylib.net/doc/5625221/8087-instruction-set-and-examples - GCC documentation: Extensions to the C Language Family
https://gcc.gnu.org/onlinedocs/gcc/C-Extensions.html#C-Extensions - GCC documentation: Using Vector Instructions through Built-in Functions
https://gcc.gnu.org/onlinedocs/gcc/Vector-Extensions.html - SSE (Streaming SIMD Extentions)
http://www.songho.ca/misc/sse/sse.html - Timothy A. Chagnon: SSE and SSE2
http://www.cs.drexel.edu/~tc365/mpi-wht/sse.pdf - Intel corporation: Extending the Worldr's Most Popular Processor Architecture
http://download.intel.com/technology/architecture/new-instructions-paper.pdf - SIMD architectures:
http://arstechnica.com/old/content/2000/03/simd.ars/ - Tour of the Black Holes of Computing!: Floating Point
http://www.cs.hmc.edu/~geoff/classes/hmc.cs105…/slides/class02_floats.ppt - 3Dnow! Technology Manual
AMD Inc., 2000 - Intel MMXTM Technology Overview
Intel corporation, 1996 - MultiMedia eXtensions
http://softpixel.com/~cwright/programming/simd/mmx.phpi - AMD K5 („K5“ / „5k86“)
http://www.pcguide.com/ref/cpu/fam/g5K5-c.html - Sixth Generation Processors
http://www.pcguide.com/ref/cpu/fam/g6.htm - Great Microprocessors of the Past and Present
http://www.cpushack.com/CPU/cpu1.html - Very long instruction word (Wikipedia)
http://en.wikipedia.org/wiki/Very_long_instruction_word - CPU design (Wikipedia)
http://en.wikipedia.org/wiki/CPU_design - Bulldozer (microarchitecture)
https://en.wikipedia.org/wiki/Bulldozer_(microarchitecture) - MMX (instruction set)
https://en.wikipedia.org/wiki/MMX_(instruction_set) - Extended MMX
https://en.wikipedia.org/wiki/Extended_MMX - Saturation arithmetic
https://en.wikipedia.org/wiki/Saturation_arithmetic - CMPPS — Compare Packed Single Precision Floating-Point Values
https://www.felixcloutier.com/x86/cmpps - ADDPS — Add Packed Single Precision Floating-Point Values
https://www.felixcloutier.com/x86/addps - SUBPS — Subtract Packed Single Precision Floating-Point Values
https://www.felixcloutier.com/x86/subps - SQRTPS — Square Root of Single Precision Floating-Point Values
https://www.felixcloutier.com/x86/sqrtps - RSQRTPS — Compute Reciprocals of Square Roots of Packed Single Precision Floating-PointValues
https://www.felixcloutier.com/x86/rsqrtps