Názory k článku Matematické koprocesory na 80×86 pro výpočty s plovoucí řádovou čárkou

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

14. 1. 2025 9:08

Martin Beran

Pěkně vysvětlená reprezentace FP hodnot a používání FPU. Jenom u formátu double by měl být bias=1023, nikoliv 2047.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 16:15

Pavel Tišnovský

Zlatý podporovatel

zkontroluju a opravim, diky
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 13:38

atarist

Tak FPU tedy Intel umel a umi delat (na rozdil od CPU :). Chtelo by to potom porovnat, jak rychle ty FPU jsou, protoze imho 8087 mela pomaly algoritmy, kdezto treba u Pentia to snad bylo co takt, to dokoncena FPU operace. ale mozna si to pletu a nektery operace byly pomalejsi.

Nebyl v 87 implementovanej CORDIC?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 15:07

Marvin

FDIV na Pentiu generovalo 2 bity výsledku za CLK a po celou dobu dělení nešlo zahájit jinou FPU operaci.

FMUL šlo zahájit jen každý druhý CLK.
Na Pentiu a na K5 byla ještě float a int násobička sdílená.

Od Pentia byla instrukce FXCH párovatelná, daly se tím levně přejmenovat registry a k FPU stacku přistupovat jako k nezávislým registrům.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 22:02

RDa

Na Pentiu a na K5 byla ještě float a int násobička sdílená.

Mas pro to nejake podklady?

To spis vypada ze az P4 melo neduh ze to tahalo skrze delsi jednotku (vyssi frekvence, mene urovni kombinacni logiky), zatimco osatni stara pentia ne, a integer multiply se tam delalo klasicky (nejspi jen na jedne) z u,v pipelin. Nasobicku mezi INTALU a FPALU nejde sdilet, jsou to prakticky jine mista v kremiku.

ref.: https://cr.yp.to/2005-590/fog.pdf
An integer multiplication takes approximately 9 clock cycles on P1 and PMMX; 4 on PPro, P2 and P3; and 14 on P4. It is therefore often advantageous to replace a multiplication by a constant with a combination of ...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 11:47

Marvin

"AMD K5 Technical Reference Manual"
K5 překládala IMUL na mikrooperace pro FP jednotku.
Interně jsou možná násobičky oddělené, jen úkolované společnou jednotkou.
Na K6 už byla int násobička součástí jedné z int alu. Od K6 AMD doporučuje používat násobičku místo rozepisování na shift/add/lea.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 16:54

PEAK

http://www.righto.com/2024/12/this-die-photo-of-pentium-shows.html
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 14:02

Marvin

Borlad Pascal měl typ "extended" pro float v přesnosti koprocesoru a vestavěný SW emulátor.
V "C" byl pro 80bit float "long double".
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 21:50

Ditys

Kdysi jsem zkoušel rychlost při použití pascalského typu "real" (48 bit) a "extended" (80 bit) s využitím FPU, ty rychlosti byly prakticky stejné. To bylo ovšem na čipu 8087.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 9:16

Michal Kubeček

Jestli jste to zkoušel programem napsaným v Pascalu a přeloženým Turbo/Borland Pascalem, tak to mohl být spíš problém překladače. Když jsem si ke své 386 pořídil koprocesor (kvůli programu Mathematica), tak jsem si chtěl hned vyzkoušet, o kolik je to rychlejší, a napsal jsem si jednoduchý prográmek, který kreslil Juliovu množinu a počítal to ve floatech. Při překladu s použitím koprocesoru to sice rychlejší bylo, ale IIRC jen asi třikrát, což u programu, který v podstatě nic jiného než float aritmetiku nedělal, bylo docela zklamání.

Pak jsem se ale podíval na přeložený program a zjistil jsem, že překladač každou aritmetickou operaci provedl tak, že zkopíroval argumenty do FPU, provedl příslušnou FPU instrukci a pak zkopíroval výsledek zpátky. A i v případě, že se ten výsledek hned vzápětí znovu použil (třeba při násobení tří čísel), tak ho stejně znovu nakopíroval zpátky do FPU. Tak jsem zkusil tu vnitřní smyčku přepsat do assembleru tak, aby se hodnoty do FPU posílaly jen jednou, celý výraz se spočítal v FPU a použil se jen finální výsledek. Zrychlení bylo asi tisícinásobné.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 18:32

Ditys

Určitě jsem v té době jiný překladač neměl :-). Jinak gratuluji k tak výrazné úpravě, to zrychlení muselo potěšit. Já jsem zvládl jen převod z pascalského "real" na "extended" vlastní funkcí v C, zabralo mi to víkend. Ale taky to fungovalo.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 19:12

PEAK

Pekné.

Mojou obľúbenou inštrukciou je FSINCOS, ktorá vráti výsledky obidvoch trigonometrických funkcií súčasne.

Intel VTune to pekne rozozná.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 22:55

radioing

Jj, to si pamatuji, investoval jsem do 287 a takhle to vypadalo. Mam ten dojem, ze duvodem bylo zjednoduseni prekladace. Pri sw reseni se do kodu vlozilo volani floating funkce z knihovny, pri pouziti FPU se tam vlozil monoliticky kus kodu bez zavislosti (v FPU - ST reg.) na predchozi/nasledujici fp operaci.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
16. 1. 2025 12:55

Michal Kubeček

pri pouziti FPU se tam vlozil monoliticky kus kodu bez zavislosti (v FPU - ST reg.) na predchozi/nasledujici fp operaci.

Asi to souvisí i s tím, co se řeší v jiné části této diskuse. Pokud se data mezi CPU a FPU předávala opravdu tak neefektivním způsobem, jak se tam píše, tak se ani nedivím, že jejich neustálé posílání tam a zpátky spotřebovalo víc času než samotný výpočet.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
19. 1. 2025 19:40

Antonin_Holub_Slany

koukám, že je tu dost odborníků a tak by mě zajímalo, jak fungoval SW koprocesor (emulator) pro 486SX (matně si vzpomínám že to byl nějaký dos program?), že to mělo pak při výpočtech v nějakých programech lepší "vejkon" :-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
19. 1. 2025 22:58

Michal Kubeček

Pokud mne paměť neklame, je rezervovaná konkrétní výjimka, která se vyvolá, pokud procesor narazí na FPU instrukci, ale FPU není k dispozici. Emulátor instaluje obsluhu této výjimky, která se podívá na instrukci, provede její emulaci (v CPU) a vrátí se, načež se pokračuje další instrukcí. Stejně funguje (nebo spíš asi fungovala) emulace FPU v linuxovém jádře.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 1. 2025 18:03

Ladis

Tahle SW podpora byla ve Windows od 3.x, takže narozdíl od macOS Classic nebyl problém (Apple programy od určité verze Motoroly počítaly s koprocesorem, např. Excel, a on ho pak vyhodil v laptopech, protože se čip v jedné generaci přehříval).

V DOSu určitě byla podpora třetích stran, ale třeba Pascal si to řešil sám, čímžto to bylo znatelně rychlejší - podporu FPU zjistil jednou a pak modifikoval instrukce v kódu (rychlost, jakoby byl program zkompilován jen se SW podporou).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 1. 2025 22:21

radioing

Pamatuji si, ze na 386 jsem pod dosem (simulace ve SPICE apod.) mel v tech nevyuzitych 3 MB nejaky 900 kB emulator koprocesoru. Z velikosti je zrejme, ze byl zalozen na rozsahlych LUT, a zrychleni oproti klasickym emulatorum bylo v zavislosti na typu operaci az nekolikanasobne (jednociferne). Ono cekat na vypocet hodinu nebo tri hodiny byl stale rozdil.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 14:46

jdobry

Tak dlouho jsme zlepsovali matematicke vypocty na pocitacich, az jsme se "vratili" na 8 bit float. FP8 jako E4M3 (4-bit exponent, 3-bit mantisa), nebo
E5M2 (5-bit exponent, 2-bit mantisa)
To se dnes hodi na AI, protoze je to mene narocne na vsechno (energie, pocet tranzistoru, ulozeni, prenos) a na AI to staci.
A FP8 neni v IEEE 754, zatim.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 16:05

Pavel Tišnovský

Zlatý podporovatel

Diky za informaci. Ja mel za to, ze se pouziva bug bfloat16 a tam, kde se boji soudu (NVidia), tak se pouziva fp16. Takze se uz jde jeste niz?

* zase pekny, tady ty kratky FP se hodi na vyuku. jsou i sestibitovy FP, kde se daji vsechny hodnoty krasne vynest a vsechno na tom pochopit.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 16:17

kvr kvr

Teď už je tendence jít na FP4 (1+1 bit mantisa, 2 bit exponent, 1 bit sign). Ale myslím, že ho má zatím jen Nvidia, u ostatních se na tom pracuje (tam, kde je cílem AI).

https://en.m.wikipedia.org/wiki/Minifloat
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 18:37

Pavel Tišnovský

Zlatý podporovatel

tyjo zajímavý, že to (zdá se) ještě není podporovaný v PyTorchi, pokud to CUDA fakt podporuje. zjistím...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 19:36

atarist

to se už ani nepočítá, ale výsledky jsou v lookup tabulkách, že?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 21:27

alex6bbc

to je zajimava myslenka do kdy jen tbulku a kdy uz pocitat.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 23:21

RDa

Nuz bezne FPGA maji 6-vstupove LUT, takze pokud bude ALU hardcoded (2-bit operace, 2x 4bit data), tak by tech 10 bitu slo namapovat na vystupni data snad i v 1 cyklu pres 1 GHz, i kdyz na bezne aplikace si lze dovolit to rozsekat na vicetaktovou pipeline.

Nemusi to byt nutne ROM ve fyzicke realizaci, viz treba ta zabugovana PLA v pentiu, z nedavneho koumani jeho kremiku od Kena, kdy oprava dokonce prinesla zrychleni protoze byla vystupni entropie mensi.

Mozna nekdo z ASIC navrharu nam sdeli jake jsou prakticky frekvence u urciteho poctu levels of logic, nebo tedy hodnevstupe funkce :)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 18:58

Snehulak666

Neměly FPU v sobě už 486 DX ? Já myslím, že ano.
Viz:
https://cs.wikipedia.org/wiki/Intel_80486
14. 1. 2025, 18:59 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 19:03

Pavel Tišnovský

Zlatý podporovatel

DXka určitě měly
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 19:06

Snehulak666

No právě vy píšete : "Až mnohem později (konkrétně u Pentia) se matematický koprocesor stal nedílnou součástí mikroprocesoru, což znamená, že dnes již není nutné"

tak buď to blbě chápu nebo tam máte renonc :) Jinak díky za vaše články, jsou skvělé i ty staré o zvukovkách atd... :D

Já si stále hraju s https://86box.net/ myslím, že na tom i pracují češi a pouštím dětem hudbu přes covox :D Perfektní emulátor téměř jakéhokoliv stroje, zvukovky, graf.karty atd...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 19:14

Pavel Tišnovský

Zlatý podporovatel

jo tak, už chápu. No situace 486 je kvůli SX a DX trošku složitější, to jsem si chtěl nechat na příště :-). Ta myšlenka napsaná do jedné nepřesné věty byla taková, že u Pentia je vždy na 100% součástí i matematický koprocesor, u 8088/8086/80286/80386 je to vždycky samostatný čip a prostě 486 je taková princezna koloběžka. Nějak to zkusím vylepšit.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 19:35

kvr kvr

Aby to nebylo tak jednoduché, tak to platilo pro Intel Pentium, ale ne nutně ostatní 80586, viz NexGen Nx586 ( https://www.cpu-world.com/CPUs/Nx586/NexGen-Nx586-P133.html ). Nechávaje teď stranou nízko-výkonné a nízko-nákladové embedded varianty, které se prodávají dodnes...

... od x86_64 stejně všichni používají SSE.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 19:55

Pavel Tišnovský

Zlatý podporovatel

jj, ale tady si Intel udělal pořádek a značí si svoji řadu čipů jako Pentium (potom rozděluje P5, P6, ...což nás bude zajímat) a to si už další výrobce nemohl "přisvojit" tak, jako číselné označení.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 19:08

PEAK

Číselné označenie nie je možné registrovať ako ochrannú známku.

Ani bežné slová zo slovníka. Ale prečo je označenie Okenice.!?

Celé zle.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
16. 1. 2025 11:39

Gregor Fefor

Tak ono trebárs Am5x86 (to sme mali doma) ani nebolo reálne Pentium ale len vylepšená 486 a používalo to dosku kompatibilnú so staršími 486-kami.
Teda ak si dobre pamätám...
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 19:36

Jimmy

Ono je to ještě složitější. Jednou z alternativ Pentia byl procesor NexGen a ten FPU také neměl (pozdější verze pak ano). Niméně to byla minorita kterou skoro nikdo nepoužíval, protože potřeboval i svoje unikátní základní desky.

https://en.wikipedia.org/wiki/NexGen
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 8:47

TencosledujeLupu

Možná proto se mluví o "Pentiu" a ne o 5. generaci x86 :-)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 9:21

Michal Kubeček

u Pentia je vždy na 100% součástí i matematický koprocesor, u 8088/8086/80286/80386 je to vždycky samostatný čip a prostě 486 je taková princezna koloběžka

V těch 486 od Intelu byl taky vždy, jen se v některých (SX) nedal používat. :-) Myslím, že jediné 486, kde koprocesor opravdu nebyl, byly takové ty podivnosti jako 486DLC od některých alternativních výrobců.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 20:57

Ace

486DLC je fakticky vytuněná (486 instrukce) 386DX s cache; podobně 486SXL ;-)
Soused to kdysi před 30 lety měl, trhač asfaltu to nebyl ve srovnání s kamarádovou 486.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
16. 1. 2025 8:42

TencosledujeLupu

Jojo Cyrixe jsem měl taky :-) Ale byl za pár piv (z nějaký fabriky, co přecházela na vyšší), tak jsem si nestěžoval :-p
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 1. 2025 8:54

PEAK

Metr piv?

To byla univerzální jednotka. Ale ne podle SI.

Tak na zdraví!

Hezký den!
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 21:40

radioing

Ja jsem si pro zobrazeni floating point na slabsich embedded oblibil format "%a", "%A". Kod vlastni implementace je relativne kratky, takze i rychlost je prijatelna a nebrzdi tolik, jako std knihovna, a pritom se z toho zobrazeni da i jen pohledem odhadnout, o jakou hodnotu se jedna. Treba 10.01->0x412028f6 (<<1 -> 0x824051EC)->0x1.4051ecp+3.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 22:14

Marek

Tady je pěkná webová aplikace, která zobrazuje jednotlivé "kusy" IEEE-754 čísla: https://marekknapek.github.io/float/#?n=0x40490fdb
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 9:03

Pavel Tišnovský

Zlatý podporovatel

Díky! Hele kdyby ta aplikace měla i vstupní řádek pro zadání hexa hodnoty, tak by to bylo přímo použitelné na ty příklady.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 9:38

Marek

Vstupní řádek tam není, hex zadání lze udělat pomocí fragment části URL (za křížkem). Dále tam chybí klasické dekadické zadání či nejkratší možný dekadický výstup, který bez ztráty přesnosti konvertuje zpět. To ale není triviální, jsou na to knihovny, ale chtěl jsem to napsat na zelené louce v C. Další podobná aplikace je na https://www.h-schmidt.net/FloatConverter/IEEE754.html ale ta umí pouze float, já tam mám i double a quadruple.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 10:09

Pavel Tišnovský

Zlatý podporovatel

hehe zrovna tu appku znam, ale nechtel jsem ti kazit radost s tou Tvou :) Kazdopadne to pouziju v dalsim diku, diky
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
14. 1. 2025 22:22

Radek Zajíc

Zrovna nedavno vysel zajimavy text, ktery ukazuje, kde a jak byly ruzne floating konstanty ulozeny v FPU v prvnich Pentiich. Doporucuji!
http://www.righto.com/2025/01/pentium-floating-point-ROM.html
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 9:43

jdsulin

K tomu NaN pripadne nekonecnu. Pokud spravne chapu operaci 0^0, tak to by melo vyjit 1 ne ?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 14:05

8665c891-f916-47c6-829f-8c9c4dbd

Dobry postreh.

https://en.wikipedia.org/wiki/Indeterminate_form#Indeterminate_form_00
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 20:47

atarist

proč by to měla být 1? Python skutecne vraci jednicku, ale moc mi neni jasny, proc, stejne tak to muze byt 0 nebo NaN.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 21:28

RDa

1 je to tam, kde se snazili redukovat "undefined behaviour", viz

https://en.wikipedia.org/wiki/Zero_to_the_power_of_zero#Programming_languages

The C and C++ standards do not specify the result of 0⁰ (a domain error may occur). But for C, as of C99, if the normative annex F is supported, the result for real floating-point types is required to be 1 because there are significant applications for which this value is more useful than NaN[28] (for instance, with discrete exponents); the result on complex types is not specified, even if the informative annex G is supported.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
16. 1. 2025 9:10

Pavel Tišnovský

Zlatý podporovatel

No ona norma IEEE 754 popisuje dokonce tri implementace operace ^: pow, powd a powr. Kazda se ma chovat jinak a napriklad powr signalizue neplatnou operaci. Ale treba pown(x, 0) ma vracet 1 pro vsechny x krome NaNu. atd. Cecko dneska vraci 1.0 rekl bych.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 11:11

MilanV

Dobrý úvod do problematiky, ale musím říct, že se už těším na další díl, jestli se tam dostaneme k vlastnímu fungování spolupráce CPU a FPU. Zarazil mě tady ten pro mě ne úplně jasný a přesný pojem "pomocí sdílení sběrnice". Našel jsem si jedno PDF, kde popisují 8087 s modelem "sdílení toku instrukcí" což má být asi to, co myslíte, a "model 80387". Mimo jiné obojí potřebuje vlastní typ přerušení, jak jsem očekával. Tak jsem zvědavý na podrobnější popis a následně pak i na popis instrukční sady FPU. Např. jak se v praxi přenášely ty 80bit hodnoty a ne jen ořezané na 64 bitů? A ten přenos do RAM zařizoval CPU nebo mělo FPU svoje DMA?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 11:23

RDa

Sdileni sbernice umoznuje x86 pomoci pinu "#HOLD", kdyz se aktivuje a cpu potvrdi odevzdani, tak je masterem jiny obvod, ktery muze delat pristupy kam jenom chce.

Viz https://www.righto.com/2023/08/intel-8086-bus-hold.html

Spravna odpoved je "FPU melo svoje DMA", data neslo sdilet mezi CPU registry a FPU jinak, nez obloukem skrze RAM.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 15:52

MilanV

Děkuju. Tohle jsem čekal, ale myslel jsem tím, že samo o sobě to musí být nedostatečné na sdílení informace, co právě přichází za instrukci a pro který čip že je. Na to je potřeba podle mě sdílet instrukční registr, jak píšu v odpovědi níže.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 16:50

RDa

Viz nize. Nesdili se. Sefuje CPU, a koprocesor nasloucha.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 13:35

Pavel Tišnovský

Zlatý podporovatel

jeste se k tomu dostanu, ale podrobny popis zapojeni a signallingu je tady https://roboticelectronics.in/8087-interfacing-with-8086/

Mozna zacit az s popisem signalu TEST, tam je sdileni popsano. Ale dostaneme se k tomu

(jaky by mel byt problem s 80 bity? prenesou se normalne 10x bajt nebo 5x slovo, jestli se ptate na toto)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 15:47

MilanV

Já jsem našel stručný popis v https://dougx.net/gaming/coproc.html#howtheywork

A tam se mi potvrdily dvě věci, co jsem čekal:
- CPU a FPU musejí mít definovaný vlastní (společný) typ přerušení,
- nestačí sdílet sběrnici, musejí sdílet něco jako instrukční registr (v této terminologii je to BIU ?)

A jestli dobře koukám, tak v tom dokumentu, co odkazujete, se to potvrdilo. Ale přiznávám, že jsem oboje jen proletěl.

Ohledně těch 80 bitů mě jenom zaujalo, že se to muselo načítat po kouskách, na 8087 počítám dokonce jen po 16 bitech, protože ještě neměla 32bitové registry... To muselo být cyklů navíc! Nevyplatilo se jednodušší výpočty dělat v CPU? Na ty praktické záležitosti jsem právě zvědavý: jak se to opravdu používalo.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 16:07

Pavel Tišnovský

Zlatý podporovatel

BIU obecně znamená Bus Interface Unit.

Ano, data se do FPU přenášela normálně po externí sběrnici, takže po 8/16 bitech (tam nezáleží na šířce registrů, omezuje to šířka sběrnice). Rychlé to extra nebylo, ale zase FP operace v SW emulátoru byly mnohem pomalejší. Třeba IDIV mělo 171-190+EA cyklů a IMUL na tom nebyl o moc líp se 134-160+EA cykly. A to při SW FP operacích bylo potřeba mnohem více instrukcí, včetně normalizací, převodů operandů na stejné exponenty atd.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 16:49

RDa

Tak ty stare procesory nebyli vubec pipelinovane - byl to v podstate stavovy automat co si jel to sve dokola, tudiz pak mate tento vykon:

Intel 8086: 0.330 MIPS at 5.000 MHz

Coz znamena prumerne 15 taktu "sbernice" na instrukci.

Ohledne instrukci - k cemu preruseni? To se v pripade FPU pouziva jen k indikaci chyby, a je to drat bokem dokola, do standardniho radice preruseni.

Instrukci registr se nesdili (nic takoveho ani neexistuje). Oba cipy dekoduji sled instrukci - a ty co pro nej urceny nejsou (podle prefixu) jednoduse ignoruji. V podstate by se dalo rict, ze to cele ridi procesor (vcetne treba cteciho cyklu pro IMM argument instrukce), a koprocesor nasloucha.. a kdyz uslysi magicke sluvko (svoji instrukci) tak se probere k nejake cinnosti. V pripade ze potrebuje sbernici, tak si ji prevezme.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
15. 1. 2025 18:02

MilanV

"instrukčním registrem" jsem myslel interní registr nepřístupný programátorovi, místo kam se z RAM načte kód instrukce a následně zpracovává - rozhoduje CPU/FPU, převádí na mikrokód apod.
Neznám pořádně architekturu x86, takže neřeknu terminologicky věci správně (proto jsem rád za tento seriál), myslel jsem to obecně jak fungují procesory.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 1. 2025 14:43

PaJaSoft

Také lovím z drahé děravé paměti a pamatuji oslnění nejprve SW FPU emulátorem (majstrštych bylo ukrást ty opravdu rychlé, optimalizované a žeroucí jen 230KB RAM), který jsem posléze nahradil a do prázdně zející patice osadil úžasnou I80387 na mé I80386DX s nejprve 1MB RAM (a to si ještě namapování BIOSu ukouslo podstatný kus... asi 30%, řešilo se to v DOS x86 para virtual módem zavedením jednoho .sys modulu jehož jméno teď hned nevytáhnu z rukávu), jenže Borland Turbo Pascal i C/C++ vyžadoval tý paměti pro svůj start 2MB... tak se mi podařilo přesvědčit rodiče to druhé mego dokoupit... (za podstatně jinou láci než se o pár let později na delši dobu ustálila cena 1MB/1000 Kč) a pak jsem si mohl vybrat, zda-li nabootuju Linux kernel v0.9 s TCP/IP stackem a nebo ušetřím cca 350kB RAM (pro TCP/IP) a budu psát a debugovat (bez network části) BBS kód běžící posléze na bbs.vslib.cz...

Perlička těchto FPU byla ta, že patice byla kompatidebilní => k I80386 jste mohli osadit I8087 (i na můj vkus pomalý<g>) nebo I80287, kterýžto byl o poznání lepší výkonově (to jsem chvíli měl, protože I80387 byl skoro násobně(!) dražší). Nejsem si ale jist, zda-li byly funkční všechny možné kombinace a pokud si to tedy pamatuji dobře nešlo to obráceně - např. I80387 nešlo osadit k I80286.