Tak FPU tedy Intel umel a umi delat (na rozdil od CPU :). Chtelo by to potom porovnat, jak rychle ty FPU jsou, protoze imho 8087 mela pomaly algoritmy, kdezto treba u Pentia to snad bylo co takt, to dokoncena FPU operace. ale mozna si to pletu a nektery operace byly pomalejsi.
Nebyl v 87 implementovanej CORDIC?
FDIV na Pentiu generovalo 2 bity výsledku za CLK a po celou dobu dělení nešlo zahájit jinou FPU operaci.
FMUL šlo zahájit jen každý druhý CLK.
Na Pentiu a na K5 byla ještě float a int násobička sdílená.
Od Pentia byla instrukce FXCH párovatelná, daly se tím levně přejmenovat registry a k FPU stacku přistupovat jako k nezávislým registrům.
Na Pentiu a na K5 byla ještě float a int násobička sdílená.
Mas pro to nejake podklady?
To spis vypada ze az P4 melo neduh ze to tahalo skrze delsi jednotku (vyssi frekvence, mene urovni kombinacni logiky), zatimco osatni stara pentia ne, a integer multiply se tam delalo klasicky (nejspi jen na jedne) z u,v pipelin. Nasobicku mezi INTALU a FPALU nejde sdilet, jsou to prakticky jine mista v kremiku.
ref.: https://cr.yp.to/2005-590/fog.pdf
An integer multiplication takes approximately 9 clock cycles on P1 and PMMX; 4 on PPro, P2 and P3; and 14 on P4. It is therefore often advantageous to replace a multiplication by a constant with a combination of ...