Vlákno názorů k článku Techniky zvýšení výpočetního výkonu počítačů od flatline - Prijde mi, ze slouceni dvou LD instrukci v...

  • Článek je starý, nové názory již nelze přidávat.
  • 29. 5. 2008 13:57

    flatline (neregistrovaný)
    Prijde mi, ze slouceni dvou LD instrukci v druhem pripade neni idealni. Nechal bych (LD a) samostatnou, v dalsim kroku sloucil (LD b + RL a) a tak dale.
  • 1. 6. 2008 23:04

    BLEK. (neregistrovaný)
    U současných procesorů (PentiumPro a výš, K6 a výš) je úzké hrdlo dekodér instrukcí, nikoli výkonné jednotky. Takže se instrukce překladačem přehazují podle toho, aby rychle prolezly dekodérem. Jak budou zpracovávány jednotkami překladač neřeší, protože to si jádro procesoru přeskládá samo.

    Pro Pentium Pro/2/3/Core se instrukce skládají podle pravidla 4-1-1 (jedna těžká instrukce, co se rozloží na 4 mikroinstrukce, pak dvě lehké instrukce).
    Pro Core 2 je to 4-1-1-1.
    Pro Pentium 4 se musí od sebe dávat instrukce s přímými operandy.
    Pro K6-2 se scheduluje 2+2 nebo 4. (dvě lehké instrukce na 1 nebo 2 mikroinstrukce nebo jedna těžká na 4)
    Na Athlonu je to celkem jedno --- zpracuje vždy 3 za tik (jen nevybírat mikrokódované VectorPath instrukce)