je to mozno tym, ze architektura Power6 bola urcena na specialne pouzitie v procesoroch Cell a Xboxoch (neviem, ze by sa pouzila inde, ale ak ano, tak ma opravte) a out of order bol obetovany na vrub nizsej ceny s tym, ze bude k dispozicii vysoko optimalizujuci prekladac, ktory instrukcie nasklada presne tak, ako to bude najlepsie (ostatne pri existencii jedneho procesora by vytvorenie vysoko optimalizujuceho prekladaca nemal byt snad az tak velky problem).
Ona totiz implementace out-of-order skutecne stoji hodne. Myslim tim plochu na cipu, takze se nekdy vyplati tuto plochu (=urcity pocet tranzistoru, kdyz to zjednodusim) "obetovat" napriklad na L1 cache, vice registrovych oken nebo treba dalsi ALU, podle toho, k cemu se procesor vyuziva.
V idealnim svete by se mohlo resit hotspot-like technologii nebo rekompilaci zdrojaku pro dany procesor (protoze kvalitni kompilator by mel pripadne kolize resit, kdyz bude mit dost registru), ale my nezijeme v idealnim svete ze? ;-)