Myslíš, že zpětná kompatibilita dnešních nadupaných grafických karet s VGA standardem táhne jejich výkon dolů ?
Za druhé Itanium není zpětně kompatibilní s x86 a už vůbec není určené pro "normální lidi".
Nejvetší fór x86-64 je právě v tom, že má konečně důstojný počet registrů (něco jako 68000 v roce 1976 ;) ) a tomu přizpůsobenou vnitřní architekturu, ale přitom je to pořád normální CPU do normálních PCček na kterém můžete provozovat všechny stávající aplikace. A když náhodou někdo používá nějaký open OS, jako Linux nebo BSD, tak může mít během chvíle kompletní OS i veškeré aplikace v plně nativní 64bit formě :))))
nevim, jak u grafik, ale odriznuti zpetne kompatibility by aspon vyrobcum procesoru usetrilo spoustu vrasek, umoznilo lepsi optimalizaci kodu v procesoru, zmenseni plochy cipu. podivejte se, co dokazi powerpc procesory. myslim, ze inzenyri intelu nebo amd nejsou horsi, ale vlaci s sebou obrovskou kouli kompatibility az nekam do prvni poloviny 70. let minuleho stoleti!
mno takove Power3 na 375MHz (a to uz je pomalu dedecek) je v bezne 32bit aplikaci asi tak rychle, jako athlon na 700MHz. No a pokud je k dispozici kod, ktery umi vyuzit 64bit (treba SHA-512), tak je srovnatelne s P4 na 2.4 GHz, takze mi to neprijde zase tak spatne (rad bych si zmeril nove power4 na 1.4 GHz, ale obavam se hlubokych depresi).
Mozna se pletu (do 64-bit programovani se nijak nehrnu, takze jsem to az tak detailne nestudoval), ale mam dojem, ze implicitni velikost operandu je porad 32 bitu a pro 64-bitove vypocty je potreba predrazovat prefixy, coz se mi vubec nelibi (narust velikosti kodu, buhvi co to udela s rychlosti...)
No, je to trochu jinak. Strucne receno, sizeof(int) je 4, sizeof(int *) je 8 a sizeof(long int) je 8. Cili pointery jsou 64bitove, nicmene inty jsou primarne 32 bitove a 64bitove jen s prefixem. A pokud se zamyslite nad tim proc, tak je to prave kvuli rychlosti a velikosti kodu - 32bitovy int v naproste vetsine pripadu postaci, zatimco 64bitovy by zcela zbytecne zatezoval datovou cache.
teda ja nevim .. ja se o tydle veci moc nezajimam, ale co jsem slysel, tak to s temi 64bity od AMD az tak ruzove opravdu neni .. myslel sem ze jednou z hlavnich vyhod 64bitove architektury by mel byt SDILENY 64bit. adr. prostor .. navic pry zavadeji docela nechutne 4-urovnove strankovani, coz na rychlosti asi moc neprida (mam takovy pocit IA64 je na tom v techdle ohledech bohuzel podstatne lip). a fakt se mi nezda ze ma cenu snazit se udrzovat kompatibilitu se stredovekem, to bychom se nikam nedostali!
ale jak rikam, moc sem o to nezajimal, takze budu rad kdyz mne nekdo pouci pripadne opravi me mylne informace
Omlouvam jsem se, napsal jsem to trochu zavadejicne(to je tak, kdyz pisu prispevek v spechu pred odchodem do skoly:)). Primo nastavit flag v pagetable nejde. Ale jde to pomerne jednoduse obejit segmentaci nebo faktem, ze procesory maji dve oddelene TLB (jednu pro data,druhou pro instrukce). Kdyztak doporucuji k precteni napr. popis, jak byly tyto techniky implementovany v PaX.
Segmentace versus strankovani.
Ano, pri segmentaci lze spoustet pouze code segment.
Napr. windows delaji segmetaci tak, ze vytvori 3 segmenty code, data, stack od 0x0 do 0xffffffffffff(size of RAM :) a strankovani si zajistuji samy. Pak se samozrejme daji spustit instrukce(data) v datovem segmentu. Takze ochrana je uplne k nicemu.
Jasne, ze distribuci je vic. Jelikoz SuSE naportovalo vsechno podstatne - kernel, glibc, gcc, binutils, gdb, ... - a dalo to verejne k dispozici do oficialnich CVS stromu, tak pro ostatni neni problem postavit sve distribuce pro AMD64.
Ale precejenom hlavni vyvoj probiha v SuSE, uz proto, ze lidi ze SuSE si s tim procesorem mohli hrat nesrovnatelne delsi dobu nez lidi odjinud. Staci se podivat do changelogu uvedenych projektu - na jine adresy nez @suse.de a @suse.cz tam u AMD64-specific patchu prakticky nenarazite.
ad Mandrake: Neni pravda, SuSE byla vyrazne drive.
Pro me osobne, nazyvejte si me klidne blaznem, jsou procesory Intel mrtve (IA). Jediny duvod proc se tahle 30 let stara technologie pouziva je ekonomika a windoze :-)(.
Ja jsem propadl procesorum od IBM, Motoroly, Alphy a take PowerPC od vice vyrobcu.
Nejvice tem Alpham. Vykon a stabilita jsou zde nekde uplne jinde (o 30 let dale :-)). A kdyz si srovnate pomer cena vykon hadejte, ktery vam vyjde lepe :-)
Tak o tom nepochybuj... :-)
Kdy uz si konecne nekteri lide (nebudu sem psat oznaceni, ktere me napada... nic sprosteho ani tak) uvedomi, ze SuSE je naprostou spickou na poli Open-Source os (zamerne nerikam Linuxu, vyrazne predciva i BSD apod.) a vykaslou se na RedSrota apod., ktere ja osobne uz ani nepovazuju za Linux (je nepopiratelnym faktem, ze RedHat v mnoha testech byl predcen i windozama, je to vazne tak, tykalo se to prevazne dual cpu architektury.
Jeho kvality (SuSE Linuxu) muzu potvrdit i ze sve zkusenosti (rozsahla enterprise reseni, reseni pro vedecky vyzkum, obri databazove a vyhledavaci stroje-Angel, myslim, ze o nem SuSE ani nevi). Nejmenovana spolecnost se kterou externe spolupracuji (je jich vice v souc. dobe) jej testovala ruzne os hlavne co se tyce nasazeni v clusteru apod. a SuSE vysla jako jednoznacne nejlepsi, proto ji take pouziva. Vyborne take dopadla v testech bezpecnosti.
Boze lamers jsou uz aji na rootu schvalne se na shill podivejte :-(((((((((((((.
Myslim, ze neni treba dalsich slov fakta hovori jasne SuSE dokazala mnoho a je zbytecne dale o ni psat.
Prosim nerespektujte prispevky lidi jako je Sandokan je to jen obycejny flame obycejneho ubozaka s cilem poskodit nejen me...
Ano je mi ne 15, ale 16 ucastnil jsem se a ucastnim na ruznych projektech.
Nevim o tom, ze by SuSE neposkytovla vysledky sve prace (tedy samozrejme vyjma enterprise produktu, to nedela nikdo ani RedHat) komunite.
A myslim, ze s Mrkvosoftem se neda srovnavat v nicem, je proste lepsi.
Jak jsem rekl fakta mluvi za vse.......
Mno jen takova otazka: jsou nekde na netu vysledky thoo testovani distribuci? Testovali to se SMP kernelem od RH nebo ne? To co tu tvrdis je totiz imho velky nesmysl,preci jen se RH necim zivi a rozhodne to neni prodavanim softu pomalejsiho nez M$ WIN.Presne srovnani se SUSE nevim,kazdy pridava opravdu velkou radku patchu do Linusova kernelu at uz z ac rady nebo dalsi.Nehaz tady bludy a nebudou je ostatni hazet na tebe...
Egh, ja myslel, ze tzv. pocitacovi experti vi na co je google, ale no, tak nic no...
Komentar a odkaz primo na jeden test RH (samozrejme se smp kernelem) vs. Windows je na underground.cz , ale ten je ponekud starsiho data, ale u produktu, ktere se porad hojne pouzivaji (myslim RH 7.3 vs. NT 4.0, nebo podobne). Nejake testy jsou na sillicon.com a urcite jich mnoho najde i google, linux.org obsahuje neco o distribucich, tam by taky neco mohlo byt, ale jak rikam google, google, google, ...
For Sandokan: Ja narozdil od tebe LDP2 cetl a pochybuji, ze mas na jakemkoliv kompu jakykoliv Unix, teda pokud ti ho tam nenainstaloval nejaky kamarad. O Starhillu jsem si po "rozhovoru s jednou osobou od vas zacal myslet jeste horsi veci nez driv.
Zajimalo by me kolik je tobe, podle projevu bych te tipl, tak na 7 :-)
ad bludy: ty rozhodne nesirim, jen konecne trochu reality... vsak se podivej sam
RH je velmi komercni spolecnosti (ac se to nemusi na prvni pohled zdat), vetsina jeho klientu (kapitalove) aspon byla home.
SuSE dela reseni a produkty, ktere si vyvojari Rh nepredstavuji ani v tech nejhorsich ani nejlepsich snech, tyhle spolecnosti se opravdu zameruji prece jen kazda na neco trochu jineho.
Ad Google: znam,mozna se budes divit ale pouzivam neustale,ale preci jen jsem cekal nejaky konkretni odkaz.Tech testu muze byt nepocitane vcetne FUDs apod.Stejne ti muzu rict.ze si v google najdes ze jendine tahle sekta je ta spravna....a nevim proc me nazyvas tzv. pocitacovym expertem...
Ad RH: to jsem nepochopil,koukam,nema cenu se s tebou bavit o Suse,je to tva modla a RH je dirty evil asi...
Jeden muj ukol v praci byl cluster pro db a div se jede to na RH... nevim proc by pak RH delal ovladace i na karty,o kterych se ti ani nezdalo a jsou opravdu jen do enterprise reseni...
No nic dost uz,nema to cenu...
SuSE neni ma modla. Ja jsem analytik, takze kdyz neco pobezi lepe na windozech nez na cemkoliv jinem pouziju je (ac se mi to bude znacne pricit a pochybuju, ze neco takoveho kdy bude pravda).
Me se spis zda, ze je tu skupina lidi, kterych modlou je RH.
Dobre pominu to, ze neumis pouzivat google a pokud si najdu chvilku casu nejake testy vyhledam, jak jsem rekl podivej se na underground.cz tam najdes neco.
ad RH vs. SuSE: Dobre prestanme se hadat o kravinach za SuSE narozdil od RH mluvi vysledky viz. www.suse.com, podivej se do tiskovych zprav a pochopitelne i na odkazy v nich, myslim, ze se budes hodne divit.
Jak se to vezme - kernel je rozhodne potreba portovat, protoze se jedna o novou architekturu, ktera umi novy veci. Uz treba to, ze AMD64 ma vic registru, ktere je potreba ukladat do vsemoznych struktur. Navic jeho casti jsou napsane v assembleru a ten se pochopitelne musi prepsat.
Co se tyka glibc, tak tam je to podobne - prepisou se assemblerovske casti (tedy povetsinou rucne optimalizovane rutiny), doplni se headery, atd.
GDB musi porozumnet novemu formatu souboru (elf64 misto elf32), novemu formatu debugovacich informaci, ...
No a GCC, to je kapitola sama pro sebe ;-)
Samozrejme u user-level programu by v idealnim pripade zadne specialni portovani nemelo byt potreba.
Hadej proc 32bitove OS maji vetsinou omezenou velikost souboru na 2GB ? protoze programatori si rikali ze offset jako 32bit cislo staci. Takze napriklad 64bit offset je v tomto pripade rozhodne lepsi a prikladu by bylo vice. Rozhodne si myslim ze zpetna kompatibilita je cesta do pekel.
Hm, ty mas vsechna data jen v pameti a na disk je pises v ASCII, ze ti muze byt jedno, jak je "int" (nebo "long") velky?
Jinak ale je pri prechodu z 32bit na 64bit par pekne schovanych kulisaren (napriklad htonl - kolik ze bitu ma ten jeho "long"?) a jen trochu neporadneji napsane C si namlati hubu na tom, ze "assuming external returning int" nemuze vratit pointer, nebot ten je 64-bit.
Samotneho me prekvapilo, jak casto se v mem kodu objevuje implicitni predpoklad, ze long a int jsou zamenitelne typy. Osklivy nesvar z DOSu i z Windowsu, tezko se ho zbavuje. Treba %d a %ld v printfu mam tendenci plest porad...
: Nejedná se tedy o klasickou SMP architekturu, kde se
: mnoho procesorů pere o jeden memory controller a o
: jednu paměť
[...]
Jen upozornim, ze tohle u SMP nemusi byt pravda. SMP je o tom, ze pristup z kterehokoli CPU do kterekoli pameti je stejne rychly. Kdyz se podivate treba na AMD 760 MPX (abychom nechodili daleko), tak tenhle northbridge ma dva linky do pameti a dva samostatne linky k procesorum (vychazi to ze sbernice Digital EV6). Cili dva procesory v rezimu SMP a presto si prilis neprekazeji (na rozdil od podobnych reseni pro Intel).
NUMA se nedela proto, ze by to bylo buhvijak rychlejsi - rychlejsi je SMP. Ale NUMA je vyrazne skalovatelnejsi (protoze na ekvivalentni SMP vec byste potrebovali specializovany northbridge pro 2, 4, 8 atd procesoru, zatimco na NUMA staci umet udelat uzel procesor-pamet a tyhle veci umet rozumne pospojovat).
-Yenya
Kuk clanok:
SUMO
Bohužel má NUMA jeden problém - běžný operační systém, který byl až doposud zvyklý běhat na SMP systémech, by z ní nebyl příliš nadšen. Takže AMD přišlo s jakýmsi hybridem zvaným SUMO (Sufficiently uniform memory organization) - fyzická architektura je podobná jako NUMA, ale pro operační systém se tváří jako SMP. Vhodným nastavením v BIOSu lze určit, zda se systém má tvářit víc jako SMP, nebo víc jako NUMA. Pokud zvolíte druhou variantu a budete mít vhodný kernel se zapnutou NUMA optimalizací, můžete dosáhnout vyššího výkonu. Výhodou je, že i ne-NUMA kernel bude fungovat.
Nazdar Jardo!
To bys nebyl ty, aby ta poznámka nevzešla od tebe :-)
A jako taková mě těší. Aby taky ne, když NetBSD běhá i na herních konzolích a patří asi k nejportovanějšímu OSu hned po Linuxu.
Ale je to tak 14dní, co jsem si musel vyslechnout Petrovu poznámku, že: "Jestli ty jeho příspěvky do jádra NetBSD jsou stejně kvalitní, jako to ovládátko Draka, pak teda potěš koště..." ...prodávám, jak jsem koupil
...proč ne, když AMD vždycky mluví o spolupráci s Transmetou, ale proč potom stále AMD vyrábý procesory s největším výkonem (hlavně tepelným). Linus se prý nechal na přelomu roku slyšet, že všechny ostatní platformy nemají proti ia32 výkonově šanci... fajn... AMD navázala. Proč ne! Itaniu se už přezdívá Itanic a pařani, kterých je nejvíc, by svoje W98(ME,SE ...wokna chytly už druhý dech) na Itaniu nenabootovali, takže bude zase jedno levné železo, co na tom, že bootuje v 16ti bitovém modu přes spoustu udělátek.
Co se týká ostatních platforem, možná jste si všimli, že mají opačný indián. Tady mám problém s terminologií, protože v nějakém starém manuálu k TMS340 (procesor, na kterém byl postavený standard TIGA) se psalo, že používá "little endian", protože číslo v paměti končí na LSB, zatímco intel používá "big endian". V současné době zase slýchávám, že ia32 je "little endian" architektura. At je to jakkoliv, já mu raději říkám "intel indián" a ten je k lidem, kteří nejsou při programování v C moc "opatrní" mnohem ohleduplnější, než ten opačný indián. Provoláte-li např knihovní funkci, která očekává int32_t parametr s int16_t argumentem, u intel indiána se většinou zázračně trefíte, zatímco u opačného indiána dostanete v lepším případě EINVAL, v horším to "nějak blbne", SIGSEGV nebo SIGBUSí.
To, že AMD64 zůstal u intel indiána považuju za největší výhodu. Bohužel asi jedinou. V každém případě bude nejspíš komerčně úspěšný a v konečném důsledku pozdrží, nebo potopí Itanic :->
Jinak sada univerzálních registrů je fajn, ale nevíte někdo náhodou, jak to podporuje gcc při optimalizaci? ;-)
Nevíte taky někdo, jak je to s provozní teplotou takového "parostroje"? Nepočítám s tím, že by to "topilo" jako můj celer, který má ted (po 14ti dnech bez vypnutí) +37.5 C na CPU s pasivním chladičem (CPU je původní Coppermine 850MHz přetaktovaná na 950MHz a FSB má "zvednuté" na 120MHz) a +52.5 C ve zdroji s jediným větrákem, luftujícím celou bednu, přepojeným z původních 12V na 5V. Zatím všechny ostatní AMD K7 sestavy jsem z garsonky lifroval pryč hned po zásazích, které jsem na nich provedl, protože nemám přílišný hluk rád.
Myslím, že výkonový zisk oproti P4 nebude nijak závratný, zvláště zapnete li "hyper threading", takže Intel bude zase léta vylepšovat P4, místo aby derivoval něco jako Celeron z Itania2... ach JO!!! At s tím krámem táhnou k čertu!!!
Zas jeden chytrak, co mu AMD topi vic nez Intel? ;-) Maximalni spotreba u AMD CPUs je do 75W, top Opteron ma 80W, maximalka u P4 3GHz je ke 100W. Jake ze to CPU topi vic? A co takove Itanium? Hehe. Nejak si taky zapomel porovnat vykon toho svojeho frdlatka, s poradnym strojem od AMD, ;-) mno nic. Pokud mas problem postavit tichou, vykonnou sestavu s AMD CPU, problem hledej u sebe. Ses kus lamy...
Lam, které se neumí ani podepsat je na Netu dost a dost, takže dneska zase nepokecám s někým, kdo je schopen věcně argumentovat. Na druhou stranu jsem se dopustil drobných zjednodušení. Už tak jsem napsal moc písmen a kdybych měl všecko do detailu vysvětlit, bylo by to delší, než původní článek, který byl na můj vkus opravdu zjednodušující až příliš, takže doplním:
- jsem jeden z mála lidí, co používají počítač m.j. i na počítání (RT-simulace), takže moje zkušenosti nemůže aplikovat pařan, který má na počítač úplně jiné nároky. Zkusím to stručně nastínit. Problém je v FPU. Ta se dnes už skoro nevyvíjí, takže si Intel pořád zachovává svůj bývalý náskok. Bohužel FPU se nedá pro "opravdové" počítání nahradit žádným jiným "kusem železa" a gcc to ve výsledném kódu respektuje. Jako testovací nástroj používám FFT algoritmus (slovo benchmark šetřím pro opravdové lamy, co měří čísla a ne skutečné parametry ;-). FFT algoritmus totiž poskytne nejen představu o rychlosti, ale i o velikosti kumulovaných chyb během výpočtu. Platí totiž A=FFT(FFT(A)) kde A je vektor (jednorozměrné pole) komplexních čísel. Pokud za A dosadím pouze reálnou posloupnost, pak se mi po provedení FFT a /FFT v Im(A) (imaginární složka A) nakumulují chyby výpočetních operací. IEEE norma pro výpočty v plovoucí čárce totiž definuje nejen formáty zpracovávaných čísel, ale i metody zaokrouhlování, aby se statisticky potlačily právě tyto kumulované chyby. Když jsem tento test zkoušel překládat M$-C, které přímo hýří optimalizacemi pro K7, C překladač začal vytvářet kód používající 3DNow instrukce, které sice počítaly 2 až 3násobě rychleji, ale kumul. chyby vzrostly až 10E+8 krát!!!! Po čase se mi pak jeden jeden stavební statik svěřil s problémem, že přechodem na novější verzi AutoCADu jim některé moduly knihovny začaly dávat až 20-30%ní roptyl vypočtených hodnot. Takže asi nebudu jediný, kdo se s tímto problémem potkal.
- IA vychází v dávné historii z původní 8086, která nebyla navržena pro běh více úloh současně (několik specializovaných registrů místo pole GP registrů, časově náročné přerušení, ....), což je základní předpoklad pro RT (reálný čas). Navíc tato orientace u nás byla stanovena závěru sjezdu KSC (jeho číslo si nepamatuju) jako "jediná správná", takže odmítaní procesorů Intel mělo u naší generace věcný podklad a vyústila až ve známé Intel Outside. Toto ale bylo s odstupem času asi špatně pochopeno mladšími a ti to nesprávně vztáhli na napodobovatele Intelu. Zatímco Intel měl už 20let na "zazáplatování" svých chyb, jeho napodobovatelé tyto chyby, zdá se, ještě asi ani nezaznamenali. A pokud někdo přidá pole GP registrů, podobné jako měla moje oblíbená m68k, nebude to pro mě mít význam, dokud jej nezačne gcc podporovat.
- co se týká výkonu mého desktopu, Tak mohu z vlastní zkušenosti říct, že CPU se na něm moc nepodílí. Rozhodující je spíš velikost paměti, mám rád moc virtuálních desktopů a každý člen domácnosti má "svoji mozillu" trvale na některém z nich. Když k tomu připočtu několik rozepsaných dokumentů ve StarOffice a "všude zalepeno terminálama", v tomto případě se na výkonu podepíše jak moc se swapuje, než cokoliv jiného. Byl tady v diskusi odkaz ma Tom's HW s testy rychlosti Opteronu v jednotlivých oblastech. Zklamalo mě, že se zde nesrovnával i Linux desktop, protože na encodování filmů používám mencoder. Na popsaném stroji empiricky dosahuji časů jen o maličko lepších než K7 Athlon na 1.2GHz (viz. výkonnější FPU).
No a aby mě někdo nepodezíral, že přece jen někde v koutku stranním Intelu, uvedu seznam věcí, které jsou u intelu výrazně horší. Uvedu jen jednotlivosti, které mám otestované. Na současném stavu mi totiž právě vadí to, že se setkávám s názory týpků, kteří, snad aby je svět uznal za hackery, zobecnují nezobecnitelné:
- pokud někdo požaduje "opravdový" výpočetní výkon, pak se musí obrátit úplně jinam, než k wintel platformám. Jedem můj bývalý kolega, když ještě nebyl mým kolegou, dělal správce IRIXu na blíže nespecifikovaném Onyxu. Během týdne se ocitl na čelní pozici seti@home u nás, když na tomto 64xCPU kousku spustil klienta tohoto projektu ;-)
- Pokud děláte RT aplikace a zajímá vás rychlost, s jakou je CPU schopna přepínatúlohy, tak tady má navrch zase Ultra SPARC platforma. Pole GP registrů o velikosti nekolika 10-100kregistrů vás totiž nenutí odkládat pracovní registry na zásobník, ale stačí poposunout bázový ukazatel do pole registrů, takže výsledný EIRT "čas odezvy na vnější přerušení" vám prostě vyrazí dech ;-)
- jestli chcete pařit a pařit, pak jásejte! AMD jsem totiž nenazval CPU pro pařany náhodou. 3DNow je ve své cenové kategorii nejvýkonnější 3D akcelerace a "poněkud vyšší" tepelný výkon AMD K7 je ve srovnání s takovým GeForce-FX zcela zanedbatelný.
No a pokud někoho irituje název mého příspěvku, tak to není nic proti tomu, jak mě nadzvedl zmíněný Torvaldsův výrok, pronesený odněkud z jachty v karibiku a Linuse omlouvá jen pravděpodobně velmi uvolněná atmosféra, ve které se zrodil :-))) a konec konců jako jeden z "nejstarších" tučnáků u nás mám na svoje "stařecké vrtochy" i tak trochu nárok :-)))))))))))