Vlákno názorů k článku Nastal čas nahradit uzavřené děravé procesory otevřenou alternativou? od Petr M - Tak rozhodně v článku zazněla jedna podstatná věc...

Článek je starý, nové názory již nelze přidávat.

8. 1. 2018 10:15

Petr M (neregistrovaný)

Tak rozhodně v článku zazněla jedna podstatná věc - je čas zabít platformu x86. To je naprosto bez diskusí.
Průšvihů je tam plno, nejemenší problém je nedostatek registrů (4 na jádro), emulací CISCu na RISCu pomocí zabugovanýho mikrokódu,... Ono už jenom používání segmentů na 286 byla učebnicová prasárna.

No a dneska je všechno podřízeno výkonu. Proč? Protože pitomý řádek kódu v Javě, C#, JavaScriptu,... se spustí interpret, emulující fyzicky nerealizovatelný stroj na x86. Jenomže ten výsledný stroják na x86 nevykonává jádro x86, ale interpreter na kdoví čem... Za sebe bych viděl řešení pomocí několika (až desítek/stovek) RISCových jader s vlastní L1 cache. Hlavně jednoduchý (= líp testovatelný, rychlý) s otevřeným managementem. Jde tam líp škálovat výkon, přiřadit aplikaci jádro v reálným čase, řídit spotřebu,... A dělit to jeden sandbox na fyzický jádro a je jistota, že nic nezdrhne přes cache. Pokud si s tím lepič knihoven nebo pánové z Mozilly nevystačí, smůla.

Otázka je, jestli má být jádro open source. Já si to nemyslím. Pod BSD licencí by to bylo peklo, tam to bude jako closed source - o to horší, že dneska je jasná hranice mezi MIPSem, ARMem, x86, ... Pokud se prosadí taková platforma X pod BSD, tak bude najednou hromada jader X-AMD až X-Zilog, který budou mít společnýho předka a specifikaci, ale jiný erraty, jiný bugy a jiný průšvihy. Aniž by někdo odhalil, co tam je blbě. Z tohohle pohledu je lepší to, co má ARM - licencuje jádra, platí z toho vývoj a hlídá si smluvně kompatibilitu. Přitom na stejný jádro nezávisle musí mrknout všichni, kdo si to jádro koupí a cpou do vlastních brouků.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 11:07

j (neregistrovaný)

To uz tady bylo ... a ani Intelu se to nepovedlo prosadit. Jednoduse proto, ze si nikdo nekoupi CPU na kterym mu nic nebude fungovat, pripadne bude, se SW emulaci o 3 rady pomalejsi.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 11:15

mhi (neregistrovaný)

Binarni translace nemusi byt zdaleka tak pomala jak se zda. Delal jsem hloupy translator x86-ARM a kod bez optimalizaci (a s hloupym prekladem) byl zhruba 3-4x vetsi, coz neni ani radove zpomaleni. Navic jednoduchym optimalizatorem resicim preskupovani/vyhazovani/prepis instrukci metodou "obarvovani registru" to slo srazit s prehledem na kod jen 2* vetsi.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 11:41

j (neregistrovaný)

Sak pisu ze uz to tady bylo ... myslis ze v Intelu se nesnazili aby to fungovalo? Dokonce presvedcili M$ aby jim na to widle udelal nativni. Jenze vsichni na tom chteli provozovat ty x86 aplikace, ktery sice bezely, ale naprosto tragicky, a to navic s bonusem, ze Itanium byla platforma pekelne draha.

Pak prislo AMD se svym amd-64 ... a Itanium chciplo definitivne.

Pokud bys chtel nahradit x86, musel bys udelat chip, kterej bude zaroven x86 a zaroven bude zvladat novou architekturu. Tohle bys musel udrzovat HW nejmin 10 let, a pak nejmin dalsich 10 let bys musel udrzovat SW emulaci.

Pricem mezi tim bys asi musel jeste nalejt nehoraznej ranec penez vsem vetsim vyvojarum, aby svoje core aplikace prepsali na novou architekturu - protoze jinam to proste delat nebudou. A na to proste nema silu ani Intel, natoz kdokoli jinej.

Jedina dalsi moznost je takova, ze prijdes s architekturou, ktera bude aspon o rad vykonejsi a zaroven nebude drazsi.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 12:37

mhi (neregistrovaný)

Itanium melo myslim trosku jine problemy, nez zpetnou kompatibilitu. Spousta lidi by to pouzila i kdyby byly na nej prelozene jen MS produkty (SQL server, ASP.NET, apod.). Rekl bych, ze tam nebyla ta spravna pridana hodnota. Ona tam mozna nebyla skoro zadna.

Srovnal bych to s ARMem, to je architektura, ktera pridanou hodnotu ma a verim tomu, ze kdyby byly opravdu otevrene a nativni Win pro ARM (s odpovidajicimi vyhodami - spotreba, optimalizace na rychlost), tak se problem aplikaci vyresi sam.

Ja treba pouzivam hned 2 ARM desky misto stolniho pocitace (jako takovou soft nahradu pro nenarocne veci) a jsem s nimi naprosto spokojen. Rikam jim nevzdelani delnici, trva jim to dlouho, ale delaji spolehlive, muzou delat i pres noc, atd.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 11:47

Sten (neregistrovaný)

Na překlad ARM › x86 existuje od Intelu libhoudini a výkon je srovnatelný s během na stejně výkonném ARM
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 12:33

mhi (neregistrovaný)

Ono tezko srovnavat "stejne vykonny ARM". Podle me podobne procesory (ale jake to jsou????) ARM jsou tak na 3/4 vykonu Intelu. V mem pripade jsem vzal napr. dva podobne lowcost tablety, ovem ten ARM ma obrovkou vyhodu, ze vydrzi asi 3* tolik co ten Intel :-). V potaz se ale musi vzit, ze jeden je W8,druhy Android.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 14:50

Sten (neregistrovaný)

Tohle byl Asus Zenfone vs. Nexus v době, kdy Asus ještě používal Intel. Výdrž měly oba podobnou (než dostal Nexus aktualizaci na Android 6). Výkon srovnatelný, ať už to překládalo ARM nebo běželo nativní aplikaci, a to šlo o aplikaci hojně využívající SIMD (samozřejmě překlad byl trochu pomalejší, bylo to vidět na statistice latence, ale subjektivně jsem to nerozeznal). Byly tam nějaké problémy se stabilitou, ale to se týkalo hlavně získávání backtrace při pádu aplikace,libhoudini nemělo reimplementované _Unwind_Backtrace pro intelovský stack.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 14:54

Petr M (neregistrovaný)

x86 je potvora, kterou dneska už úsporně neuděláš. Těch hradel na zpracování mikrokódu, zkratky v pipeliningu, pomocný registry a další bordel je prostě moc. Žerou, zabírají místo a nedají se odstavit.

Na flek jednoho x86 klidně narveš čtyři jiný jádra. No a když si připomeneme, že nejslabší místo z pohledu výkonu je v dnešní době RAMka a z pohedu zabezpečení sdílený uložení dat (od temp registrů CPU přes cache po systémovou RAM), tak má smysl udělat několik malých RISCových nodů se zlomkem výkonu, vlastní cache a vlastním, fyzicky odděleným kusem RAMky. Ušetří se čekání při cache miss, ušetří se čištění cache při přepnutí kontextu, ušetří se režie při virtualizaci (protože virtuály jsou vlastně fyzický nezávislý stroje), ušetří se energie (pro nepotřebný jádro hodíš clock nebo přeladíš PLLko),...

Prostě něco ve stylu ARMovýho APU od AMD s trochu jiným řízením a sdílením pamětí.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 16:45

Paeris Kiran (neregistrovaný)

DDR4 má 1,35V

Ale upřímně - na intel prakticky nemá vliv co tam člověk dá za RAM ani na jaké frekvenci jí honí.

U AMD je situace jiná... procesory podle ramky tam taktují infinity fabrik a komunikaci mezi CCX.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 22:07

Petr M (neregistrovaný)

Jo, jenomže právě tohle je ta hrouda hnědé, mazlavé a zapáchající hmoty, co jim právě teče ze střechy po zdi. Zhurba půl čipu je totiž cache a zatímco konkurence ji poctivě maže když je potřeba, Intel na to tak trochu hází bobek.

Je to jako dvě implementace free() v C, kde jedna označí blok jako volný a druhá ho navíc přepíše nulama...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2018 11:18

Karel (neregistrovaný)

To ano, ale jak začne Intel také "přepisovat nulama", tak je hnedka oheň na střeše, jak se tím CPU spomaluje a že klesá rank v benchmarku atd. Zkrátka si lidé a firmy zvykli využívat toho, že Intel trochu podvádí a dosahuje lepších výsledků na úkor bezpečnosti. Že je ta cena příliš vysoká se zjistilo až po dvaceti letech.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 11:16

Paeris Kiran (neregistrovaný)

I ty nejlepší ARM procesory se stěží vyrovnají výkonem dvě generace starým x86/AMD64 procesorům...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 12:49

uživatel si nezvolil přezdívku

Otazka je kterym procesorum a v jake metrice se to porovnava.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 15:03

Petr M (neregistrovaný)

Nesouhlasím. Dneska u obou jader narazíš s výkonem na RAMku. Je to už vlastně spíš otázka predikce skoků a velikosti/řízení cache, než samotnýho jádra. Prostě to nabíjení/vybíjení kondíků v RAMce rychlejší neuděláš. Řeší se to přidáním bitů a jejich multiplexem, dual channel RAM,... A snižováním napětí, šlo to postupně z 5V na 3,3V (SDR), 2,5V (DDR1), 1,8V (MDDR1, DDR2), 1,5V (MDDR2, DDR3),...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 15:50

Sten (neregistrovaný)

Co konkrétně porovnáváš? Ve výkonu vysoce paralelizovaných úloh porazí 96jádrový Starling ARM jakoukoliv kombinaci Intelu nebo AMD, kterou jde nacpat do 1U, a to za zlomek spotřeby.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 16:18

Paeris Kiran (neregistrovaný)

upřímně - takový výpočet je snažší udělat na grafice....
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2018 0:09

Sten (neregistrovaný)

Ne všechno se dá napasovat na CUDA. Třeba nginx na CUDA rozběhnete těžko, ale 96 jader při dostatečném počtu spojení klidně vytíží.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 15:51

unicode (neregistrovaný)

Co je to zase za nesmysl 4 registry na jádro?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 22:16

Petr M (neregistrovaný)

EAX, EBX, ECX, EDX.

Pak jsou tam už jenom speciály, který normálně v programu nemůžeš moc zneužívat. ESP, EBP, ESI, EBI. Ty pro práci s daty nepočítám.

(Platí pro 32b architekturu, na 64b jsem v ASM ještě nic nemusel psát, takže tam jsem to nestudoval)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 22:38

Martin Dráb

ESI a EDI lze také poměrně dobře používat pro obecné účely, jen je třeba dodržovat pár konvencí. Ale rozhodně tam nejsou takové restrikce jako na ESP/EBP.

Na 64b je registrů celkem 16 (přibývá r8-r15).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
9. 1. 2018 0:26

unicode (neregistrovaný)

EDI/ESI/EBP jsou stejně použitelné registry jako EAX/EBX/ECX/EDX. Jediný speciální je ESP a pokud chci frame-pointer tak i ten EBP.

A vůbec proč se bavíme o 32 bitech, když moderní OS jedou na 64? 32-bit x86 architektura je minulost. x86_64 je na tom mnohem líp.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2018 23:50

atarist (neregistrovaný)

Taky nemam x86 rad, uz od dob 80286, kdy IMHO uz tak divnou architekturu jeste vic dodrbali, jenze ta architektura ma dneska prakticky nejvykonnejsi dostupne cipy:

https://en.wikipedia.org/wiki/TOP500#Top_10_ranking
https://en.wikipedia.org/wiki/TOP500#/media/File:Processor_families_in_TOP500_supercomputers.svg (ten obrazek je neskutecne hnusnej s tema vzorkama vyplni)

"Za sebe bych viděl řešení pomocí několika (až desítek/stovek) RISCových jader s vlastní L1 cache."
Tomu je blizko RISC-V nebo starej dobrej MIPS

U ARMu jako jaker asi problem neni, jenze u vetsiny SoC je tam porad ten binarni blob, ktery nikdo neuvolni, protoze patenty a kody tretich stran :( Coz sice souvisi s HW jen castecne, ale otevrena architektura to neni.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Nastal čas nahradit uzavřené děravé procesory otevřenou alternativou? od Petr M - Tak rozhodně v článku zazněla jedna podstatná věc...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Malware, ransomware a další online hrozby: Jak se liší?

Hledala dokonalý šálek, našla životní vášeň a učí pít kakao

Windows budou důkladněji chráněny před AI agenty

Pálení žáhy zhoršuje nevhodná večeře. Vadí přejídání i kafe

Bitcoinová burza omylem rozdala 40 miliard dolarů

Máte plné zuby AI? Firefox má řešení

AI odhadne vaši osobnost z fotky a dokonce předpoví váš plat

Z evropského koláče chytrých telefonů ukusují Apple a Honor

Je tu první vydání magazínu CIOtrends v tomto roce

Nový model OpenAI kóduje 15krát rychleji než jeho předchůdce

Petr Šmíd: Když startupy rostou, české fondy je opouštějí

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

Začínající podnikatel: Základní termíny a marketing

Apple opravil bezpečnostní chybu, která byla v iOS od verze 1.0

Zahrávají si ČEZ či E.ON s čínským ohněm?

Připravit, pozor, teď! Spouštíme Channeltrends Awards 2025

OSVČ senioři letos v přehledech uplatní slevu na pojistném

Ve firmách se pořád věří jediné „pravdě“ z dat. A to je problém

Daňové přiznání 2026: Termíny, novinky a změny

Domén s koncovkou .CZ přibývá, většina je podepsaných