Upřímně? Sundej růžové brýle. Realita je taková, že M1 je upřímně pro zázrak, že něco takového vzniklo.
A docela dost to nakopalo k přehodnocení Intel i AMD. (ikdyž je fakt, že na tom dělali zaměstnanci obou firem, spíš více od AMD, který má blíže k ARM)
Intel i to co popisuješ.. dá do kapsy v klidu Ryzen a to ve stejné cenové relaci.
Intel prostě zaspal a tím to hasne a vadne..
12. 1. 2021, 16:25 editováno autorem komentáře
válcuje v čem? nebo jak? uveď konkrétní výkonnou aplikaci kde M1 převálcuje x86 family CPU...?
M1 je SoC s miliardou coprocessorů HW akcelerace. Je jasné, že zpracování fotek bude probíhat rychleji na čipu, který má HW akceleraci (DSP coprocessor) než hrubou silou na general purpous core z x86 family... jenže procesory z x86 family mají v absoilutní většině případů (pokud se bavíme o profesionálním stroji) PCI-E připojenou a výkonnou GPU. GPU je v x86 systemech coprocessor. takže otázka je, proč porovnávat výkon 'CPU' tam, kde se v jednom případě nejedná o 'CPU' ale o celé 'PC' ... pokud do zpracování obrázků na x86 zapojíme do systému připojenou GPU, M1 je prachsprostý nic...
pokud tedy chceš porovnávat CPU, tak porovnávat na takovém loadu, který je pro CPU určený a nevybírat load, který je jasné, že SoC zvládne lépe a efektivněji, když má HW akceleraci. mít na mysli, že CPU je jenom malá část z celého M1 čipu... pokud se budeme bavit o brutal force výkonu CPU jádra, nemá Apple M1 žádnou šanci proti x86 family CPU.
podle mě Apple M1 válcuje v rychlosti uživatelského prostředí a to částečně taky proto, že to je napojeno na velice rychlou DRAM paměť - 4266 lpddr4x. a například geekbench, který applí srdcaři rádi používají jako argument k tomu, jak úchvatně výkonný apple M1 je, je závislý především na rychlosti pamětí.
kopfik> Lidi zajímají jejich konkrétní use-casy a ne, jestli to běží na hrubém výkonu CPU nebo na interních nebo externích koprocesorech. A většina x86 počítačů rozhodně nemá dedikovanou GPU (notebooků se prodává více než desktopů a většina nemá dGPU; kancelářské desktopy taky ne). Geekbench testy jsi moh kritizovat jen v prvních týdnech. Teď už má Mac s M1 milióny lidí a je mezi nimi i spousta profesionálů - a mnozí se pochlubili, jak je rychlé jejich konkrétní workflow ve srovnání s jinými počítači (obvykle předchozí Intel Mac - často ale i pasivní M1 Air vs MB 16" Pro).
I v tom “hrubém výkonu CPU” M1 vede, prohraje jen v MT úlohách, když má soupeř hafo jader (16...). To ale stejně notebooky nemívají. Výsledky GeekBenche jsou už dostatečně známé, mě příjemně překvapilo, že celé LLVM přeloží rychleji než intelí 15” MacBook Pro (i9). Jinak tu rychlost asi nevyužiju, stejně jako u iPadu Pro, mnohem důležitější je výdrž baterie.
Zatim veskere informace a mereni ukazuji, ze M1 je propadak v absolutnim vykonu, a pro tvurce videa nema valnej vyznam - PC je cca 2-4x rychlejsi, pro nektere narocnejsi filtry i 10x.
M1 mozna vitezi v discipline "efektivite na watt", ale to uplne neskaluje do oblasti realnych zarizeni, kde se pozaduji i nejake svaly a hruba sila, nejenom rychle klickovani.
Apple se snazi vzdy primet lidi, aby ty veci pouzivali jinak - takze jim to pro svuj omezenej market share prochazi. Pro vsechny ostatni veci, ktere nejsou tak ohebne - protoze vyzaduji realny vykon, jakykoliv Apple vhodny neni.
Porovnáváme-li M1 a PC notebooky, tak rozhodně nemá PC 2-4x větší výkon. Ne pokud nemá mít taky 1,5x-2x větší cenovku. A pokud nám nevadí, že je to velká těžká krabice, která funguje jen na adaptér (na baterku spadne na zlomek výkonu). Porovnávat s workstation notebooky (s desktopovými CPU a GPU) a desktopy má smysl, až Apple nahradí i vyšší modely Maců (Mini není skutečný desktop; v omezené míře - v CPU oblasti - byl předtím s Intelem, ale GPU byla prakticky jen kancelářské zobrazovadlo). Neboj, nebudem dlouho čekat.
Ani ohledně hrubého výkonu M1 není žádné ořezávátko. Např. v softwarovém (bez pomoci koprocesorů) dekódování AV1 videa si dává i9-9980H:
https://twitter.com/videolan/status/1329403827309715456?s=21
Taky si myslím, že tu někteří nepochopili princip podpůrných obvodů (koprocesorů). To není tak, že nějaký výrobce něco HW optimalizuje a řekne, že to takhle maj lidi používat. Naopak: Lidi něco na počítačích dělají a výrobci HW přicházejí s optimalizujícími obvody. (Samozřejmě přichází ke slovu cena obvodů vs kolik % lidí vč. profesionálů to využije - pokud si v dolních 80-90 %, a nekupuješ počítač na 10 let, tak jsi v pohodě.)
Tak jest, ten komentář byl ultrablábol. Zrovna video enkóduje čip T2 (tady je v SoC), který mají i novější Macy s Intelem, ten by se mohl porovnávat s QuickSyncem od Intelu. Hrubý výkon CPU M1 je zhruba na úrovni i9 v 16” MacBooku Pro, to není vůbec špatné na “low-end”. Nevýhoda je spíše současné maximum 16 GB RAM, pro někoho případně počet externích monitorů. GPU dá bratru 2,6 TFLOPS (FP32), to taky ujde. Kdo potřebuje větší výkon, laptop stejně nesežene.
A tech 2.6 TFlop je ehm, jako ze vrchol sveta a nikdo na vice nesmi pomyslet?
(coz je pochopitelne, ze Applisti takto normalne premyslej - omezeni pres ktere nejde vlak jiz davno maji ve sve iDNA)
Nejhorsi stara Nvidia 2060 mobile ~ 5.184 Tflop (FP32)
Nejhorsi nova Nvidia - 3060L ~ 10 az 13 TFlop (FP32)
Nejlepsi 2080 mobile - 9.4 Tflop, resp. 3080L je 18.98 TFlop.
To jsme pri stejne kategorii (notebook) vykonove opravdu 2x-4x lepe v PC lowendu, a 4x-7x lepe na PC mobilnim highendu). Ano, bude to topit, bude to hucet. Ale bude to jenom jeden stroj (pokud by jste chteli nahodou konkurovat tomu PC skrze cluster z M1 laptopu), ale hlavne - rozhodne to nebude 4x-8x drazsi nez ten M1 kram, takze PC notebook v rozumnejsi discipline - TFlop/$ - porad bude vest.
Je to vrchol světa *lowendu*. Na highend si ještě chvilku musíš počkat. A nejde o stejnou kategorii - ten tvůj notebook s NV 20xx shodí výkon na třetinu, jakmile odpojíš adaptér. Pokud nám jde o mobilní výkon, tak nás zajímá výkon při běhu na baterii. Na stole píchnu notebook k eGPU, a ta položí všechno, co je ve workstation notebookách (protože je to zmenšený PC case s desktopovým chlazením). Nadále tak máme jeden stroj: notebook a "dokovačka" (jediný kabel přenáší vše - eGPU, zvuk, LAN, USB porty).
Perlička na závěr: Tflops na NV 30xx řadě poděl dvěma. Druhá sada FP32 jednotek sdílí data paths s INT jednotkama. Funguje tedy jen pro FP-only programy (reálně každý používá aspoň nějakou INT instrukci). Je cílené jen jako hrubé řešení na zdvojnásobení výkonu RT (protože denoising je FP-only a náročná operace pro RT). Tedy pokud nepočítám hezké číslo v marketingových materiálech, na který se chytí jednodušší lidi.
Na M1 nefunguje eGPU. Je to limit použitého upraveného SoC z iPadu. Proto šel jen do lowendu. Pro highend se připravuje SoC bez těchto omezení (podobně 16 GB RAM je též limit z iPad SoC). Samozřejmě příští refresh lowend Maců už tento přechodný problém mít nebude.
Doplnění k eGPU dokovací stanici: přenáší se tam i napájení notebooku (bráchova dává 100 W).
Limit 16GB neni z duvodu navrhu - protoze kdyz uz to predelavali, mohli to napravit. A to s eGPU je dobra vymluva.. kdyby chteli - tak to tam budou mit.. ale oni nechcou. Chcou tu M1 poslat co nejdrive do duchodu, a aby na tom lidi nic poradneho nedelali, a tohle je takova vec, ktera se o to muze hezky postarat.
Tento limit pochazi z fyzickeho form factoru, kdy jsou dva LPDDR4 cipy osazene primo na substrat pouzdra CPU. Tj. vlastne za to muze nedostupnost vetsich pameti.
Zcela identicky problem je proc grafiky s HBM meli donedavna tak nizke kapacity VRAM - protoze ty pameti holt vetsi nebyli, a zvysovat jejich pocet si muzete dovolit leda na vetsich/drazsich modelech.
Takze pokud nejaka budouci M2 neprejde na jinej koncept, muzeme cekat leda zdvojnasobeni sirky pameti (128b -> 256bit) a tim pak pouziti 4 pouzder, coz pri soucasne kapacite by bylo porad jenom 32GB. S ocekavanim nejakeho vyvoje v oblasti pameti pak rekneme 64GB max. A to staci Antone Pavlovici?
To ví jen Apple, jestli nestačí jen dodělat podporu v OS. Možná jo, možná ne. Refreshe Maců vycházej každý rok, tak není problém chvíli počkat na novější SoC s oficiální podporou. Stejně se to hodí, pokud nechcete zažít dětské bolístky z přechodu na jinou CPU architekturu (než se většina aplikací přeportuje).
Mimochodem tady někdo zkouší eGPU na Rhapsbery Pi (není jisté, jestli se podaří obejít, že SoC nepodporuje jeden z potřebných protokolů pro vyvedenou PCIe sběrnici): https://youtu.be/ikpgZu6kLKE
> Limit 16GB neni z duvodu navrhu - protoze kdyz uz to predelavali, mohli to napravit.
SoC (i normální CPU) se skládá z mnoha částí. Aby stihli vydávat nové modely každý rok, tak se pro tento zaměřili na CPU a iGPU. I/O zůstalo víceméně původní (proto eGPU, proto 16 GB). Podobně např. AMD taky nemůže předělat každý rok všechny části CPU (proto zatím nepodpora Thunderboltu, a tedy i eGPU - očekává se, že to předělají v rámci implementace USB4). O Intelu ani nemluvím.
Ohledně HBM, pokud vím, tak tam to bylo naopak. Pro požadovanou propustnost, když vzali nejmenší čipy, tak to dalo výslednou kapacitu RAM (na svou dobu zbytečně velikou a kartu to prodražovalo, ale např. lidem pracujícím s videem se to hodilo).
Omezenej BAR byl donedávna i na PC (přesněji na Windows, v Linuxu už 4-5 let ne). A omezení známá z ARM Cortex neplatí pro Apple Silicon, protože ten je uvnitř kompletně jiný a společná je jen instrukční sada (podobně jako jsou za instrukční sadou kompletně rozdílné procesory Intel a AMD).