Neni to karta na hrani.. je to spis neco jako Xeon Phi v blede modrem (no dobra, Phi byla blede modra uz z vyroby), jen namisto x86 jsou tam RV jadra.. a zatim ziji v iluzi, ze jim ten DP vystup pomuze :)
Si vsimnete ze propaguji FP64 vykon (stejne jako Phi) - ktery jako jediny parametr je nad tim proti cemu to porovnavaji (consumer grafiky). Protoze pro FP64 by normalni clovek vytahl nejaky Quadro / Teslu.. ne RTX. Jestli je vyber konkurence zvolen tak, ze to sedi do jejich cenove politiky (karta ~ $1K, ne $10K jako profi reseni), si nemyslim.. ten zakladni/nejnizsi Bolt akcelerator odhaduji na $4K ~ $5K (a pojedou model: zaplatte nam, pak usetrite na spotrebe).
A pokud chceme realny priklad - tak o to same se pokouselo uz nekolik firem (postarsi Parallella se vymluvila na upsani jedineho vyvojare k US DoD), ale treba namatkou:
https://www.embedded.com/startup-packs-1000-risc-v-cores-into-ai-accelerator-chip/
(kde jsou ted?)
https://www.kalrayinc.com/products/kalray-processors#turbocard4
(ani nereknou kolik to ma jader)
https://www.anandtech.com/show/15177/preferred-networks-a-500-w-custom-pcie-card-using-3000-mm2-silicon
(kde to koupim? 500+ TFlop je hezkych)
A jeste jedna "GPU like many core HPC pcie karta" byla (videl jsem vyprodeje na eBay), ale taky se po tom slehla zem a nemuzu ji tedkom najit. To bylo nejvic real - a beztak to nikdo nechce.
Ten posledni bude Tenstorrent:
https://hothardware.com/news/tenstorrent-wormhole-developer-kits-workstations
Snazil jsem se o vycet ktery cilil na generic compute, ne pouze AI-specific (jakoze INT8 only)
Podle https://bolt.graphics/how-it-works/ to má LPDDR5X a sodimm jen jako rozšíření, takže propustnost pro úlohy které ji potřebují nemusí být tak hrozná. Slabší než u konkurenčních moderních GPU, ale ne o tolik jako kdyby tam byla jen DDR5.
Realisticky... ani nahodou, se podivej na ten spodni konektor co by mel byt PCIe :D tohle zadal nekdo do AI generatoru, aby to nakreslilo jakoze karticku. Coz je pouze o krok vedle, od doby, co ty echt inovativni firmy davali watermarkovane stock obrazky ukradene z fotobanky :D to se hned pozna zda je to real.. nebo podvod.
A s pametma souhlasim - mala kapacita, male pasmo. Takhle opravdu ne.
Bohuzel jim na to spousta investorskych hlupaku znova skoci :(
No, to já zase až tak úplně od oka nepoznám, jestli je na tom PCIe konektoru něco špatně. Ovšem divné (až moc skvělé) mi to přijde od samotného začátku, co na mě na YT vyskočilo to jejich video. A potom mi přijde úlet PCIe z obou hran desky, to vidím prvně v životě, což mi přijde taky podivné. Zase to nemůžu 100% posoudit, neživím se návrhem HW a třeba se takové roztodivnosti občas používají.
Takže jsem si hned zkraje po krátké rešerši řekl, že se uklidním a počkám, že se potvrdí, jestli je to real a až bude případně dostupný výrobek, který někdo otestuje. Jinak je to zatím jak slovenský procesor, jaký svět taky ještě neviděl. :)
Ten horni konektor je klasicky interconnect, jako jo - kdyz uz karta ma mit dva x16, tak to mohli resit jako Apple MPX ... ale osobne, jako lowcost bastlic, bych to taky dal nahore a vyuzil treba druhej identicky backplane. Pokud to tedy ma byt nejaky vetsi multi-card setup. Ale pak zas uz nedava smysl tam mit klasicke porty a hlavne ten power konektor otocenej jak je otocenej.
NVlink je p2p, sice tam je asi vice portu, ale typicky tim propojujete jen 2 gpu, mozna 4 by sli v AIC PCIe form factoru - pro 8 modulu uz se pouziva sxm radeji a myslim ze to uz pak nema prime spojeni kazdy s kazdym.
Tady ten vymysl ma dle PDF dva Gen5 x16 porty, takze s tim nemuzete jit rovnou mezi karty pasivne - spis tam bude PCIe switch jako backplane. Viz ty expansion kastle, kde je deska velka jako celej rack do sirky, neco jako tohle:
https://www.singleboardsystems.com/backplanes/bpg8032/
a druhou podobnou se ta sada karet prikryje :)
Pak fakt nezustava prostor na nejaky extra napajeni jinde, nez na kratsi strane AIC desky.
Ještě si dovedu představit napájení jako součást backplane. Pak se taková karta dá použít samostatně, nebo jich můžu nasázet víc, propojit je oběma konektorama do interconnect backplane a neřešit bordelu v kabelech ke každé kartě zvlášť. Ale jako, ta karta vypadá too good to be true, jsem zvědavá co z toho bude / nebude. Zatím jsem spíš zvědavá na Intel Arc B770, to by mohlo dopadnout jako zajimavá Compute budget karta.
Ale ano. Když AMD začalo poprvé zatápět Intelu v době, kdy přišel s ne moc vydařenou architekturou NetBurst (Pentium 4), mělo za sebou nějaké dvě dekády existence a zkušeností. O pozdější a dnešní době ani nemluvím. Prostě v tu chvíli nespadlo z nebe, už tu bylo hodně dlouho a mělo na čem stavět.
Samozřejmě nelze 100% říct, že onen Bolt nebude úspěšný, ale zatím je spíš na místě na něj pohlížet jako vějičku na chtivé investory - dokud nebude mít svá tvrzení čím hmatatelně podložit.
Vyšší FP64 mají kdejaké karty i takový Radeon VI z r 2019, který má paměťovou propustnost o nějaké procento vyšší než RTX 4090.
Proto v případech kdy byl potřeba náhodný přístup do VRAM při určitých GPU výpočtech 2*Radeon VII měl podrobný výkon jako RTX 4090 při podobné celkové spotřebě ale dost podstatě nižších pořizovacích nákladech.
Jmenované RTX pro hry jsou dobré, ale srovnávat s profesionálním sektorem který má jiné požadavky není vhodné.
Jo, tohle mě přesně taky napadlo, že to k tomu dávají herní karty jako referenci, aby to líp vypadalo na grafech :)
Přičemž asi všichni ví, že jak NVIDIA, tak AMD to tvrdě segmentují a v podstatě někdy od roku 2020 dál je HBM a FP64 vyhrazeno pro ty nejvyšší a nejdražší server modely. I Quadra a levnější Tesly (A40, L40) jsou mimo hru a drží se 1/32 výkonu pro FP64. U AMD je to zas jen doménou těch Instinct MI modelů.
Ano byla tam jedna bílá vrána :) Titan V s Voltou a 12GB HBM v roce 2017, který byl na 1/2 ve FP64, ale už nikdy později podobnou "chybu" neudělali :)
Další věc je, že v té prezentaci Boltu všude zmiňují raytracing a rendering jako téměř primární use case. Víceméně všechny současné enginy a fyzikální renderery, co jsem viděl, mají tu pipeline primárně v single precision, právě i kvůli paměťové náročnosti, využití herních karet a je to rozumné. Některé pak umí jít i na půlku s half floaty. Totéž pak pro nějaký image processing, barevné korekce (Resolve atp.) je to úplně dostačující.
Samozřejmě pokud budou schopni dodat FP64 výkon NVIDIA datacenter karet nebo Instinctů MI za výrazně míň, tak to pro relativně úzký okruh uživatelů zajímavé být může (byť je tam samozřejmě otázka a náklady s dalším API pro každého, kdo by to případně adoptoval). Ale jsem taky skeptik a spíš si myslím, že to je teď tak trochu z říše snů.
Nic neexistuje, nikdo nic nemuze vyzkouset ale MA BYT - takze az bude hotova, lidi to budou moct realne vyzkouset, muzeme se bavit ;-) - do to doby je to mene vypovidajici nez rumor na nove fotaky, ktere si lidi preji a predpovidaji co bude, popr. neco unikne - nekdy se stava, ze lidi diskutuji jak moc by neco chteli - a firma si rekne OK, tak jim to dame