Problem je, ze se nejak Intelu nedari nastavovat ceny techto novych zarizeni tak, aby se zacaly masivne kupovat. Je to drahe a nejak to v praxi neposkytuje tu anoncovanou akceleraci. Intel Phi, to byla naprosta katastrofa. Akcelerovalo to jen kod napsany zcela specifickym zpusobem a jeste se data musela vejit do lokalni RAM. Slibovana rekompilace libovolneho kodu ve Fortranu bebo C/C++ s minimalni akceleraci 4-10x se nejak nekonala. Obavam se, ze ted to bude podobne.
A navic, Stejne jako Phi, ani Xe zatim krome SW nastroju intelu (prekladace) nikdo moc nepodporuje.
Pro tu Phi postaci jakykoliv X86 prekladac (ktery umi low level optimalizace podle specifikace mikroarchitektury), vzdyt je to obyc Atom s AVX-512 :-) A prakticka pouzitenost je omezena pres to co vam (MIC) knihovna dovoli, stejne jako u nvidie jinak nez pres CUDA knihovnu k hw pristupovat nemuzete. U profi AMD akceleratoru, ktere maji i nvme flash nevim - predpokladam ze znova bude existovat knihovna.. co vam nabidne "klicovou dirku", ale vrata vam NIKDO neotevre dokoran, vse pro HPC je osefovano mrizema a ostnatym dratem :-) Nastesti to hipsteri, kterym se nelibi tohle praveke nastaveni IT meni - viz OpenComputeProject (FB/MS, mozna AWS) - s ocividnou snahou vytvorit levnejsi alternativy serveroveho zeleza.
U Xe a vsech jejich iGPU grafik byvalo omezeni, ze OpenCL bylo jen skrze placene nastroje - tak nevim zda uz je tento postoj presel, nebo si na to trvaj.. to to imho zabije jeste vic, protoze masy si nebudou kupovat sw tooly za nekolik tisic $, ale koupi si to mozna nejake vetsi instituce, co opravdu neco chtej pocitat. Ale ti si umi nekdy i spocitat, zda se jim to vyplati, ci nikoliv.. takze nelze z pohledu cloveka ktery bere ICT jen jako spotrebku soudit, zda Phi ci Xe-HP bude propadak.
Teprve az to dotahnou na predstaveni modelu Xe-HPG, muzete rict svuj nazor ohledne masoveho (ne)uspechu :)
OpenCL bohužel tak nějak skomírá. C++ AMP taky zapadlo (i na Windows, i když poslední MSVC ho konečně podporuje i na ARM64). Metal by byl fajn, kdyby nebyl jen pro Apple. GPGPU je zatím stále jeden velký chaos, co se API týče. Mnohdy je navíc efektivnější AVX-512, zejména oproti dedikovaným grafikám, kde se data musí kopírovat.