Názory k článku
Intel představil AVX10 jako lepší AVX512 i pro E-jádra

Zasílat nově přidané názory e-mailem

Článek je starý, nové názory již nelze přidávat.

28. 7. 2023 17:09

Sinuhet

Slušelo by dát odkaz na článek od pana Olšana, když už jste ve stejné skupině :-)
https://www.cnews.cz/clanky/intel-avx10-reseni-problemu-se-simd-na-malych-jadrech-ale-mozna-take-umiracek-avx-512/
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 19:21

cc

Ten článkek ale napsal někdo, kdo tomu očividně moc nerozumí. Např. hned v začátku tvrdí, že SSE má jen 8 registrů, v 64-bit režimu má ale 16, stejně jako AVX.

Na konci článku zase filozofuje nad tím, jestli AMD bude AVX10 podporovat, což je další nepochopení, protože AMD už podporuje AVX-512, takže implicitně nebude mít problém s AVX10, protože nově tyto instrukce teď mají požadavek AVX-512 nebo AVX10 - takže software si jen přes CPUID zjístí, co bude potřebovat.
28. 7. 2023, 19:23 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 19:30

Sinuhet

Nebylo by lepsi komentovat to pod tim clankem?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 20:53

cc

A když tu je odkaz na Phoronix, tak jdeš komentovat na Phoronix?
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 21:12

Sinuhet

Rozhodně by mi přišlo lepší kritizovat článek pod článkem, než u nějakého odkazu k němu. Zvlášť pokud bych se chtěl navážet do autora. Ale já u Phoronixu nemám účet, a kvůli komentáři si ho vytvářet nebudu. Navíc je tam změna jazyka.

Vy účet na Cnews nejspíš máte, protože je spárovaný s rootem. Komentovat a kritizovat autora na místě, kde na to autor může reagovat, je tedy otázka asi dvou kliků.
28. 7. 2023, 21:15 editováno autorem komentáře
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 21:22

cc

Sorry, já čtu root a chci komentovat na rootu, nechci chodit jinde.

Ten článek jsem proletěl, protože tu byl odkaz, a zhodnotil. To je všechno, nemám ambice poučovat autora toho článku, protože článků takové kvality jsou stovky a nechci se tím zabývat.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 19:12

cc

AVX10 je AVX-512 s max. 256-bit registry. Lepší to není, spíš znouzectnost a absolutní fail dohnat AMD, které má teď AVX-512 v celé produktové řadě.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 19:20

David Ježek

To je právě to slovíčkaření. Je jasné, že v principu je to omezenější implementace umožňující nahodit "AVX-512" i na E-jádrech. Jeden v tom klidně může vidět 1. fail a 2. snahu dohnat AMD (to první neberu, to druhé je pravda). Ale jiný v tom může vidět logickou cestu, jak implementovat jakkoli okleštěné AVX-512 tak, aby bylo možné takové úlohy pouštět i skrze hybridní architektury. Jestli to bude zlepšení oproti pre-AVX10 stavu, ukáží aplikace. Jestli to Intelu pomůže ukáže čas. Podle mě spíš ne, protože Zen5 už je na cestě a zatím nic nenasvědčuje tomu, že by se Intel vyhrabal ze svých výrobních problémů, ať už vlastními procesy, nebo vylepšeným nasazováním TSMC procesů (což na GPU Arc fakt nezvládl).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 7. 2023 19:25

cc

Lepší to bude, protože AVX-512 má řadu vychytávek, které AVX2 nemá a nikdy mít nebude. Takže logicky, pokud Intel neumí udělat efektivní double pumping, tak jak to má Zen4, tak to musí udělat jinak, a toto je cesta.

Je to už dlouho co lidi volali po "AVX-256" - A Intel to těm lidem právě dal. S čím ale Intel moc nepočítal bylo to, že AMD se implementace AVX-512 povedla nad očekávání a tyto intrukce jsou teď i v consumer segmentu, takže Intel ať bude chtít nebo ne, stejně časem bude muset AVX-512 přidat všude, protože je teď v nevýhodě.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 7. 2023 9:46

TomK

citace: Intel ať bude chtít nebo ne, stejně časem bude muset AVX-512 přidat všude, protože je teď v nevýhodě.

Kdyby to nejak rozumne a levne slo, asi by to uz udelal (nejakou pomalou implementaci AVX-512 na E-jadrech).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 7. 2023 20:15

cc

Pomalá implementace je právě ten double pumping. I ty malé jádra mají AVX2, takže AVX-512 je v podstatě jen problém dekodéru. A CPU, který umí AVX10 v podstatě umí AVX-512 s 128-bit a 256-bit vektorama.

AMD ukázalo dobrou cestu a jediné co by měl Intel udělat je držet se té cesty u jejich power efficient jader. Nikdo nepotřebuje 2x512-bit FMA. Stačí 1x512-bit complex shuffle a AVX-512 implementace je hotová včetně velmi praktického AVX512_VBMI2.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 7. 2023 21:36

Bartolo

"intrukce jsou teď i v consumer segmentu, takže Intel ať bude chtít nebo ne, stejně časem bude muset AVX-512 přidat všude, protože je teď v nevýhodě."

Řekl bych to trochu jinak.
Ano, instrukce jsou teď v běžných CPU.
Aplikací co je používají přibývá.
Protože benefity to má slušný.
(I když chvíli to vypadalo, že AVX512 je slepá ulička)
Za pár let to bude nutnost i pro "málá" jádra.
Těch aplikací bude hodně. A hlavně to budou MT aplikace. A právě mála jádra se uplatní při MT zátěži.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 7. 2023 8:08

Ondra Satai Nekola

Zlatý podporovatel

(křivej) rovnák na vohejbák E jader.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
30. 7. 2023 23:49

P_V

Proč by nemohlo jít, aby některé jádra podporovala víc instrukci než jiná? OS by při unknown opcode exception daný thread přehodil na jádro, které to umí, a poznamenal si, že na malá jádra toto už dávat nemá. A nemuselo by se řešit nějaké zakazování AVX512, sjednocování sad apod.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 1:08

RDa

Presne tohle me napadlo taky, ale bohuzel Intel byl rychlejsi a prakticky neexistuje mixed-ISA cpu, protoze ty rozdily rychle zahladil update.

Paradoxne mozna duvod proc tohle nejde udelat je, ze by CPUID a flagy museli byt per-jadro, coz jaksi odporuje zazitym zvyklostem.

Mixed ISA by slo asi slozit na 2S platforme, kde se osadi nejaky obyc xeon bronze/silver a do druheho socketu gold/platinum - ale podle me to "znackovy" bios odmitne nabootovat a bude trvat na stejnem modelu CPU.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 9:11

Thalarctos

Hmmm myslenka hodna otce Fura. Tisice lidi si lamou hlavy jak to jadro napsat tak aby nedochazelo ke switchum. Je to sedsakra "draha" ( cache ) operace a ty tady tvrdis, no problemo switchnem se na jiny jadro.
To uz by byl mnohem lepsi pristup, zamknout thread na konkretnim core ktery tu instrukci podporuje ( affinita ).
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 12:03

RDa

Takova migrace ale probehne jednou za dobu zivota vlakna, pokud rodicovsky proces neudela tu afinitu rovnou. Tj. jde o pausalni hendikep, srovnatelny s naroky pro vytvoreni a zruseni vlakna.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 12:03

Vít Šesták

Lze leccos, otázkou jsou nechtěné vedlejší dopady. Režie přehození na jiné jádro by možná byl ten menší problém. WTF související s trvalým požadavkem na P jádro může být horší. Představte si, že po zdánlivě nesouvisející změně najednou procesor nebude využívat všechna jádra, případně aplikace začne žrát více baterie. Důvodem bude jedno malé použití AVX-512 (které tam může hodit kompilátor automaticky => nemusíte o tom mít tušení). Reálně se tak AVX-512 použije jen na začátku, ale podstatný vliv bude mít celou dobu.

Podobné WTF by mohla přinést i knihovna třetí strany. Prakticky by to incentivizovalo nepoužívat AVX-512, dokud si o to autor aplikace neřekne explicitně.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 12:45

RDa

Takovej multilib by byl vhodny nejenom jako x86/x64, ale taky pro ruzne urovne podpory instrukci - pak bychom nemuseli resit, ze nejake distro/libka nejede na starsim stroji.. problem je, ze ty variace instrukcnich sad nejsou sekvencni, ale priznakove a kombinaci je az moc.. (no mozna by to zjednodusit slo)
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 13:17

JSH

To by moc nevyřešilo. Takovej multilib by jel jen na stroji, co má pár jader s těma novýma instrukcema. Na staršim stroji to nic neřeší, protože OS nemá kam tu nepodporovanou libku přešoupnout.

Jinak ono to docela sekvenční je. Relevantních generací procesorů je výrazně míň než je možných kombinací těch příznaků. Intel si v tom teď udělal naprosto zbytečný binec.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 12:52

JSH

Protože v hodněvláknových aplikacích mívá ta aplikace jen jedno OS vlákno na jádro a ta vlastní výpočetní vlákna si přepíná ve vlastní režii. Různých implementací green threadů, task poolů a podobně jsou mraky a nepotkal jsem jediný, který by bez úprav zvládl fungovat na něčem takovémhle.

Takže by to znamenalo, že mnohovláknové aplikace by si obvykle naspouštěly moc OS vláken, které by se nakonec praly o pár velkých jader a na malých by neběželo nic. Buďto by to byl totální průšvih, nebo by to bylo rozšíření, které by si zapnul málokdo.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 13:54

Vít Šesták

OK, Thread pool je asi lepší příklad, jaké WTF by to mohlo způsobit.
- Zobrazit celé vlákno
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
31. 7. 2023 13:30

cc

Protože Intel zjistil, že to je naprosto nepraktické.

Dnes když aplikace/knihovna detekuje nějaké rozšíření, které má benefit pro některé základní operace, tak chce to rozšíření použít. Takže to dopadne tak, že už jen zavoláním memcpy se např. může použít AVX-512, protože tato implementace bude nejrychlejší. A tato funkce není jedinný případ. Runtime nebo link dispatch pro optimalizované funkce je dnes hodně oblíbený.

V praxi by to dopadlo tak, že 99.9% procesů by běželo na těch performance jádrech.
- Zobrazit celé vlákno

Zasílat nově přidané názory e-mailem

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Názory k článku Intel představil AVX10 jako lepší AVX512 i pro E-jádra

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Na dotace na zateplení zapomeňte. Nová vláda vykleští NZÚ

MeshCore je bezdrátová síť nejen pro mimořádné události

OSVČ senioři letos v přehledech uplatní slevu na pojistném

Irsko se po čtyřleté pauze znovu otevírá pro výstavbu datových center

Hackeři útočí přes e-mail, prahnou po přihlašovacích údajích

30 % nákladů díky AI dolů, ale nuda v práci jde nahoru

Malware, ransomware a další online hrozby: Jak se liší?

Digitalizační masakr: stát chce data o zaměstnancích

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Je tu první vydání magazínu CIOtrends v tomto roce

Školkovné se vrací. S jakou obměnou?

Miliony webů nesplňují zákon o přístupnosti. Jaký hrozí trest?

Kdo se bude moct vyhnout EET a co bude muset splnit?

Nervózní Microsoft začal v ČR žehlit Trumpův chaos

Nejen daňové přiznání, OSVČ musí podat elektronicky přehledy

Sophos kupuje Arco Cyber, zpřístupní CISO organizacím

Strojové učení slibuje rychlejší a levnější vývoj baterií

USA chystají web na obcházení blokací obsahu

Sailfish OS na Sony Xperia 10 III: seznámení a instalace

Počet nových pracovních míst prudce klesá

Názory k článku
Intel představil AVX10 jako lepší AVX512 i pro E-jádra