Vlákno názorů k článku
Microsoft přepisuje části Windows do Rustu od Bez přezdívky: - Kdyby to napsali v assembleru, maji zvyseni vykonu...

Článek je starý, nové názory již nelze přidávat.

27. 4. 2023 19:38

Bez přezdívky:

Kdyby to napsali v assembleru, maji zvyseni vykonu o 1000%.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 19:40

Ladis

Windows je ale multiplatformní, takže bys to musel napsat v assembleru pro všechny architektury CPU. Brácha např. provozuje Windows vedle x86 i na ARM, Itanium a Alpha.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 19:55

Calculon

Na ARMu mu poběží i verze pro amd64. Akorát trochu pomaleji.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 21:21

Ladis

"Trochu" víc, tohle není Apple. Navíc se sníží výdrž baterie na polovinu, na úroveň strojů s x86 (které zas nabízí kompatibilitu). Emulace ve Windows je totiž nekonečnou smyčkou vytěžující CPU na 100 % (stačí tedy mít trvale spuštěn jeden x86 program). Na Applu (Rosetta 2 pro macOS a Linux) a Alphě (FX!32) se program zkompiluje (Ahead-of-Time) do cílové architektury, takže vlastně spouštíš nativní binárku (ta samozřejmě běží o něco pomaleji než nativní program, protože jsou do kódu generované různé pomocné instrukce). Na Itaniu nevím, jak to funguje.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 21:42

Calculon

Já mám Surface s ARMem, takže to mám dobře změřené. Taková tragédie to není, ostatně třeba MSVC donedávna běhalo jen v emulaci.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 21:44

Ladis

Asi to dál zlepšují, moje info je už roky staré. Známej má ten první Surface Pro X (?) a po nějakém roce se mu podařilo zbavit všech x86 aplikací (myšleno, aby žádná neběžela trvale). Posledním byl .NET SDK (nejen runtime, ale i build).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 21:50

Calculon

Já už to taky moc nesleduji, jak to přesně dělají, ale poslední benchmark jedné aplikace jsem dělal včera. Možná taky záleží na tom, jaké knihovny se používají. Na Applu to nesleduju už vůbec, tam jede všechno pod ARMem, dokonce i věci od MS.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 21:54

Ladis

Dobrý na Windows a Apple je, že systémové knihovny se používají nativní. Aktuální podoba qemu-user na Linuxu emuluje i systémové knihovny (musíš mít nainstalovanou jejich x86 verzi, takže dokonce zabírá víc na disku; řešení je rozpracované a zatím v nedohlednu - nicméně funguje tam Rosetta 2, chybějící přepínač CPU pro strong memory model x86 lze obejít tím, že všechna vlákna aplikace, pokud jich má víc, dáš na stejné jádro). No prostě čím víc tvá aplikace používá kód z knihoven OS, případně GPU, tím víc toho jede nativně na Windows a Macu.
27. 4. 2023, 21:55 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 22:52

cc

Ty tady perlíš.

Apple M1 CPU podporuje X86 memory ordering - Takže Rosetta vezme X86 kód, zkompiluje ho pro ARM64, a přepne memory ordering na X86. Toto je ten hlavní důvod, proč Apple má tu emulaci tak rychlou.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 4. 2023 0:06

Ladis

Vždyť to jsem napsal :-) Rosetta 2 právě využívá toho, že Apple CPU umí x86 strong memory model. Ale i bez něj lidi vesele používají Rosettu 2 na Linuxu (Apple ji oficiálně vydal i pro Linux - primárně pro x86 Docker images na macOS) na Cortex jádrech, které to neumí. Stačí se zamyslet, k čemu strong memory model slouží a obejít to pro aplikace, které běží na více jádrech (pro jednovláknové aplikace bez práce).
28. 4. 2023, 00:07 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 19:53

Calculon

Psát ručně asm pro moderní CPU není zárukou rychlého běhu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 19:55

Filip Jirsák

Kdyby to psal v assembleru stejný počet lidí, nemají nic. Kdyby navýšili počet lidí adekvátně tomu, o kolik těžší je psát v assembleru, pravděpodobně by měly pomalejší kód. Protože kompilátory už jsou nějakou dobu v optimalizaci lepší, než i ti lepší programátoři. Samozřejmě že kdyby to psali ti nejlepší z nejlepších, dokázali by to v assembleru občas optimalizovat lépe (protože ti nejlepší z nejlepších by mimo jiné neměli problém nechat si to přeložit kompilátorem a použít jím vygenerované optimalizace) – akorát by to trvalo tisíc let, než by všechen ten kód ručně a ve špičkové kvalitě napsali.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 19:57

Calculon

Hmm, toho se při troše štěstí dočká jen Highlander.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 22:14

cc

Pokud jde o regulární kód, tak ten dneska v asm psát fakt nikdo nechce, ale pokud se jedná o SIMD, tak napsat lepší kód v asm než co vygeneruje compiler je celkem jednoduchá záležitost.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 4. 2023 22:17

Calculon

To jo, to je hračka, například pro AVX-512. Jen je smůla, že na GPU to stejně běží ještě efektivněji.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 4. 2023 0:44

RDa

Protoze GPU nema task switch a potrebu odkladat desitky kilobajtu TSS, resp. je tam nejaka hw podpora pro prepinani threadu.

Az bude mit GPU podporu pro MMU, TLB, vyjimky/restart, paging a swapovani, a nabootuje Linux, tak muzeme srovnavat srovnatelne. Do te doby je gpu pouha jednoucelova hracka - resp takove nacancanejsi DSP (jestli si je nekdo pamatuje, at uz od ADI nebo TI)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 4. 2023 12:51

cc

Já mám zkušenost jinou - pokud se jedná o nějaké distributed věci, které jsou obrovské, je tam nějaký network overhead, atd... tak AVX-512 je jednoznačná volba - programuje se pro to skvěle, debuggovat se to dá taky hezky a jako bonus je to na každém commodity HW co má X86 architekturu (Xeon a nově i Epyc od AMD) - člověk si může rentnout obrovský cluster v podstatě bez limitu. S GPU je to mnohem horší - je to drahé a dostupnost v cloudu je hodně omezená, protože každý chce GPU na ML...

Já jsem se teda setkal s AVX-512 kódem pro kompresi/dekompresi dat, regex engine, JSON parsing, XML parsing, a různé další věci pro big data processing. Když je zrychlení oproti C třeba 10x a problém začne být network bandwidth, tak je práce v podstatě hotová.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
28. 4. 2023 13:20

Calculon

Záleží na úloze, fyzikální simulace nebo jazykové modely se lépe dělají na GPU, AVX-512 násobí jak ponocný a navíc to je přímotop.

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Microsoft přepisuje části Windows do Rustu od Bez přezdívky: - Kdyby to napsali v assembleru, maji zvyseni vykonu...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

JMHZ a změny v daních z příjmů v roce 2026 a 2027

Agentické nakupování mění pravidla e-commerce

MeshCore je bezdrátová síť nejen pro mimořádné události

Irsko se po pauze znovu otevírá pro výstavbu datových center

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

Malware, ransomware a další online hrozby: Jak se liší?

Statistiky o ransomware, které jste asi neznali nebo si neuvědomili

Připravit, pozor, teď! Spouštíme Channeltrends Awards 2025

Školkovné se vrací. S jakou obměnou?

Digitalizační masakr: stát chce data o zaměstnancích

Analýza rozebrala moderování Jílkové v Máte slovo

Zahrávají si ČEZ či E.ON s čínským ohněm?

AI se snaží promlouvat i do stavebnictví

Sailfish OS na Sony Xperia 10 III: seznámení a instalace

Výjimka z EET je nejmenším OSVČ k ničemu, hodí se ale podvodníkům

Lidé si mohou nechat zdarma vyšetřit znaménka, zrak i cukr

Notepad++ opravil chybu zneužívanou k šíření malware

Nervózní Microsoft začal v ČR žehlit Trumpův chaos

Nový model OpenAI kóduje 15krát rychleji než jeho předchůdce

Vlákno názorů k článku
Microsoft přepisuje části Windows do Rustu od Bez přezdívky: - Kdyby to napsali v assembleru, maji zvyseni vykonu...