Vlákno názorů k článku
Šestnáct Claude AI vytvořilo překladač jazyka C v Rustu od Dushino - Tak jeden programátor by něco takového dělal několik...

Přidat názor

Včera 11:50

Dushino

Tak jeden programátor by něco takového dělal několik desetiletí. OK, možno jen let, než by jej odvezli na psychinu. Tady si šlo o něco jiného - ukázat, v jakém stavu je AI a jestli je už možno jí něco takového svěřit, nebo ještě ně. No a výsledek je, že ještě ne. A že to stálo prachy? Někdo si vyhodnotil rizika a řekl, že ty prachy na to dá. Tak kde je problém?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 12:06

Zdeno Sekerák

Uz jen ta reklama. Vsude o tom pisou, lide to studuji a povedlo se prekryt Moltbook.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 13:14

dustin

Tak autor je pracovníkem Anthropicu, tak předpokládám, že to bylo v rámci testování firemního produktu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 14:33

Pavel Tišnovský

Zlatý podporovatel

Spíchnout se to určitě dá rychleji.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 16:32

Dushino

Přiznám se, že můj odhad opravdu kvalifikovaný nebyl. Máte nějakou konkrétnější představu, kolik člověkodnů může trvat, řekněme, ruční napsání kompilátoru jazyka C na jednu platformu v kvalitě, která by umožňovala nasazeni aplikace na produkční prostředí? Třeba "jen" pro mikrokontrolér? Bez knihoven, opravdu "jen" dobře otestovaný kompilátor?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 17:00

Pavel Tišnovský

Zlatý podporovatel

Dobrá otázka. Možná je dobré si ujasnit zadání. Ono to totiž není "ruční napsání kompilátoru" ale spíše "tady máš naprosto všechny zdrojové kódy z celého světa, které jsme získali, kašli na licenci, klidně z toho použij cokoli a nějak z toho zamixuj výsledek"

Překladač od nuly a kvalitní je určitě práce na hodně dlouho, jenže nikdo to od nuly asi psát nebude. Kdybych to dostal na stůl, tak minimálně bych asi použil obdobu Yaccu a Lexu (dneska už je určitě něco lepšího), všechny možné a dostupné optimalizace (asi nad LLVM IR) atd. Určitě ne psaní od nuly (to by i té AI trvalo léta nebo spíše desetiletí nebo století stylem pokus-omyl).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 17:10

Dushino

Díky za odpověď. No jo, v dané době je dobré používat nástroje, které jsou v té době dostupné. Takže je asi opravdu nesmysl dnes psát kompilátor od nuly. A ano, yacc a lex mě také napadly. Holt, stará škola... Dnes už jsou zase jiné nástroje, dokonce jakýsi generátor generátorů - někdy před půl rokem jsem něco hledal a narazil na něj, bohužel si už jméno nepamatuji, jen že to bylo nějaké strašně složité. Možná jsem se měl zeptat AI, jak na to.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 17:21

Pavel Tavoda

Ako myslite ze AI dokaze oklamat roky vyvoja v oblasti matematiky (to nie je iba o programovani) a napise len tak lepsi parser ako generator z BNF? To nie je o ziadnej novej a starej skole. To je o pristupe profik vs amater.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 17:50

dustin

====
ale spíše "tady máš naprosto všechny zdrojové kódy z celého světa, které jsme získali, kašli na licenci, klidně z toho použij cokoli a nějak z toho zamixuj výsledek"
====

Autor v blogu (který je IMO velice poučný, zajímalo by mě, kdo z diskutujících si jej celý přečetl) uvádí, že modely neměly přístup k internetu, celý vývoj proběhl offline, nez jakýchkoliv dalších materiálů. Takže vzhledem k použitému Rustu se domnívám, že až tak moc "vykradených zdrojáků" tam nebude, protože rustích kompilátorů moc natrénovat nemohl.

Autor celkem detailně popisuje, jakým způsobem vývoj probíhal, jak si agenti (částečně) rozdělili role, jak to bylo především o obrovském množství testů (a failů). Jo, lidi by pracovali systematičtěji, ale uvidíme, jak to bude vypadat ještě za pár dalších iterací modelů. Osobně bych nebyl optimista, že to nebude mít zásadní vliv na práci lidských vývojářů.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 17:58

Pavel Tišnovský

Zlatý podporovatel

Ale píše tam přece, že to má postavený nad Claude (běželo jich víc, ale to je asi jedno).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 18:01

dustin

Píše
====
This was a clean-room implementation (Claude did not have internet access at any point during its development); it depends only on the Rust standard library.
====

Takže měl k dispozici akorát natrénovaný model ve více instancích + rust knihovnu, bez ničeho dalšího. Žádné hotové implementace čehokoliv, na čem by mohl dál stavět.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 18:08

Pavel Tišnovský

Zlatý podporovatel

Claude je GPT (předtrénovaný model), to neznamená "akorát", ale "všechno co šlo sehnat" (trošku přeháním, ale je to blízko pravdě).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 18:39

dustin

Samozřejmě že všechno, co šlo sehnat. Někdo brání profesionálovi, aby přečetl všechno, co jde sehnat? Samozřejmě nemluvím o nelegálním přístupu k ukradeným zdrojům. Pokud někdo něco zveřejní, musí počítat s tím, že si to někdo/něco přečte a zaktualizuje si tím své synapse/parametry. A pak tu "znalost" využije v další činnosti. Ať je to člověk nebo LLM. Já v tom až tak velký rozdíl nevidím. V obou případech použije akorát znalosti získané učením. Já to nepovažuji za "obšlehnuté zdrojáky". Ale každý to vidí jinak, což je taky v pořádku.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 19:11

Ondra Satai Nekola

Zlatý podporovatel

"Pokud někdo něco zveřejní, musí počítat s tím, že si to někdo/něco přečte a zaktualizuje si tím své synapse/parametry. A pak tu "znalost" využije v další činnosti. Ať je to člověk nebo LLM."

Tak zaprve LLM si parametry nezaktualizuje a zadruhe clovek a LLM fakt nejsou to same.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 19:15

Pavel Tavoda

> clovek a LLM fakt nejsou to same
Ale vyzera to tak ze nejaka cast mozgu naozaj funguje podobne ako LLM.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 19:28

dustin

======
Tak zaprve LLM si parametry nezaktualizuje
======

V čem tedy spočívá fáze učení?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 19:30

Ondra Satai Nekola

Zlatý podporovatel

Ta běží jednou a nedělá to LLM.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 19:40

Pavel Tavoda

> Ta běží jednou
Moze bezat kolko krat chcete. Ale samozrejme pri beznom pouzivani sa uz neuci, vtedy sa uz iba pouziva.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 19:42

dustin

Samozřejmě že to běží jednou, na všech těch vstupních datech, které jsou v daném čase k dispozici (je nepodstatné, zda trénink provádí samo LLM, nebo nějaké obslužné nástroje). Pak naučený model spustí, dají mu k dispozici znalosti ovládání svých agentů přes popisy v nějakých promptech (ani nemusí být lidsky čitelné, ale pořád jsou to návody), příp. nějaké programátorské postupy/prompty - tedy to co tvoří ten Claude Code. A dalším promptem tomu modelu s přístupem k pomocným nástrojům dali za úkol napsat ten kompilátor. Takže to co měl ten celý model k dispozici se pořád jenom to, co získal ve fázi učení + ty "vývojářské best practice" prompty. V čem se to liší od toho, co jsem napsal?

Nebo má Claude Code k dispozici nějakou lokální (bez přístupu na net) obrovskou databázi zkopírovaného ("obšlehnutého")/přechroupaného knowhow, kterou by přes RAG průběžně konzultoval? To bych se divil, protože tam už by si dost zahrávali s autorskými právy, ale třeba jo... Tak jak to je?
9. 2. 2026, 19:45 editováno autorem komentáře
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 19:57

Pavel Tavoda

> na všech těch vstupních datech
A co su podla vas tieto vstupne data a ake su podla vas velke?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 20:07

dustin

Jak s touto diskusí souvisí velikost trénovacích dat? Nikdo tu nerozporuje, že se při tréninku (tj. ladění parametrů modelu) používá vše, co je v daný čas dostupné (ať při prvním tréninku, nebo někdy později při "dotrénování" - možná je desetinné číslo modelu verze dotrénování, nevím, ale není to zde důležité).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Dnes 3:20

BoneFlute

A to natrénování != obrovskou databázi zkopírovaného ("obšlehnutého")/přechroupaného knowhow, kterou by přes RAG průběžně konzultoval?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Dnes 9:08

dustin

Dle mého názoru to stejné není. Je rozdíl při učení nastavovat váhy synapsí/parametry modelu, nebo si k příslušné otázce najít relevantní hotové texty a ty při vytváření odpovědi použít.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 20:08

Pavel Tišnovský

Zlatý podporovatel

já nepsal natvrdo "obšlehnuté zdrojáky", ale ano, i tak by se to asi dalo hodnotit (jenže do těch modelů nevidíme, navíc současné modely nerady označují zdroje).

Pořád čekám, kdy se v IT objeví někdo, kdo na tom bude vydělávat po analýze zdrojáků (a teď se nebavím o morálce okolo celé genAI, to je na delší povídání někde u piva :-).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
Včera 18:03

Pavel Tavoda

Rozumiete tomu ako funguje LLM a na akych udajoch je trenovana? To ze nema 'aktualne' pristup k internetu znamena ze nevidi posledne commity. Inac ma komplet nacitany cely github a translacia medzi jazykmi je to co LLM ide velmi dobre.