Tak rekneme ze u pameti to az tak uplne nevadi - pocitace co jedou neumrou.
Ale ukoncit spotrebni material (SSD), uz ovlivni trh znatelne - ty jejich nvme docela chcipaji - to se asi brzo vratime k HDD - a do stredoveku :)
Btw Crucial mel asi 26% trhu.. a dobrovolne tomu udelat papa je hodne, hodne, divny.
V tomhle případě asi nebude návrat na spotřebitelský trh nic složitého, navíc "bublina" AI, cloudů apod. rozhodně nekončí, protože to jako celek bublina není. Lidi AI používají, chtějí používat, jsou za ni ochotni platit. Pro HW firmy je to poměrně bezpečný business se dobrým výhledem. Riziko bubliny je spíš na SW straně, kde všichni investují obrovské miliardy do zlepšování modelů, a hrozí jim, že na tom konkurečním trhu neuspějí a peníze , které investovali do vývoje se jim nevrátí.
> Lidi AI používají, chtějí používat, jsou za ni ochotni platit.
Problem je, ze to nie je pravda. Ano, niektori to chcu pouzivat. Niektori su nuteni to pouzivat (tomu zodpoveda ich nadsenie). A nikto za to nechce platit[1],.
AI firmy maju problem, ze nemaju rozumnu navratnost, ohladom na prostriedky, ktore vykazali do investicii. Preto aj Microsoft tlaci Copilota horom dolom, vyhodis dverami vrati sa oknom, pretoze zodpovedni za capex do ai maju monetizacny problem a nieco vykazat musia.
[1] To neznamena, ze zopar ludi si nezaplati gemini alebo chatgpt. Znamena to, ze ich nie je dost a neplatia dostatocne vysoku sumu, aby investicie mali ekonomicku navratnost.
> $200 nepokrývá ani 10 % nákladů.
Zdroj? Nerozporuju to, ale nikde jsem neviděl žádný uvěřitelný výpočet (jeden pochybný). Ono je to složité, protože se o těch modelech neví ani jak jsou velké, jestli je to MoE, kvantizace… Takže můžeme maximálně extrapolovat podle DeepSeeku (a obdobných modelů které byly uvolněny jako open-source).
API, kde se platí podle počtu tokenů, je podle vás také 10x pod cenou?
Zajímavý článek. Podle mě většina profitability je o tom, jak rozložit obrovský fixní náklad na vytvoření (naučení) modelu do variabilního v podobě "pay per token". Někdo to rozpočítá na černá čísla dříve, jiný na tak dlouhou dobu, že doufají, že je dřív někdo koupí. Některé firmy si ten fixní náklad dají klidně do R&D výzkumu, jako vstupní nálad na vstup na trhu, a do variabilního ho prakticky ani nepočítají.
Křivka zátěže se brzo protne s křivkou optimalizace:
https://www.root.cz/zpravicky/micron-oznamil-ukonceni-spotrebitelske-znacky-crucial-bude-se-soustredit-na-velke-zakazniky/nazory/#o1259364
Hodili to normálně na GitHub s detailním popisem. To byla první verze, teď jsem našel něco pro aktuální V3, které se bojí i Altman:
https://adasci.org/deepseek-v3-explained-optimizing-efficiency-and-scale/
Jak funguje to, že "až bublina s sebou vezme část ekonomiky"? Četl jsem zajímavý debunking tohoto.
Nejpozději až začnou hromadné defaulty. To se pak budou USA s Čínou v dotacích předhánět (a EU v závěsu ale ta na to nebude mít peníze). Ostatně svým způsobem to už dotované je. Zajímalo by mě, jestli Google počítá s tím, že by mu to vydělávalo samo o sobě. Pochybuju; dotuje to jako součást své infrastruktury (nic jiného mu ostatně ani nezbývá). Totéž Microsoft. A o tom, do čeho leje peníze třeba čínská vláda už dnes nemá ani smysl spekulovat.
Všiml jste si, že bez výjimky prakticky všichni poskytovatelé LLM mají velké problémy s monetizací a to bez výhledu na nějaké valné zlepšení? Že problémy s monetizací mají dokonce i na nich závislé služby, od vibe codingu až po vývojářské nástroje jen potud, pokud o nich vím já? A to při stávajících cenách?
Ta bublina je atokonto ohromná. Ne, že by nebyl zájem. Není zájem platit tolik, aby to ekonomicky dávalo smysl. Tady zatím vůbec co není řešit. Vyhraje ten, komu se podaří vymyslet jak zařídit, aby se to alespoň jakž takž rentovalo. Odhaduju, že pokud nepřijde nějaká černá labuť, skončíme u jednoho čínskou vládou dotovaného modelu, Microsoftu a Googlu. A ti všichni je budou provozovat tak nějak v režimu nula od nuly pojde.
4. 12. 2025, 14:48 editováno autorem komentáře
No však jo, ale to je ten SW problém, kdy to riziko leží na tech firmách, které teď bojují o podíl na vznikajícím trhu. Ale HW poskytovatelům to bude víceméně jedno.
Je dost jisté, že použitelný free tier LLM je jenom krátká epizodka, trh se dřív nebo později dostane do nějakého udržitelného stavu, ale riziko pro HW firmy je imho jenom to, že si teď zvyknou na vysoké marže, přestanou být efektivní a pak neunesou nějakou hypotetickou korekci. To je pořád mnohem menší riziko než jaké nesou ty firmy, které ty LLM trénují, provozují apod. (jiná věc je hodnota akcií těch HW firem, ta může být nadhodnocená, ale to by měl zkušený management vyhodnotit a případně využít pro rozvoj firmy, akvizice atp.)
Jo, masivne prodavat nesolventnim zakaznikum a pritom roztacet ruzne kreativni ucetnicke dluhove legrace, to urcite neni zadny problem..
https://garymarcus.substack.com/p/has-the-bailout-of-generative-ai
https://www.wheresyoured.at/the-haters-guide-to-nvidia/
Dovolím si vykousnout závěr zpoza paywallu, ale za čtení stojí ta monstrozita celá:
In very simple terms, there is simply not enough real money in the world to continue funding NVIDIA’s future growth. Every year this company announces a new, more-expensive, more power-hungry GPU, and demands the market buy billions of dollars worth of them, and then spend billions of dollars more to install them, and then lose money until some sort of event happens that nobody can describe where these things begin to generate profit.
The only way for that to continue is debt, endless debt, more and more debt upon debt upon debt. The largest companies in the world — Microsoft, Google, Meta and Amazon, previously famed for funding everything through cash flow — are raising debt to buy more GPUs, all without any clear direction as to what it is that’s being built or why it is necessary.
When you look at NVIDIA for too long, you feel a madness brew within you. This company makes more money than any other company shipping a product that costs so much money to buy, install and run, at which point it only appears to lose money. Engaging with NVIDIA’s ecosystem requires you to bathe yourself in endless debt, acquire more power than any other industry has ever needed, and debase yourself by repeatedly stating that AI is the future without any tangible proof that’s the case.
At some point, these companies will not be able to raise enough debt, or will work out that they’re not even able to install or power on the GPUs they’ve already bought, or will work out that even when they do so there’s no profit in doing so.
Once that happens, everything begins to unravel, because everybody will admit that hundreds of billions of dollars have been wasted in service of effectively one company’s profits.
> Je dost jisté, že použitelný free tier LLM je jenom krátká epizodka
Problém je že i placené tiery jsou dost pod náklady.
> riziko pro HW firmy je imho jenom to, že si teď zvyknou na vysoké marže, přestanou být efektivní a pak neunesou nějakou hypotetickou korekci
Třeba Nvidia sice prodává hardware OpenAI, ale zároveň jim na ně půjčuje peníze - v případě prasknutí bubliny jsou po tomhle obchodu v mínusu. A úplně stejné přesuny peněz sem a tam probíhají třeba mezi OpenAI a Oracle.
OpenAI má mezitím rozdělaná / nasmlouvaná datacentra za 1 000 000 000 000 dolarů. A ročně prodělávají několik dalších miliard dolarů na provozních cenách.
NVidia prave ze nebude v minusu - se sice obrat zmensi zas na nejaky zlomek (rekneme 1/10), ale nedojde ani k nejakemu masivnimu propousteni zamestnancu (oni jich 10x vice kvuli ai nenabrali), protoze cele AI je virtualne roztocene kolecko nadsazenych hodnot.
Ti, co na bubline prodelaji, budou posledni drzitele akcii - kterym poklesne hodnota drzeneho virtualna. Vetsina zamestnancu a prvomajitelu uz bude mit prodano za velice vyhodno = vydelaji.
Nasmlouvane kapacity ve fabech se vyuziji na jine projekty, potazmo odprodaji s malou ztratou - ostatne tato kapacita je defakto limitujicim faktorem - a tim ze faby rostou jen v desitkach procent rocne, tak to drzi realne ztraty a prukak na uzde. Dukaz ze faby nejsou nafukovaci jsou prave vysoke vyrobni ceny a realokace na vyhodnejsi projekty.
Problem budou mit dodavatele next-gen technologii, ze pokud to bouchne do dvou let, tak se ty projekty potencialne zrusi, pripadne bude tenhle zakaznik v insolvenci a budou to promarnene roky vyvoje.
Vyroba stoji mene nez cca 1/10 ne-nadsazenych penez u spotrebni elektroniky.
$100M je pouze tisic kusu "profi ai" grafik za $100K. Srovnatelna consumer vec stoji $2K, vyrobne tedy $200. Skutecne naklady v dane transakci jsou $200K.
A tech $200K prispel uz zakaznik, cela ta pujcka je totiz jenom manipulace a virtualno.
Mrknete nekdy na kreativni ucetnictvi v afere WorldCom
Jsem se sekla, ten deal je $ 100 000 000 000 https://fortune.com/2025/09/28/nvidia-openai-circular-financing-ai-bubble/
"NVidia prave ze nebude v minusu"
A provo vzdycky kdyz podobna bublina splaskne, vubec nekrachuji prave ty nejvic nadhodnocene firmy.
Prakticky vsechny korporaty jedou davno na dluh, a ten dluh financujou z "viry" v jejich hodnotu. Kdyz ta vira zmizi, coz se typicky deje doslova z hodiny na hodinu, tak jim nikdo nepuci uz ani floka, a tudiz nemaji z hodiny na hodinu finance na provoz.
Je uplne jedno, kolik predtim vydelavali. Protoze i ty vydelky jsou typicky viceme virtualni.
> a to bez výhledu na nějaké valné zlepšení
Tohohle jsem si nevšiml. Vy víte, jaké jsou limity rozvoje AI agentů v příštích letech? Můžete se podělit?
> Odhaduju, že pokud nepřijde nějaká černá labuť, skončíme u jednoho čínskou vládou dotovaného modelu, Microsoftu a Googlu. A ti všichni je budou provozovat tak nějak v režimu nula od nuly pojde.
Ve skutečnosti jsou dnes modely provozovatelné na jedné velké GPU, které mají schopnosti jak nejlepší modely před rokem (gpt-oss-120b), a modely provozovatelné na běžném počítači, které mají schopnosti jak nejlepší modely před 2 lety (Gemma 3). Pokud by to takto šlo dál, tak provoz modelů dnešní úrovně bude za pár let "zadarmo". Co je drahé je vývoj (a trénink), ne provoz (inference) samotná. Ten je drahý, když ještě neumíme pomocí inženýrských triků (architekturní vylepšení, destilace…) dosáhnout dobrých výsledků s malým modelem, a musíme na to házet výkon.
Vy jste asi dost špatně četl, co jsem napsal, že? Ty problémy nejsou nějaké "limity rozvoje AI agentů". Ty problémy jsou v obrovském rozdílu mezi tím, co jsou vstupní náklady a co jsou zájemci ochotni platit. Bez výhledů na valné zlepšení monetizace. Monetizace. Pro jistotu ještě jednou: monetizace.
A vůbec nic z toho, co jste uvedl nevylučuje ani jednu jedinou větu z toho, co jsem napsal. Opravdu myslíte, že Microsoft financuje tu atomovou elektrárnu jen tak že by se v Redmondu nudili? Hospodářské výsledky si můžete najít snadno sám. Provoz současných -- ještě jednou to raději zvýrazním -- i těch současných modelů je zoufale nerentabilní. A ani za ně není dost ochotných platit dostatek, aby se alespoň vzdáleně té rentabilitě blížily. Proč si asi myslíte, že i openAI tak silně uhýbá ke snaze své produkty monetizovat? Kdyby teď hned došlo k úpravě cen tak, aby to odpovídalo reálným nákladům, celé AI se zhroutí během pár měsíců jako domeček z karet.
Vám ostatně zcela zjevně vůbec nedochází, že rychlost vývoje v minulosti naprosto nijak neimplikuje rychlost vývoje v budoucnosti. To je stejné jako s investicemi. V technologiích máme spoustu příkladů z nichž mnohé používáme (mnozí) denně. Třeba prostou železnici. Ostatně rentabilní není pořádně ani ta: bez dotací by ve velké části světa a rozhodně ve velké části ČR už dávno umřela.
> Ty problémy nejsou nějaké "limity rozvoje AI agentů". Ty problémy jsou v obrovském rozdílu mezi tím, co jsou vstupní náklady a co jsou zájemci ochotni platit. Bez výhledů na valné zlepšení monetizace.
To zní jako problém limitu rozvoje AI agentů. Dneska je AI ve stavu, že když to zrovna náhodou všechno funguje, tak ulehčí programátorům práci - a podle toho jsou za to ochotni platit, řádově nízké stovky dolarů měsíčně maximálně. Pokud se AI agenti rozvinou tak, jak ty společnosti předpokládají, říkají a na základě toho jednají (ano - není to yolo sypání peněz, mají vskutku příběh), tedy že poskytnou náhradu full remote nejdříve juniora a potom mediora, čili něco za co firmy normálně platí $10k+ měsíčně, tak to si pište, že se ochota za to platit zvýší.
Já neříkám, že se tam AI agenti se současným principem LLM dostanou, naopak považuji to za nepravděpodobné (10%, ať dám nějaké konkrétní číslo). Ale vy tady házíte kategorická tvrzení jak to nepůjde.
> Provoz současných -- ještě jednou to raději zvýrazním -- i těch současných modelů je zoufale nerentabilní.
Vždyť píšu že tohle je pravda. Ale například provoz modelů se schopnostmi rok starých modelů nerentabilní (alespoň ne tolik) není.
> Vám ostatně zcela zjevně vůbec nedochází, že rychlost vývoje v minulosti naprosto nijak neimplikuje rychlost vývoje v budoucnosti.
Ehm, já netvrdím, že to tak bude, ale že to tak může být. Naopak vy jste sem přišel efektivně tvrdit, že se vývoj brzy zastaví (tj. že současný vývoj implikuje zastavení). To se samozřejmě také může stát, je to dokonce poměrně pravděpodobné, ale rozhodně to nepovažuju za jisté.
> Kde to pořád berete, člověče?
"a to bez výhledu na nějaké valné zlepšení". OK, píšete o zlepšení monetizace - tj. předpokládáte, že pokud by se takový "automatický zaměstnanec" podařil vytvořit, byly by náklady na jeho vývoj a provoz ještě řádově vyšší než jsou na AI modely dnes?
> A jinak za mediora nebo nedejbože juniora někdo platí "$10k+ měsíčně" tak možná v USA. A spíš ani tam ne. To jen na okraj.
Doporučuji aktualizovat povědomí o situaci na trhu. Pro úplnost dodávám, že jsem psal o nákladech, tj. včetně hiringu, kanceláří atd. (plus v ČR různá ta pojištění a daně co platí zaměstnavatel, když nejde o švarc) - ne jen mzdu.
"Lidi AI používají, chtějí používat, jsou za ni ochotni platit"
Napsat do jediny vety 3 zcela nepravdivy vyroky, to uz chce hodne pece.
Lidi AI nepouzivaji, ti co to zkusili velmi rychle zjistili, ze je mnohem efektivnejsi pracovat bez ni, tudiz ji pouzivat ani nechteji, natoz aby za to byli ochodni platit.
A zjevne to neni ani zdaleka jen muj pohled na vec ... https://www.computertrends.cz/clanky/nadseni-pro-ai-opada-podniky-budou-odkladat-planovane-vydaje/
A vynasi to tolik, ze se do teho nacpou reklamy ... https://svethardware.cz/article/chatgpt-mozna-bude-brzy-mit-reklamy
Jo predevcirem sem se dozvedel ze zakaznici jsou nadseni, ze za vmware muzou platit uz 1/2M rocne (nejzakladnejsi verze) ... lol. Jup a jeste nadsenejsou jsou z toho, ze to kazkyho 1/4 roku stoji o dalsich 20% vic ...