Rychlý přehled historických souvislostí
V Linuxu, resp. linuxovém desktopu, se dějí věci blbě odjakživa. Prakticky od roku 1991 lidé kolem linuxového světa vymýšlejí věci, které neodpovídají „té jediné správné filosofii“. Co je to ale ona „jediná správná linuxová filosofie“, kladete si jako otázku?
Inu jako všude a vždy, je to soubor vlastností, který se zrovna hodí do krámu, aby podpořil argumentaci jednoho z nich, tedy z nás. Po dekády existují lidé, kteří tvrdí, že Linux je nejsvětější reinkarnací pravého unixového serveru a jako takový nemá a nesmí obsahovat grafické rozhraní. Správný přístup k němu je pouze přes terminál a kdokoli, kdo jen zhřeší myšlenkou na GUI, by měl být upálen na hranici.
Stejně tak je špatně cokoli od PulseAudio dál, ortodoxní devadesátkoví lidé přece neuznávají nic po Alsa. Také nic po X11, maximálně ještě X.Org Server, ale Wayland už je nepřijatelný. Je potřeba v tomto kontextu zmiňovat upstart a zejména vrcholné dílo pekelné, tedy systemd? Ale pojďme dál a připomeňme dobu příchodu UEFI a zejména Secure Boot, kde si věc sedla tak, že stojí na Shimu podepsaném klíčí Microsoftu (pokud se to za ta léta změnilo, pak se omlouvám za neznalost).
Nejde o to, zdali je ten či onen jmenovaný aspekt špatně, jistě mohu tvrdit, že Wayland je architektonicky zajímavá věc, která řeší spoustu problémů X.Org Serveru, na druhou stranu také chápu argumentaci protistrany, reprezentované třeba projektem XLibre. Obecně mi jde ale o to, že zatímco init skripty v 90. letech si často lidé upravovali sami a stejné platilo pro xorg.conf, tak o systemd a Waylandu už toto typicky říci nejde. A jde o důsledek skutečnosti, že ono to vlastně ani už není potřeba, protože oba nové systémy jsou efektivnější a spravované jinak, plus je zde faktor, že třeba oproti éře X11 a CRT monitorů se dnešní digitální LCD panely umí přes DisplayPort s počítačem domluvit bez nutnosti jim vnucovat nějaké natvrdo napsané parametry v konfiguračních souborech.
Ostatně kdo rád vzpomíná na dobu, kdy se pevným diskům psaly do BIOSu natvrdo na něm napsané parametry typu počet hlav a cylindrů? Já tedy ne. Stejně tak, jakkoli to byla krásná léta, se mi už nestýská po době, kdy se pomocí jumperů nastavovalo vnější či vnitřní napětí, násobič a sběrnice CPU. Bavilo mě to, ovládal jsem to, ale doba pokročila a dala nám automatizované digitální cesty, jak se tomuto již vyhnout.
Co se na nás v Linuxu tedy řítí
Už jsem mírně starší pán, ne ten rozjuchaný mladík hltající každou hw či sw novinku, takže se snadněji „vyděsím“. V posledních dnech mě „vyděsily“ dvě věci, které jsou sic jen logickým pokrokem, nicméně mohou přinést problémy. A obě se točí kolem AI, protože … kolem čeho jiného dneska, že.
DLSS5 rané preview
NVidia posunula svůj strojově naučený systém pro vylepšování běhu her o další skok vpřed. Zatímco první generace třeba uměly trochu zvýšit rozlišení a možná dopočítat jeden snímek mezi dvěma renderovanými, v rámci DLSS3 a DLSS4 už přišly schopnosti typu dopočítání celé řady snímků mezi vyrenderovanými, případně další zlepšení v kvalitě AI upscalingu. No a DLSS5 posouvá možnosti ještě dále.
S DLSS5 jde Nvidia podstatně dál a hlouběji do jádra her. Majitelé GeForce mohou využívat AI generování scén ve hře, které je více fotorealistické, zobrazuje lépe vypadající modely, než jaké hra obsahuje. A samozřejmě se tím mění celá vizuální stránka dané hry, a což to Nvidia notně schytala v diskusích. Jenže spousta kritiků nepochopila podstatu věci: tohle není post-processing nad renderingem hry, to je zakomponování – řekněme – AI vylepšených modelů / geometrie do renderování hry, a to ze strany vývojáře, který se rozhodne podporu této věci do své hry implementovat.
Pomiňme teď, jestli generované vylepšené modely vypadají lépe či vypadají správně realističtěji, nebo to ještě drhne. Podstata mého problému s touto technologií netkví v tom, že to třeba dnes funguje na 90 %, ale že jde o tak mocnou technologii. Neboli jednoho dne tomu člověk podstrčí Minecraft s úpravou kódu enginu a DLSS5 z něj udělá fotorealistickou střílečku vypadající jako z Unreal Enginu 5 – to samozřejmě přeháním, ale snažím se naznačit podstatu: změna uměleckého pojetí hry tak, že ji vytváří či spoluvytváří jakási AI naučená na bůhvíjakých datech, nikoli tvůrce té hry. Narážíme zde na fundamentální problém: když AI naučíte, co a jak fotil Josef Sudek (po stránce negativu i pozitivu), pak bude snadné mu říci „Udělej fotku Nymburského nádraží, jak by ji udělal Josef Sudek v roce 1955“. Ale nebude to Josef Sudek, nebude to jeho fotografie. Bude to dokonale věrná kopie, ale bude to padělek. Plagiát.
To v principu nemusí být dle většiny uživatelů špatné, však půlka dekoračních předmětů v obchodech jako Ikea je derivát něčeho dávného, dřívějšího, každopádně uměleckého, a lidé se tím rádi doma obklopují. Naopak tyto technologie umožní tvořit hry zase rychleji či v menším počtu vývojářů a obhájce této technologie by řekl: nastavení využití a parametrů DLSS5 ve hře, které provede vývojář, je svého druhu přece takový vibe coding na vlastní neschopnost uměleckého vyjádření. Ale to je jen snaha obhájit morálně pochybnou věc. Dochází tak jako tak k radikálnímu zásahu do uměleckého ztvárnění díla jako takového. Jinými slovy: vývojář, který dosud 10 let ladil každou texturu k dokonalosti, ztrácí kontrolu nad tím, co uvidí hráč, tedy jeho zákazník. Jeho kontrola nad věcí stojí na jinde postaveném modelu a jeho parametrech, není přímá, je pouze nepřímá.
Někde leží hranice toho, co je zásah ještě zkousnutelný a svým pojetím lidský. A co už ne. DLSS5 tuto hranici překračuje už nyní ve verzi, kterou bychom mohli označit za vývojářské preview – ostré vydání DLSS5 je v plánu na podzim a do té doby se bude optimalizovat, aby pro běh nevyžadovalo dvojici RTX 5090, což je dnes investice asi za 160 tisíc Kč. Každopádně si můžeme začít nervozitou kousat nehty, k čemu tuto nebo jí podobnou technologii budou lidé využívat.
Více se DLSS5 a jejím schopnostem věnuje Cnews.cz:
Google AI Sashiko
Což o to, dokud půjde jen o hry, tak nechť si současní hráči hrají, co chtějí. Klidně bambilión her, kterým DLSS5 dodala postavy se stejnýma očima a stejně nudným pseudo-foto-realisticým světem. Stejně jde často o generace, které jsou již odkojeny koukání na fotografie na šest a půl palcovém zařízení v podobě čtverců na instáči o reálně zobrazených 1080×1080 pixelů. Blbě se iPhonovým generacím vysvětluje, jaké to je vidět toho Sudka naživo, nebo listovat Bohemií Jana Reicha či jeho další knihou Dům v krajině.
To Google, jak je u něj dobrým zvykem, dělá něco daleko disruptivnějšího. Jeho nejnovější představení AI systému pro analýzu kódu mířícího do linuxového jádra, je klasická cesta do pekla dlážděná dobrými úmysly. Jakmile začnou do jádra mířit kusy kódu psané AI – což se už děje, tak to není dle mého osobního názoru optimální pro důvěryhodnost Linuxu jako celku a ani pro lidstvo, které může přijít o historickou paměť, která jednoho dne zmizí se současnou generací programátorů, kteří se AI při tvorbě kódu nehodlají dotknout ani 10metrovou tyčí. Ale jakmile toto vše jednoho dne začne hlídat jakási AI od firmy, která beztak už vládne světu, tak je to u softwarového projektu, na kterém stojí celé fungování moderní civilizace, vysloveně poukázka na budoucí průšvih.
Mám představu o tom, jakou politiku dnes správci Linuxu v čele s Linusem zastávají vůči AI příspěvkům. Vím, že musí být jasně označeny, že lidský zasilatel příspěvku má povinnost kontroly generovaného kódu, že tohleto, že támhleto. To vše jsou jasná a solidně pragmatická, avšak nic negarantující pravidla. Linux je dle mého příliš velký projekt a jak ostatně prokázaly experimenty University of Minnesota (resp. jejích pracovníků), kteří do jádra dostali záměrně děravý kód. Ano, jsem si vědom, že tomuto by právě Sashiko a podobné AI systémy mohly bránit. To vše si uvědomuji. Ale právě proto zde vidím ono riziko: pokud před 5 lety jsme nebyli schopni jako lidé něco odchytit, jak moc zlenivíme, až začneme nikoli přemýšlet nad kódem, ale spíše jen kontrolovat výstupy ze Sashiko? To je to, čeho se obávám.
Jak si to celé zpracovat
Možná si právě říkáte, že jsem se definitivně zbláznil: ještě ne, ještě jsem při smyslech. AI tu s námi prostě je a jsem přesvědčen, že většině lidí je to buď jedno, nebo jsou naopak spokojeni a AI zakomponovávají postupně do svých životů a případná negativa je trápí zhruba stejně jako případná negativa z nákupu oblečení na Sheinu. Dokážu si i představit argumentaci zastánců a těch, kteří se AI aktivně věnují, že to bude dobré a že to uhlídáme. Já jsem názoru jiného, protože disruptivní je sama skutečnost, že tu věc používáme a roste její míra užívání. Jen to není vidět tolik dnes, bude to vidět až za 20 či 30 let.
Já si to v osobní rovině překládám následovně: V roce zhruba 2008 či 2009, už sám přesně nevím, jsem řešil, že opravdu nechci a nedokážu používat Windows Vista (a to jsem měl trvale poskytnutou Windows Vista Ultimate 32+64bit). Vydržel jsem ještě dva nebo tři roky s Windows XP SP3, abych pak prostě přešel na Linux. To bylo moje záchranné lano, které mě od té doby drží. Zkusil jsem i macOS a o to více si vážím možností a svobod, které mi Linux poskytuje.
Ale pokud jednoho dne bude ubývat onoho lidského kurátorství nad tímto projektem, a bude naopak viditelně přibývat AI příspěvků, kontrol, optimalizací a podobného, půjdu zase o dům dál. Jestli k FreeBSD, nebo NetBSD, nebo OpenBSD, nebo cojávímkam, nemohu teď předjímat. Bude to plně odvislé od přístupu těchto projektů k AI příspěvkům a AI kontrolám nad kódem. Doufám, že ten den nikdy nebude muset nastat, ale obávám se, že už je nedaleko, pouhé jednotky let ode dneška.
Ano, stále jsem AI skeptik, který si plně uvědomuje, že mu svět ty AI systémy beztak nacpe do života. Dělat s tím nic moc nemohu, ale křičet do světa, že neděláme dobře, to za mě žádná AI neudělá. To mohu jen já sám. Tak mi dovolte i dnes tak trochu křičet. Děkuji.
