Co kdyby vznikl nový druh licence? S kódem by se mohlo dělat absolutně všechno, s jedinou podmínkou, kód nesmí být použit na trénování AI a ani jeho forky. Tímpádem, kdo by chtěl trénovat by musel zaplatit. A tím by open-source projektům teklo hromadu peněz na rozvoj od komerčních subjektů.
Stejně nechápu, proč se řeší soudy, že někdo natrénoval na něčem AI a pod. to je těžko řešitelné. Jednoduše bych okamžitě od zítřka jako vydavatel knih, softwaru atd. chtěl, aby existovala licence, která trénování zakazuje a okamžitě bych to na všechno přilepil. A bylo by po ptákách. Otázka je vymahatelnost, ale každopádně pak u soudu kdyby byl důkaz, že to někdo použil, tak by nebyly zbytečné hádky, ale přišel by hned trest za porušení.
17. 2. 2026, 14:23 editováno autorem komentáře
Myslím si, že by to vyžadovalo zásadnější reformu autorského práva, protože aktuálně asi nemůžete zakázat, že se na tom kódu může někdo/něco učit. Aktuální právní podoba (jak zákony, tak open-source licence) vznikaly v době, kdy se z učením počítalo jen u lidí. Nikdo nepočítal s tím, že budeme mít stroje, které to učení posunou na úplně jiný level a fakticky vytvoří způsob, jak ty licence obcházet.
Autorské právo se aplikuje především tak, jak se hodí byznysu, takže když se jeho vynucování hodilo, hrozilo se teenagerům vězením, a když se nehodí jako v případě AI, tak dělá, že je vše v pořádku. Nečekám tedy, že se v tomto něco zásadně změní. Nebudeme přece bránit pokroku, že?
Navíc autorské právo neřeší „užití“ díla ve smyslu čtení, poslouchání, učení. Užití ve smyslu autorského zákona je „technické“ nakládání s ním – vytvoření kopie, vysílání, apod. Takže pokud si třeba zobrazíte něco ve webovém prohlížeči, autorské právo to dokáže postihnout až do té fáze, kdy se ve vašem počítači vytvoří kopie díla (i když technické kopie autorské právo převážně automaticky povoluje), ale vnímání toho díla (vidět ho, slyšet, vnímat hmatem), to už je mimo dosah autorského práva. A navíc v tomhle případě nevnímá to dílo osoba, která by byla subjektem práva, ale „vnímá“ ho umělá inteligence.
Něco dost podobného se řešilo u internetových vyhledávačů a tam se na to prakticky vždy šlo přes to, že vyhledávač zobrazuje nějaké části toho původního díla, tj. zpřístupňuje je veřejnosti – a to je něco, co autorské právo chránit umí. Ale bránit vyhledávači, aby si vytvořil technickou kopii při navštívení nějaké stránky, to prakticky nejde (z hlediska práva). A vyhledávač pak tu kopii zaindexuje, což je nějaká transformace, která není postižitelná autorským právem. AI dělá prakticky to samé – akorát vektory popisující to dílo nezapíše do vyhledávacího indexu, ale do simulace neuronové sítě.
Vyhledávače bylo možné chytit za ruku při té prezentaci na výstupu, kde se části toho díla znovu objevily. Ale to u AI nejde, protože tam už tahle fáze prezentace části díla není (ani být nemůže, protože AI na rozdíl od vyhledávače nemá uloženu kopii díla).
Navíc chránit takhle jen autorská díla by bylo polovičaté řešení. Třeba záznam mé teploty a pulsu (a další tělesná měření), nebo třeba záznam míst mého pobytu, hodnoty z různých netělesných senzorů – nic z toho není autorské dílo, ale rozhodovat o tom, na čem z toho se může trénovat AI, bych chtěl asi ještě víc, než v případě mnou vytvořených autorských děl. Takže to spíš bude vyžadovat úplně novou legislativu ohledně nakládání s jakýmkoli typem dat, i když po zpracování těch dat se nelze dostat k původním datům a narušit tak třeba autorské právo nebo právo na ochranu osobních údajů.
A navíc v tomhle případě nevnímá to dílo osoba, která by byla subjektem práva, ale „vnímá“ ho umělá inteligence.
Jenže to je velice omezený pohled na věc. V principu není rozdíl mezi nějakým nástrojem na harvestrování dat a umělou inteligencí. Za obojím stojí nějaký právní subjekt, který je zodpovědný za nástroje, které používá (k dosažení svých cílů).
Neexistují jenom rozdíly v kvalitě, ale také v kvantitě. V principu není rozdíl, jestli se na webovou stránku podíváte vy svým prohlížečem, a jestli se na ni podívá najednou milion botů z celého světa a budou ji načítat pořád dokola každou vteřinu. Akorát to první je běžné použití stránky a to druhé je DDoS.
Do licence si můžeš dát, co chceš, pak je otázka, jakou to má oporu v zákoně. Do nájemní smlouvy si taky lidi dávají, že člověk nemůže mít v bytě zvíře, a přitom občanský zákoník tuhle podmínku vyloženě neumožňuje, takže ta klauzule nemá žádnou právní váhu.
Pokud si do licence dám, že se na tom nesmí učit AI, ale podle autorského práva to bude spadat do povoleného užití, moc si nepomůžu.
jj to se uvidí po prvních sezeních u soudu (a skutečně asi nikdo neví, jak to může dopadnout). Jinak kvůli zcela jiné věci jsem našel tuto stránku, kde to pěkně shrnují a přitom se netváří, že znají odpovědi na všechny právní kličky https://www.terms.law/2025/12/05/training-on-open-source-code-what-gpl-mit-and-other-licenses-actually-say-about-ai/
(IMHO: prostě nejde vzít náhodnej zdroják a na tom si natrénovat AI bez rozumně znějící licence, ale uvidíme; toto je asi hodně otevřené téma)
Dost pochybuju ze si jakejkoli clovek pripoji nejakym portem github, a neco si z nej syncne.
Jelikoz zadna AI neexistuje, bavime se o pouzivani toho kodu limi, a to ve vsech pripadech. Jakej je rozdil v tom, jestli si neco sosnu prostrednicvim pc ja, nebo jesli si ja neco sosnu prostrednicvim stejneho pc a stejne aplikace kterou (zcela nesmyslne a nepravdive) nazvu ai?
Muzeme se (zcela mimo tema, protoze o tom je tady jen ten clickbajtovy titulek) bavit o tom, ze nejaci provozovatele nejakych sluzeb zatezuji neci sluzby ... pripadne o tom, ze nekdo nabizi k pouziti cizi kod bez uvedeni zdroje/licence, potazmo o tom, ze nekdo generuje nejaky pseudonahodny kod tak ze proste posklada k sobe nejake casti, a mozna nejak formale overi, ze to jde prelozit ... ale rozhodne to nedelaji zadne stroje o nejake sve vuli, jsou za tim jen lide.
A ne, do licence si nemuze kazdy napsat co chce, protoze treba "stroj" neni subjektem prava, takze ho nelze nijak specifikovat a predevsim s nim nelze uzavirat zadne smlouvy. Licence je totiz smlouva mezi subjekty prava.
Do licence si každý může napsat, co chce, ale těmi omezeními může podmínit jen užití ve smyslu zákona. Takže můžete zakázat kopírovat program lidem z Ruska (kopírování je užití), čímž jim efektivně zabráníte v jeho spuštění – nejdříve by si museli udělat kopii u sebe na počítači, a to jim licence neumožní. Ale třeba taková ty microsoftí licenční ujednání, že nesmíte jejich software používat v rámci jaderného inženýrství, to je pravděpodobně na poli autorského práva nevymahatelné – protože kopírování to nebrání (pokud ten program nekopírujete vyloženě na řídící počítač ve velíně jaderné elektrárny), ale co pak děláte s tím programem, když ho spustíte, na to už licence nedosáhne.
Kdyby takhle někdo zakázal kopírování autorských děl umělé inteligenci, tak tím nanejvýš omezí to, že vy si spustíte nějakého agenta, který by v rámci zpracování vašeho promptu potřeboval navštívit pár stránek. Ale trénování AI by to asi nezabránilo – protože ty stránky prostě stáhne něco jiného, a stažené stránky to teprve zpřístupní pro trénování AI. A to „něco jiného“ nepůjde postihnout, a trénování AI nad daty, která už legálně máte, také nejde autorským právem postihnout.
Pro některé projekty používám modifikovanou BSD licenci, kam jsem přidal:
4. Any machine learning model or artificial intelligence system that includes this source code in its training data must be made freely available to the public without any restrictions on access or use. This includes:
- The model weights and architecture
- Any preprocessing steps required for model input
- Documentation necessary for model use
Na druhé straně si nedělám iluze, že firmy dodržují nějaké zákony nebo licence - ostatně NVIDIA, Meta nebo Anthropic, pokud vím, nějaké knihy už ukradly a trénovaly na nich své modely.
Ostatně je i dost firem, které porušují GPL, ví se o tom, ale nic se neděje.