"Když člověk čte a poslouchá, tak za to většinou i platí."
většinou nepřímo v daních. Třeba informace získané ve škole. Nebo informace získané v knihovně (daně+symbolický poplatek). Nebo informace získané z rozhlasu a televize (poplatek nebo reklamy). Nebo si koupí knihu, noviny či jiné médium...
Smí potom ty informace dál používat? Nemyslím kopírovat, ale třeba když si překladatel koupí slovník a pak ho používá k překladům. Nebo pedagog má nastudované knihy a přednášky a potom ty informace používá při výuce za kterou dostává peníze. Nebo spisovatel napíše knihu, ke které se inspiroval tím co viděl a slyšel kolem sebe.
Jestliže totéž udělá jazykový model, je to krádež? Na každou informaci okolo nás by někdo mohl mít autorské právo. Kdyby měl jazykový model kartičku do knihovny, tak už by ty informace mohl používat k naparametrizování?
A k tomu bych dodal moje empirické pozorování z YT, kdy různé kanály po zavedení monetizace značně snížily kvalitu předávaných informací, takže počátek monetizace je dobrý signál ten kanál opustit. Amatérské kanály bez monetizace jsou to nejlepší co se týče hustoty informací, protože to ti lidé dělají zkrátka jen proto, že je to baví. A tohle překvapivě platí i pro různé highend kanály, takže i různé přednášky z konferencí o programování se postupně mění na reklamní kanály různých sponzorů.