Nejsem právník, ale podle mě to není tak jednoduché. Pokud kód používá nějaký jedinečný algoritmus, který prokazatelně vytvořil nějaký vývojář, nestačí změnit názvy proměnných. Stejně jako nemůžu za svou prohlásit cizí knihu, když v ní změním jména postav. Soud bude individuálně posuzovat, jestli dílo vychází z nějakého jiného autorského díla nebo bylo napsáno zcela nezávisle. Což asi nebude případ Copilota, který se rozhodně učí z repozitářů na GitHubu.
Je zásadní rozdíl mezi "implementuje" a "kopíruje".
Pokud vyvíjím něco nekompatibilního s GPL a najdou u mě něco nápadně podobného kódu nějaké GPL libky, tak mám průser. Tam, kde takové podobnosti hrozí, si občas vývojáři i hlídají, aby "konkurenční" libky nikdy neviděli.
Jestli té aféře rozumím dobře, tak copilot dělá něco, co by člověku rozhodně neprošlo. Tedy kouká do GPL repa a pak píše podezřele podobný kód.
Mimochodem, parodie mají v autorském zákoně speciální výjimku.
Už jsem viděla ukázky generovaného kódu, který by 1:1 s LGPL funkcí, včetně jmen proměnných. Tam se už to porušení licence moc ukecat nedá.
Edit: Ono je to linkované i ve zprávičce, je to tohle https://devclass.com/2022/10/17/github-copilot-under-fire-as-dev-claims-it-emits-large-chunks-of-my-copyrighted-code/
20. 10. 2022, 13:24 editováno autorem komentáře
Skor by sme mali hovorit o Githube. Ano je to zlozitejsie, ale tu mi pride len to, ze placu na nespravnom hrobe a je to len vysledok toho, ze licenciu porusil niekto iny. No s neho nejdu vysudit take paniaze ani spravit taky hype.
No treba to nejako riesit, lenze ako? Dat copilotu vsetky uzavrete kody aby si ich vymazal? Co tie, co sa naucil pred zmenou licencie, atd...
> Podle vás je plagiátor je pouze subjekt A?
Nespravna metafora.
takze, ked Github Copilot vyuzije na svoje ucenie vsteky repozitare na Githube s MIT lienciou je plagiator? Nie, lebo licencia mu to dovoluje.
Ale ked niektory s tych repozitarov autorske prava porusil (voci inemu repozitaru), tak zrazu je na vine Github Copilot?
Ve zprávičce přece není nic o uzavřených licencích. GPL je přece také otevřená licence, což ale neznamená, že si můžete z GPL kódu jen tak něco zkopírovat a používat to jinde, bez dodržení podmínek GPL. Takže to nemusel nikdo nikam kopírovat, ten problém se týká i kódu, který je od začátku na GitHubu pod GPL (nebo jinou licencí).
Licence MIT je o dva roky starší než první GNU GPL. Není to otázka pokroku, ale přístupu ke svobodě. Jedni mají pocit, že je lepší, když si s jejich kódem lidé budou dělat cokoliv a svobodu vidí i v tom, že jej můžou vylepšit a pak uzavřít. Ti druzí mají pocit, že je to špatně a že by jejich dílo a díla z něj vycházející měla zůstat pro uživatele a další vývojáře vždy otevřená. Neexistuje správná varianta, na oba přístupy mají autoři nárok a záleží na tom, jaká pravidla pro svůj kód stanoví.
Nemám rád, když někdo o GPL/LGPL mluví jako o jediné skutečně otevřené licenci. Ale upírat GPL/LGPL slovo „otevřená“ je podle mne zase opačný extrém. Prostě jsou na otevřenost různé nároky, pro každého je důležité něco jiného, takže pokud to neurčíme přesněji, považoval bych za otevřené jak GPL/LGPL, tak MIT, Apache, BSD a další. A to jsem osobně příznivcem spíš těch licencí jako BSD a podobných.
Učej ho se učit, a on se zatím naučil podvádět:-)
Řešení je velmi snadné. Github může dát do podmínek užití, že má práva na scanování a užití kódu v Copilot. Případně to může být opt-in na použití Copilot.
Zajímalo by mě zda Copilot scanuje licence a používá jenom licence jako MIT a třeba Apache nebo GPL Eula atp. zcela ignoruje. Pokud to nedělá, tak z mého pohledu ty licence jednoznačně porušuje.
Na čtení kódu nepotřebujete žádnou licenci – není to užití autorského díla.
Je dost možné, že samotné podmínky užití Github by s tím nesouhlasily a i to smrštění na "užití" by mohlo být zavádějící
E. Private Repositories
Short version: We treat the content of private repositories as confidential, and we only access it as described in our Privacy Statement—for security purposes, to assist the repository owner with a support matter, to maintain the integrity of the Service, to comply with our legal obligations, if we have reason to believe the contents are in violation of the law, or with your consent.
https://docs.github.com/en/site-policy/github-terms/github-terms-of-service#e-private-repositories
Osobně Copilot už cca 2 měsíce používám. Moje zkušenost je taková, že většinou napovídá kousky kódu dlouhé 1-3 řádky. Většinou je to takový běžný "boilerplate" kód, který bych napsal úplně stejně, akorát bych kvůli tomu musel chvíli ťukat do klávesnice. Ono napsat cyklus, který projde pole a každý prvek s něčím porovná se nedá napsat zase až tak moc různými způsoby...
Píšu to sem proto, protože z diskuze některých to zní, jako že Copilot kopíruje obří kusy originálního kódu. Určitě budou případy, kdy se něco takového stane, a je potřeba to řešit. Já se s tím ale ještě nepotkal - rozhodně to není běžné.
Tolik jenom k dokreslení kontextu o praktickê zkušenosti.
Jsou i případy, kdy doplňují "unikátní kódy", které jsou netriviální.
https://twitter.com/DocSparse/status/1581461734665367554?t=KMsBBtQEOnFcNDM-1rFvuw&s=19
U mě by to pochopitelně nic chytrého doplnit nemohlo, protože nic chytrého nepíšu :-)