Pozitiva:
* Rychlejsi hledani v prumerne rozesahle dokumentaci = Casto doda informaci jako kompilat z utrzku rozesetych po spatne clenene dokumetntaci.
* Generovani dokumentace = Necham vygenerovat vzdy jen pro maly scope a v drtive vetsine pripadu to skutecne sedi a struktura dava smysl.
* Jednoucelove veci - ad-hoc Bash skript pro slozitou filtraci dat; SQL pro ad-hoc slozity dotaz do DB
* Vysvetleni kodu - idealni cesta pro zacatecniky, jak pochopit i neidiomaticke kusy kodu
Neutralni:
* Pokrocilejsi "Intelli Sense" = Plati jen pro masove rozsirene jazyky + knihovny, umi vygenerovat i celou metodu. Uspesnost ale neni nijak super vysoka.
* Generovani testu = obcas funguje, ale obcas vytvori test o 100+ radcich, kdyz stacilo nejakych 15. Tim se absolutne ztrati zacileni testu.
Negativni:
* Halucinace = Vytaci me, kdyz si vymysli syntakticke nesmysly nebo absolutne neexistujici funkce. Je schopen i dodat link na GitHub k vyhalucinovanemu kodu - link samozrejme vraci HTTP 404.
* Bruteforce pristup = Napr. kdy vygenerovany kod parsujici YAML/JSON data je zalozen na vcelku trivialnim regexu.
* Preoravani kodu = Obcas z nepochopitelneho duvodu meni mnohem vic nez je vyzadovano. Kriklavy priklad je zmena formatu dat vstupnich namisto zmeny zpusobu zpracovani.
Co se testů týká, vždy je potřeba je projít a kdyžtak je nechat zjednodušit, případně lehce navést co má testovat a jak. Výsledkem je kupodivu často test, který testuje to, co má a přitom je podstatně lépe napsaný. LLM holt nejsou deterministické a bez korekce občas generují spousty šumu.
Ten "bruteforce přístup" je zajímavý ale celkem logický. Přesně odpovídá těm haldám mizerného kódu, kterého se po internetu valí gigabajty. Na čem, myslíte, se asi učila? A to přeorávání kódu omezuji výslovnými instrukcemi na co sahat smí a na co ne a co jsou danosti. To respektují. Tedy skoro vždy, ehm. Vyhnout se tomu naštěstí dá. Pravda je, že při generování těch testů je to jinak když člověk opomene dost zajímavé :-D
14. 11. 2025, 10:15 editováno autorem komentáře