Pěkně manipulativní metrika teda, měřit jen z toho, co původně přehlédl člověk, ne, a zvláště pak se kasat, že 20% false positive je málo.
Kolik za stejné období bylo všech (tedy i bezchybných) upstreamů, a kolik z toho je 20% false positiv?
Mě osobně ty robo-kontroly docela osvědčily - místo abych nechal AI za sebe psát kód, tak si jenom nechám kód od AI zkontrolovat. Zachovávám si přehled nad kódem, ale často mě robot na nějaký chybky upozorní. Přijde mi to Win-Win.
taky to tak dělám. A PR od jiných (často generovaný slop mašinou) ten robot taky dokáže pěkně zhodnotit, takže win-win (mám přehled o kódu + trošku snadnější review v době, kdy junioři drtí AI generated code)
Tak to by mne zajímalo, co děláš. Protože zrovna na review máme obstojné výsledky.
Doplňující otázka - dává ti něco lepší výsledky?