To srovnání s AISLE je nečestné. V AISLE vzali ten konkrétní kousek kódu (ještě z něj ručně vypustili nerelevantní části), napsali ručně velmi návodný kontext a sugestivně se zeptali, jestli tam náhodou není chyba. Čili dalo by se říci, že testovali, jestli model rozumí writeupu o zranitelnosti. To je úplně jiná disciplína než zranitelnost najít v surové codebase a ještě na ni vyvinout funkční exploit.