Napadlo mě totéž. Je důležité číst přesně text zprávičky " ...které způsobí, že se algoritmus soustředí na ně a ignoruje zbytek obrazu ..."
V originálním pdf je zajímavý odkaz na video https://youtu.be/i1sp4X57TL4 . Tam je jasně vidět, že i jen pouhé přiložení (obrázku) toasteru nestačí, stále se výsledek tváří jako banán. Tedy že speciálně upravené obrázky způsobují větší prioritu, výsledek bude (vždy/většinou) toaster bez ohledu na okolí. Tedy opravdu "zblbnutí" AI, aby se soustředila jen na cíl, který chci já (jako útočník).