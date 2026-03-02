Kenneth Payne z Londýna testoval tři LLM GPT-5.2, Claude Sonnet 4 a Gemini 3 Flash proti sobě ve válečné simulaci. Ve všech hrách aspoň jedna stran použila nukleární zastrašování, v 95 % případů pak obě strany. Taktické nukleární zbraně byly použity v 64–86 % případů. Strategické nukleární zbraně (totální válka) v 0–14 % případů. Přitom strategické zbraně nepoužil Claude, nejčastěji jimi však vyhrožoval.
Z výsledků vyplývá, že LLM nemají lidské zábrany v použití nukleárních zbraní. Také se ukázalo, že LLM se nechce vzdávat, vlastně nikdy ve hře nikdo nepoužil žádnou z nabízených možností deeskalace konfliktu. Celkově vyhrál Claude (67 % vítězství) před GPT (50 %) a Gemini (33 %). Více detailů v článku. Celá hra i výsledky jsou také na GitHubu.
(zdroj: slashdot)