GPT-5.5 evenaart Mythos in nieuwe cybersecurity-tests

OpenAI’s nieuwste GPT-5.5 model presteert op hetzelfde niveau als Anthropic’s veelbesproken Mythos Preview in onafhankelijke cybersecurity-tests. Volgens Ars Technica tonen nieuwe benchmarkresultaten aan dat Mythos’ vermeende cyberdreiging geen doorbraak is die beperkt is tot één model, maar dat vergelijkbare prestaties nu ook op andere platformen bereikbaar zijn.

De tests focusten op het vermogen van AI-modellen om kwetsbaarheden in software te identificeren en te exploiteren — een dubbelzinnig vermogen dat zowel nuttig is voor beveiligingsonderzoek als potentieel gevaarlijk in verkeerde handen. Dat GPT-5.5 vergelijkbare scores behaalt, suggereert dat de vooruitgang eerder een brede trend in modelontwikkeling is dan een unieke eigenschap van één specifiek model.

De bevindingen komen op een moment dat het debat over AI-veiligheid en cyber-risico’s fors is geïntensiveerd, mede door de beperkingen die Anthropic eerder op Mythos heeft toegepast en de kritiek die OpenAI daarop had. Nu beide modellen vergelijkbaar presteren, verschuift de discussie van “welk model is gevaarlijker” naar “hoe gaan we als industrie om met deze capaciteiten”.