Claude Mythos gelekt: Anthropic’s geheimste model ligt op straat

Een configuratiefout in Anthropic’s contentmanagementsysteem zorgde ervoor dat bijna drieduizend niet-gepubliceerde documenten tijdelijk openbaar toegankelijk waren. In die bestanden dook een conceptblogpost op over een nieuw AI-model met de codenaam Claude Mythos — een model dat Anthropic intern omschrijft als een ‘stap voorwaarts’ in prestaties en het meest capabele model dat het bedrijf ooit heeft gebouwd.

Mythos zou deel uitmaken van een nieuwe tier genaamd Capybara, groter en intelligenter dan het huidige topmodel Claude Opus 4.6. Volgens de uitgelekte documenten presteert het model beduidend beter op het gebied van programmeren, academisch redeneren en cybersecuritytaken. Opvallend is dat Anthropic zelf in de gelekte tekst waarschuwt dat Mythos ongekende cybersecurityrisico’s met zich meebrengt door zijn vermogen om kwetsbaarheden razendsnel te vinden en te misbruiken.

Anthropic bevestigde het bestaan van het model na publicatie van het nieuws en gaf aan dat het momenteel in een vroege toegangsfase wordt getest bij een beperkte groep gebruikers. Het model is nog niet gereed voor brede uitrol, mede vanwege de hoge kosten en de beoogde voorzichtige introductie. De ironie is niet ontgaan aan tech-commentatoren: een bedrijf dat cybersecurityexcellentie propageert, lekte details van zijn eigen topgeheime model via een basale beheerfout.