Anthropic’s Mythos-model maakt cyberaanvallen gevaarlijker dan ooit

Anthropic test een nieuw AI-model genaamd Claude Mythos, dat door een select groep vroege gebruikers wordt uitgeprobeerd. Het bedrijf omschrijft het model als een ‘step change’ in prestaties — het krachtigste model dat Anthropic tot nu toe heeft gebouwd.

Opmerkelijk is de expliciete waarschuwing die Anthropic zelf afgeeft: Mythos bezit ongekende cybersecuritycapaciteiten en kan kwetsbaarheden exploiteren op een manier die het tempo van verdedigers ruimschoots overtreft. Het bedrijf stelt dat dit een voorproefje is van een aankomende golf van modellen met vergelijkbare capaciteiten.

De aankondiging roept vragen op over de verantwoordelijkheid van AI-bedrijven bij het uitbrengen van modellen die zowel verdedigers als aanvallers in staat stellen nieuwe niveaus van digitale dreiging te bereiken. Anthropic benadrukt dat het de risico’s nauwlettend monitort en bewust kiest voor transparantie over de gevaren.