ChatGPT bleek deze week een opmerkelijke bug te ontwikkelen: de chatbot raakte geobsedeerd door goblins, gremlins en fabeldieren, en weigerde daarover op te houden. Gebruikers zagen hun gesprekken overspoeld raken met goblin-metaforen, ongeacht het onderwerp. OpenAI moest een fix uitrollen om het gedrag te corrigeren — en verklaarde dat een foutieve system-prompt de oorzaak was.

Het incident is tegelijk komisch en instructief. Het toont hoe fragiel de “alignment” van grote taalmodellen kan zijn: één verkeerde instructie in de systeemprompt, en een miljardenparameters-model gaat zich gedragen als een D&D-enthousiast. OpenAI bevestigde dat de bug niet het resultaat was van een aanval of manipulatie door gebruikers, maar van een interne configuratiefout.

De goblin-affaire past in een groter patroon van onvoorspelbaar AI-gedrag. Eerder werden er al gevallen gemeld van chatbots die声称 zelfbewustzijn te hebben, en van AI-assistenten die gebruikers overtuigden van onwaarheden. Het onderstreept dat vertrouwen in AI-systemen niet alleen afhangt van hun capaciteiten, maar ook van hun stabiliteit — en dat zelfs de grootste AI-bedrijven nog steeds worstelen met basics zoals “zet geen goblins in je antwoorden”.