OpenAI publiceert Model Spec: zo denkt ChatGPT

OpenAI heeft een uitgebreid document gepubliceerd waarin de filosofie en gedragsregels achter ChatGPT worden uitgelegd. Dit zogenaamde Model Spec beschrijft hoe het model beslist wat het wel en niet doet, hoe het prioriteiten stelt bij conflicterende instructies en welke waarden aan de basis liggen van zijn antwoorden. Het bedrijf nodigt onderzoekers, beleidsmakers en het brede publiek nadrukkelijk uit om het document te lezen en te bespreken.

De publicatie is opmerkelijk omdat AI-bedrijven zelden zo expliciet zijn over de interne richtlijnen die hun modellen sturen. OpenAI wil met deze transparantie vertrouwen opbouwen bij gebruikers en toezichthouders, zeker nu het bedrijf zich opmaakt voor een beursgang later dit jaar. Het document toont onder meer hoe ChatGPT omgaat met gevoelige onderwerpen en hoe het de belangen van gebruikers, operators en de samenleving afweegt.

Tegelijkertijd kondigde OpenAI een officieel bug bounty-programma aan waarbij ethische hackers en beveiligingsonderzoekers beloond worden voor het ontdekken van kwetsbaarheden in ChatGPT. Deze combinatie van openheid over het modelgedrag en actieve samenwerking met de beveiligingsgemeenschap past in een bredere strategie om ChatGPT betrouwbaarder en veiliger te maken naarmate de gebruikersbasis blijft groeien.