GPT-4, Claude, Gemini — De Modellenwedloop (2023)

2023 was het jaar van de grote modellenwedloop. Elke maand een nieuw model, elke maand nieuwe benchmarks, elke maand nieuwe capabilities die een jaar eerder onmogelijk leken. Drie spelers domineerden: OpenAI, Anthropic en Google.

GPT-4: advocaten en artsen

In maart 2023 lanceerde OpenAI GPT-4. Het behaalde scores in de top 10% op het Amerikaanse advocatenexamen (bar exam), de top 13% op medische licentie-examens, en scoorde hoger dan 90% van de mensen op de SAT-wiskunde. Het was ook het eerste groot commercieel model dat afbeeldingen kon begrijpen (multimodaal).

Claude: veiligheid als kernwaarde

Anthropic lanceerde Claude met een andere filosofie dan OpenAI. Oprichters — waaronder voormalige OpenAI-medewerkers Dario en Daniela Amodei — richtten het bedrijf in 2021 op met een focus op AI-veiligheid. Claude werd getraind via Constitutional AI: een aanpak waarbij het model een set principes (een “grondwet”) krijgt en leert zichzelf te evalueren.

Claude onderscheidde zich door langere context (100.000 tokens), meer genuanceerde antwoorden en minder neiging tot “hallucination” (het verzinnen van feiten).

Gemini: Google’s antwoord

Google lanceerde Bard (later omgedoopt naar Gemini) als directe concurrent van ChatGPT. De lancering was chaotisch — een demonstratievideo bevatte een fout, het aandeel daalde miljarden. Maar Gemini 1.5 (2024) werd uiteindelijk een serieuze concurrent met een contextraam van 1 miljoen tokens.

De echte betekenis van de wedloop

De modellenwedloop zorgde voor versnelling die zonder competitie niet zou hebben bestaan. Maar ze riep ook vragen op: gaat het te snel? Zijn de veiligheidsgaranties voldoende? In maart 2023 tekenden honderden AI-wetenschappers en techleiders (waaronder Elon Musk en Yoshua Bengio) een open brief voor een pauze van zes maanden in de ontwikkeling van modellen groter dan GPT-4. OpenAI weigerde. De race ging door.