2025 markeerde een nieuwe fase in de ontwikkeling van grote taalmodellen: de verschuiving van vloeiend antwoorden naar diep redeneren. Reasoning-modellen — modellen die expliciet “nadenken” vóór ze antwoorden — werden het nieuwe paradigma.
Chain-of-thought: hardop denken
OpenAI’s o1 (gelanceerd eind 2024) en de opvolgers o3 en o4-mini (2025) trainden modellen om uitgebreide redeneerketens te genereren vóór ze een definitief antwoord gaven. In plaats van direct te reageren, “dacht” het model stap voor stap — en kon tussentijdse fouten corrigeren.
Anthropic lanceerde Claude 3.7 Sonnet — het eerste Claude-model met extended thinking. Op wiskundige en programmeerbenchmarks scoorde het significant beter dan eerdere generaties. Het kon meerdere minuten “nadenken” over complexe problemen.
Multimodale AI: alles tegelijk
Tegelijkertijd werd multimodaliteit — het vermogen om tekst, beeld, audio en video te begrijpen en te genereren — standaard in alle topmodellen. Gemini 2.0 kon native audio verwerken en genereren. GPT-4o kon realtime gesprekken voeren met emotionele intonatie. Claude kreeg de mogelijkheid computer-use: een scherm bedienen zoals een mens.
De grens tussen “taalmodel” en “algemeen AI-systeem” vervaagde. Modellen werden minder tekstprogramma’s en meer universele kognitieve gereedschappen.
De implicaties voor wetenschap
Reasoning-modellen begonnen in 2025 echte wetenschappelijke bijdragen te leveren. AlphaFold 3 van Google DeepMind voorspelde de structuur van eiwitten met ongekende precisie — een doorbraak voor medicijnontwikkeling. AI-modellen losten wiskundige problemen op uit competities die studenten jaren studie kosten.
De vraag die 2025 opriep: als AI beter is dan mensen in redeneren over gestructureerde domeinen, wanneer — en in welke domeinen — worden mensen overtroffen in alle cognitieve taken?