2025 markeerde een nieuwe fase in de ontwikkeling van grote taalmodellen: de verschuiving van vloeiend antwoorden naar diep redeneren. Reasoning-modellen — modellen die expliciet “nadenken” vóór ze antwoorden — werden het nieuwe paradigma.

Chain-of-thought: hardop denken

OpenAI’s o1 (gelanceerd eind 2024) en de opvolgers o3 en o4-mini (2025) trainden modellen om uitgebreide redeneerketens te genereren vóór ze een definitief antwoord gaven. In plaats van direct te reageren, “dacht” het model stap voor stap — en kon tussentijdse fouten corrigeren.

Anthropic lanceerde Claude 3.7 Sonnet — het eerste Claude-model met extended thinking. Op wiskundige en programmeerbenchmarks scoorde het significant beter dan eerdere generaties. Het kon meerdere minuten “nadenken” over complexe problemen.

Multimodale AI: alles tegelijk

Tegelijkertijd werd multimodaliteit — het vermogen om tekst, beeld, audio en video te begrijpen en te genereren — standaard in alle topmodellen. Gemini 2.0 kon native audio verwerken en genereren. GPT-4o kon realtime gesprekken voeren met emotionele intonatie. Claude kreeg de mogelijkheid computer-use: een scherm bedienen zoals een mens.

De grens tussen “taalmodel” en “algemeen AI-systeem” vervaagde. Modellen werden minder tekstprogramma’s en meer universele kognitieve gereedschappen.

De implicaties voor wetenschap

Reasoning-modellen begonnen in 2025 echte wetenschappelijke bijdragen te leveren. AlphaFold 3 van Google DeepMind voorspelde de structuur van eiwitten met ongekende precisie — een doorbraak voor medicijnontwikkeling. AI-modellen losten wiskundige problemen op uit competities die studenten jaren studie kosten.

De vraag die 2025 opriep: als AI beter is dan mensen in redeneren over gestructureerde domeinen, wanneer — en in welke domeinen — worden mensen overtroffen in alle cognitieve taken?