Term van de dag
Post-training

Post-training is de fase na het basistraining van een AI-model waarin het model wordt verfijnd en aangeleerd voor specifieke taken en gedragingen via technieken als supervised fine-tuning, RLHF en instruct-tuning.

Terwijl pre-training (op miljarden tokens) het model leert patroonherkenning, zorgt post-training ervoor dat het model veilig, nuttig en aanstuurbaar wordt. Dit is waar modellen leren op vragen antwoord te geven in plaats van slechts woorden te voorspellen.

Voorbeeld: Claude werd eerst pre-trained op internet-tekst, en daarna post-trained om nuttige, onschuldige en eerlijke antwoorden te geven.

📚
Term van de dag archief
Alle AI-termen op één plek. Blader door het volledige archief, gesorteerd op alfabet.