Term van de dag
Post-training
Post-training is de fase na het basistraining van een AI-model waarin het model wordt verfijnd en aangeleerd voor specifieke taken en gedragingen via technieken als supervised fine-tuning, RLHF en instruct-tuning.
Terwijl pre-training (op miljarden tokens) het model leert patroonherkenning, zorgt post-training ervoor dat het model veilig, nuttig en aanstuurbaar wordt. Dit is waar modellen leren op vragen antwoord te geven in plaats van slechts woorden te voorspellen.
Voorbeeld: Claude werd eerst pre-trained op internet-tekst, en daarna post-trained om nuttige, onschuldige en eerlijke antwoorden te geven.
Term van de dag archief
Alle AI-termen op één plek. Blader door het volledige archief, gesorteerd op alfabet.