Reward Model – JiltedGeek.com

Term van de dag

Reward Model

Reward Models zijn machine learning modellen die leren de kwaliteit of bruikbaarheid van outputs te evalueren. In plaats van expliciete regels, leren reward models door traininggegevens waarin menselijke beoordelaars hebben aangegeven welke outputs goed of slecht zijn.

Reward models zijn essentieel voor het africhten van grote AI-systemen om menselijke waarden uit te voeren. Ze worden gebruikt in reinforcement learning from human feedback (RLHF) om modellen als taalmodellen beter uit te lijnen met menselijke voorkeuren.

Voorbeeld: Een reward model kan worden getraind om chatbot antwoorden te evalueren. Menselijke beoordelaars geven feedback over welke antwoorden nuttig, eerlijk en veilig zijn. Het reward model leert deze voorkeurs patronen en kan vervolgens als een automatisch scoringssysteem dienen om de chatbot te optimaliseren.

Terug

📚

Term van de dag archief

Alle AI-termen op één plek. Blader door het volledige archief, gesorteerd op alfabet.