RAG, voluit Retrieval-Augmented Generation, is een techniek waarbij een AI-model tijdens het genereren van een antwoord eerst externe informatie opzoekt en die informatie vervolgens als context gebruikt. In plaats van alleen te vertrouwen op wat het model tijdens de training heeft geleerd, raadpleegt het een externe kennisbron — zoals een database, documentenarchief of website.
Dit is bijzonder nuttig omdat taalmodellen een vaste kennisgrens hebben (de trainingsdatum). Met RAG kan een model toch antwoorden op vragen over recente gebeurtenissen of interne bedrijfsdocumenten die nooit deel uitmaakten van de training.
RAG wordt veel toegepast in zakelijke chatbots, klantenservicesystemen en juridische of medische zoekmachines waar nauwkeurigheid en actualiteit cruciaal zijn.