Retrieval-Augmented Generation — Woordenlijst

Definitie

Retrieval-Augmented Generation (RAG) is een techniek die grote taalmodellen verbetert door relevante documenten uit een kennisbank op te halen voordat antwoorden worden gegenereerd. Dit verankert de AI-output in feitelijke, actuele informatie in plaats van uitsluitend te vertrouwen op trainingsdata.

Waarom het belangrijk is

RAG is bijzonder waardevol voor kennisintensieve domeinen waar nauwkeurigheid en actualiteit cruciaal zijn. Traditionele LLM’s kunnen plausibele maar verouderde of onjuiste informatie genereren. RAG lost dit op door:

Antwoorden te verankeren in bronnen — elk antwoord verwijst naar specifieke documenten uit de kennisbank
Actualiteit te behouden — kennisbanken kunnen worden bijgewerkt zonder dure hertraining van het model
Hallucinaties te verminderen — het model genereert vanuit opgehaalde feiten, niet uit gememoriseerde patronen
Controleerbaarheid te bieden — citaties stellen gebruikers in staat AI-gegenereerde antwoorden te verifiëren

Hoe het werkt

Vraag → Embed → Zoek KB → Haal docs op → Genereer → Antwoord
  │                          │
  └──── vector similariteit ───┘

Gebruiker stelt een vraag
Systeem zet vraag om naar embeddings en doorzoekt de kennisbank
Meest relevante documenten worden opgehaald
LLM genereert antwoord met behulp van opgehaalde context
Antwoord bevat broncitaties ter verificatie

Veelgestelde vragen

V: Hoe verschilt RAG van fine-tuning?

A: Fine-tuning wijzigt permanent de modelgewichten met nieuwe data. RAG haalt informatie op tijdens het bevragen, waardoor het gemakkelijker is om bij te werken en te auditen. RAG heeft de voorkeur wanneer bronmateriaal frequent verandert.

V: Kan RAG hallucineren?

A: RAG vermindert hallucinaties aanzienlijk door antwoorden te verankeren in opgehaalde documenten, maar de kwaliteit hangt af van de volledigheid van de kennisbank en de nauwkeurigheid van het ophalen.

V: Waarom niet gewoon een zoekmachine gebruiken?

A: Zoekmachines retourneren documenten; RAG synthetiseert informatie uit meerdere bronnen tot een coherent antwoord met de juiste context.

Gerelateerde termen

LLM — de generatiecomponent die natuurlijke taalreacties produceert
Embeddings — vectorrepresentaties die semantisch zoeken mogelijk maken

Referenties

Lewis et al. (2020), “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”, NeurIPS. [11.200+ citaties]

Gao et al. (2023), “Retrieval-Augmented Generation for Large Language Models: A Survey”, arXiv. [2.800+ citaties]

Izacard & Grave (2021), “Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering”, EACL. [1.400+ citaties]

References

Lewis et al. (2020), “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”, NeurIPS. [11,200+ citations]

Gao et al. (2023), “Retrieval-Augmented Generation for Large Language Models: A Survey”, arXiv. [2,800+ citations]

Izacard & Grave (2021), “Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering”, EACL. [1,400+ citations]