Skip to main content
AI & Machine Learning

Retrieval-Augmented Generation

RAG is een AI-techniek die informatieopvraging combineert met tekstgeneratie om nauwkeurige, brongebaseerde antwoorden te produceren.

Ook bekend als: RAG, retrieval augmented generation

Definitie

Retrieval-Augmented Generation (RAG) is een techniek die grote taalmodellen verbetert door relevante documenten uit een kennisbank op te halen voordat antwoorden worden gegenereerd. Dit verankert de AI-output in feitelijke, actuele informatie in plaats van uitsluitend te vertrouwen op trainingsdata.

Waarom het belangrijk is

RAG is bijzonder waardevol voor kennisintensieve domeinen waar nauwkeurigheid en actualiteit cruciaal zijn. Traditionele LLM’s kunnen plausibele maar verouderde of onjuiste informatie genereren. RAG lost dit op door:

  • Antwoorden te verankeren in bronnen — elk antwoord verwijst naar specifieke documenten uit de kennisbank
  • Actualiteit te behouden — kennisbanken kunnen worden bijgewerkt zonder dure hertraining van het model
  • Hallucinaties te verminderen — het model genereert vanuit opgehaalde feiten, niet uit gememoriseerde patronen
  • Controleerbaarheid te bieden — citaties stellen gebruikers in staat AI-gegenereerde antwoorden te verifiëren

Hoe het werkt

Vraag → Embed → Zoek KB → Haal docs op → Genereer → Antwoord
  │                          │
  └──── vector similariteit ───┘
  1. Gebruiker stelt een vraag
  2. Systeem zet vraag om naar embeddings en doorzoekt de kennisbank
  3. Meest relevante documenten worden opgehaald
  4. LLM genereert antwoord met behulp van opgehaalde context
  5. Antwoord bevat broncitaties ter verificatie

Veelgestelde vragen

V: Hoe verschilt RAG van fine-tuning?

A: Fine-tuning wijzigt permanent de modelgewichten met nieuwe data. RAG haalt informatie op tijdens het bevragen, waardoor het gemakkelijker is om bij te werken en te auditen. RAG heeft de voorkeur wanneer bronmateriaal frequent verandert.

V: Kan RAG hallucineren?

A: RAG vermindert hallucinaties aanzienlijk door antwoorden te verankeren in opgehaalde documenten, maar de kwaliteit hangt af van de volledigheid van de kennisbank en de nauwkeurigheid van het ophalen.

V: Waarom niet gewoon een zoekmachine gebruiken?

A: Zoekmachines retourneren documenten; RAG synthetiseert informatie uit meerdere bronnen tot een coherent antwoord met de juiste context.

Gerelateerde termen


Referenties

Lewis et al. (2020), “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”, NeurIPS. [11.200+ citaties]

Gao et al. (2023), “Retrieval-Augmented Generation for Large Language Models: A Survey”, arXiv. [2.800+ citaties]

Izacard & Grave (2021), “Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering”, EACL. [1.400+ citaties]

References

Lewis et al. (2020), “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”, NeurIPS. [11,200+ citations]

Gao et al. (2023), “Retrieval-Augmented Generation for Large Language Models: A Survey”, arXiv. [2,800+ citations]

Izacard & Grave (2021), “Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering”, EACL. [1,400+ citations]