Definition
Retrieval-Abdeckungsanalyse ist eine Evaluationsmethode, die misst, wie gut ein Such- oder RAG-System die richtigen Quellen für einen definierten Scope (Themen, Jurisdiktionen, Dokumenttypen) abrufen kann. Im Fokus steht: “Haben wir die benötigten Quellen, und finden wir sie?”.
Warum es wichtig ist
- Blinde Flecken vermeiden: ein Ranker kann nicht finden, was nicht indexiert ist.
- Bessere QA: entdeckt fehlende Quellen, Ingestion-Probleme oder schwaches Query Understanding.
- Priorisierung: zeigt, welche Lücken zuerst zu schließen sind.
- Governance: liefert Evidenz, dass Coverage zum Use Case passt.
Wie es funktioniert
Abdeckung wird oft gegen eine Liste erforderlicher Quellen und repräsentative Queries gemessen:
Scope definieren -> Query-Set bauen -> retrieve -> bewerten "erforderliche Quellen gefunden?" -> Lücken schließen -> re-testen
Typische Ergebnisse: Coverage-Prozente je Thema/Jurisdiktion, Listen fehlender oder schwer auffindbarer Quellen und wiederkehrende Failure-Patterns (Metadaten, Sprache, Zugriff).
Praktisches Beispiel
Sie definieren 50 repräsentative Fragen zu einem Tax-Thema. Die Analyse zeigt: Rundschreiben sind indexiert, aber konsolidierte Fassungen einiger Normen fehlen, wodurch Retrieval scheitert. Die Lösung liegt in Ingestion/Indexierung, nicht in Prompt-Änderungen.
Häufige Fragen
Q: Ist das einfach Precision/Recall?
A: Es kann solche Metriken nutzen, ist aber oft quellenorientiert: “Rufen wir die konkreten autoritativen Dokumente ab, auf die wir uns stützen müssen?”
Q: Wie oft sollte man das laufen lassen?
A: Nach Ingestion-Änderungen, nach großen Rechtsupdates und regelmäßig für High-Risk-Domänen.
Verwandte Begriffe
- Search Analytics - Outcomes und Fehlerbilder monitoren
- Relevanz-Tuning - Ranking nach Coverage verbessern
- Indexing Strategy - stellt Indexierung benötigter Quellen sicher
- Content Discoverability - Inhalte per Struktur/Metadaten auffindbar machen
- Full-Text Search - Basisschicht für Evaluation
Referenzen
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.
References
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.