Definition
Semantische Erweiterung (oft Query Expansion) ergänzt eine Anfrage um bedeutungsnahe Alternativen wie Synonyme, verwandte Konzepte oder Entitätsvarianten. So werden relevante Inhalte gefunden, auch wenn sie nicht exakt die gleichen Wörter enthalten.
Warum es wichtig ist
- Höherer Recall: deckt verschiedene Formulierungen ab.
- Bessere Domänenabdeckung: verbindet Abkürzungen, Zitate und Fachsprache.
- Bessere UX: weniger Nulltreffer und weniger Reformulierungen.
- Hybrid-fähig: kann Volltext- und Vektor-Retrieval unterstützen.
Wie es funktioniert
Query -> Verständnis -> sichere Expansion -> Retrieval -> Ranking -> Validierung via Analytics
Quellen sind u.a. kuratierte Synonymlisten, Taxonomien und Embedding-Nachbarn. Die wichtigste Herausforderung ist, den Intent nicht zu verändern.
Praktisches Beispiel
Wenn Nutzer “CIR92” suchen, kann die Expansion auch “WIB92” und “Code des impôts sur les revenus” hinzufügen, damit dieselbe Rechtsquelle über Sprachvarianten hinweg gefunden wird.
Häufige Fragen
Q: Warum kann Expansion Relevanz verschlechtern?
A: Zu breite Expansion erzeugt Rauschen. Gute Systeme expandieren selektiv, gewichten Zusatzbegriffe niedriger und überwachen den Effekt.
Q: Ist das dasselbe wie Synonyme im Index?
A: Verwandt, aber nicht identisch. Expansion kann zur Query-Zeit oder zur Index-Zeit passieren. Query-time ist oft einfacher zu auditieren und anzupassen.
Verwandte Begriffe
- Query-Verständnis - Bedeutung verstehen vor Expansion
- Suchintention - Expansion am Ziel ausrichten
- Embeddings - Grundlage für Bedeutungsnähe
- Volltextsuche - Keyword-Varianten hinzufügen
- Relevanz-Tuning - Impact messen und nachjustieren
Referenzen
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.
References
Manning, Raghavan & Schütze (2008), Introduction to Information Retrieval.