Query Expansion — Glossar

Definition

Query Expansion bezeichnet Techniken, die Suchanfragen durch Hinzufügen zusätzlicher Begriffe, Synonyme oder alternativer Formulierungen verbessern, um den Retrieval-Recall zu steigern. Bei traditioneller Suche bedeutete dies das Hinzufügen von Synonymen aus WordNet oder ko-vorkommenden Begriffen aus dem Korpus. In modernen RAG-Systemen können LLMs mehrere Query-Varianten generieren, hypothetische Antworten erstellen oder komplexe Fragen zerlegen. Das Ziel ist die Überbrückung der Vokabular-Lücke zwischen der Formulierung von Benutzerfragen und der Schreibweise relevanter Dokumente.

Warum es wichtig ist

Query Expansion adressiert fundamentale Suchherausforderungen:

Vokabular-Mismatch — Benutzer sagen “Auto” aber Dokumente sagen “Fahrzeug” oder “Wagen”
Query-Ambiguität — kurze Queries fehlt Kontext, Expansion klärt die Absicht
Verbesserter Recall — relevante Dokumente finden, die exakte Queries verpassen
RAG-Verbesserung — besseres Retrieval führt zu besseren LLM-Antworten
Multi-facettierte Queries — komplexe Fragen in durchsuchbare Teile zerlegen
Unterspezifizierte Queries — impliziten Kontext hinzufügen, den Benutzer nicht ausdrückten

Wie es funktioniert

┌────────────────────────────────────────────────────────────┐
│                    QUERY EXPANSION                          │
├────────────────────────────────────────────────────────────┤
│                                                            │
│  DAS PROBLEM:                                              │
│  ────────────                                              │
│                                                            │
│  Benutzeranfrage: "günstige Flüge nach Berlin"             │
│                                                            │
│  Dokumente könnten sagen:                                  │
│  • "preiswerte Tickets nach BER"                          │
│  • "Budget-Flugreisen nach Deutschland"                   │
│  • "billige Flugtickets nach Tegel/Brandenburg"           │
│                                                            │
│  Exakte Übereinstimmung verpasst alle!                     │
│                                                            │
│                                                            │
│  MODERNE LLM-BASIERTE EXPANSION:                           │
│  ───────────────────────────────                           │
│                                                            │
│  1. MULTI-QUERY GENERIERUNG                               │
│  ──────────────────────────                               │
│                                                            │
│     Prompt: "Generiere 3 alternative Versionen dieser    │
│              Frage, die relevante Dokumente abrufen       │
│              könnten: {original_query}"                   │
│                                                            │
│     Original: "Was verursacht Diabetes?"                   │
│                                                            │
│     Generierte Queries:                                    │
│     • "Risikofaktoren und Ätiologie von Diabetes mellitus"│
│     • "Wie entwickelt sich Insulinresistenz?"            │
│     • "Genetische und Lebensstil-Ursachen von Typ 2"     │
│                                                            │
│                                                            │
│  2. HyDE: HYPOTHETISCHE DOKUMENT-EMBEDDINGS               │
│  ──────────────────────────────────────────               │
│                                                            │
│     Hypothetische Antwort generieren und nach             │
│     ähnlichen echten Dokumenten suchen:                    │
│                                                            │
│     Query: "Wie funktioniert CRISPR?"                      │
│                    ↓                                       │
│     LLM generiert hypothetische Antwort:                  │
│     ┌──────────────────────────────────────────────────┐ │
│     │ "CRISPR ist eine Genom-Editierungs-Technologie,  │ │
│     │  die das Cas9-Protein verwendet, um DNA an       │ │
│     │  spezifischen Stellen zu schneiden. Eine         │ │
│     │  Guide-RNA dirigiert Cas9 zur Zielsequenz..."    │ │
│     └──────────────────────────────────────────────────┘ │
│                    ↓                                       │
│     Dieses hypothetische Dokument embedden               │
│                    ↓                                       │
│     Nach ähnlichen echten Dokumenten suchen              │
│                                                            │
│                                                            │
│  3. QUERY-DEKOMPOSITION                                   │
│  ──────────────────────                                   │
│                                                            │
│     Komplexe Query in Sub-Queries aufbrechen:            │
│                                                            │
│     Original: "Wie vergleicht sich Teslas FSD mit Waymos │
│                Ansatz, und welches ist sicherer?"        │
│                    ↓                                       │
│     Sub-Queries:                                           │
│     • "Wie funktioniert Tesla Full Self-Driving?"        │
│     • "Wie funktioniert Waymo autonomes Fahren?"         │
│     • "Tesla FSD Sicherheitsstatistiken"                 │
│     • "Waymo Sicherheitsbilanz und Statistiken"          │
│                                                            │
│                                                            │
│  RAG PIPELINE MIT QUERY EXPANSION:                         │
│  ─────────────────────────────────                         │
│                                                            │
│     Benutzer-Query                                         │
│         ↓                                                  │
│    ┌────────────┐                                         │
│    │  Erweitern │──→ Varianten / HyDE / Dekomposition    │
│    └────────────┘                                         │
│         ↓                                                  │
│    ┌────────────┐                                         │
│    │  Abrufen   │──→ Mit allen erweiterten Queries suchen│
│    └────────────┘                                         │
│         ↓                                                  │
│    ┌────────────┐                                         │
│    │  Dedupe &  │──→ Duplikate entfernen                 │
│    │  Reranken  │──→ Nach Relevanz zum Original bewerten │
│    └────────────┘                                         │
│         ↓                                                  │
│    ┌────────────┐                                         │
│    │  Generieren│──→ LLM antwortet mit erweitertem Kont. │
│    └────────────┘                                         │
│                                                            │
└────────────────────────────────────────────────────────────┘

Häufige Fragen

F: Hilft Query Expansion immer beim Retrieval?

A: Nein—Expansion erhöht Recall aber kann Präzision durch Einführung irrelevanter Treffer schaden. Synonym-Expansion ist berüchtigt für Query-Drift. LLM-basierte Expansion ist generell besser aber fügt Latenz hinzu.

F: Wie unterscheidet sich HyDE von regulärer Query Expansion?

A: Traditionelle Expansion fügt Begriffe zur Query hinzu aber sucht im “Query-Raum”. HyDE generiert eine hypothetische Antwort (vollständiger dokumentähnlicher Text) und sucht im “Dokument-Raum”.

F: Sollte ich Query Expansion mit Dense Retrieval verwenden?

A: Dense Retrieval handhabt bereits semantische Ähnlichkeit. Jedoch helfen LLM-basierte Techniken (Multi-Query, HyDE, Dekomposition) immer noch, indem sie mehrere Retrieval-Winkel bieten.

F: Wie wähle ich zwischen Query Expansion Techniken?

A: Beginnen Sie mit Multi-Query Generierung—es ist einfach und effektiv. Verwenden Sie HyDE für wissensintensive Queries. Verwenden Sie Dekomposition für komplexe mehrteilige Fragen.

Referenzen

Gao et al. (2022), “Precise Zero-Shot Dense Retrieval without Relevance Labels”, ACL 2023. [HyDE Paper]

Wang et al. (2023), “Query2Doc: Query Expansion with Large Language Models”, EMNLP. [LLM Query Expansion]

Carpineto & Romano (2012), “A Survey of Automatic Query Expansion in Information Retrieval”, ACM Computing Surveys. [Klassische Techniken]

Ma et al. (2023), “Query Rewriting for Retrieval-Augmented Large Language Models”, EMNLP. [RAG Query-Umschreibung]

References

Gao et al. (2022), “Precise Zero-Shot Dense Retrieval without Relevance Labels”, ACL 2023. [HyDE paper]

Wang et al. (2023), “Query2Doc: Query Expansion with Large Language Models”, EMNLP. [LLM query expansion]

Carpineto & Romano (2012), “A Survey of Automatic Query Expansion in Information Retrieval”, ACM Computing Surveys. [Classical techniques]

Ma et al. (2023), “Query Rewriting for Retrieval-Augmented Large Language Models”, EMNLP. [RAG query rewriting]