Definition
Eine Vektor-Datenbank ist ein spezialisierter Datenspeicher, der entwickelt wurde, um hochdimensionale Vektor-Embeddings effizient zu indizieren, zu speichern und abzufragen. Im Gegensatz zu traditionellen Datenbanken, die exakte Werte abgleichen, finden Vektor-Datenbanken Elemente, die einem Abfragevektor ähnlich sind, unter Verwendung von Distanzmetriken wie Kosinus-Ähnlichkeit oder Euklidischer Distanz. Sie ermöglichen semantische Suche im großen Maßstab durch Approximate-Nearest-Neighbor-Algorithmen (ANN).
Warum es wichtig ist
Vektor-Datenbanken sind essentielle Infrastruktur für moderne KI-Anwendungen:
- Semantische Suche — konzeptuell ähnliche Inhalte finden, unabhängig von exakten Schlüsselwörtern
- RAG-Systeme — relevanten Kontext für Sprachmodell-Antworten abrufen
- Empfehlungssysteme — ähnliche Produkte, Inhalte oder Benutzer finden
- Anomalieerkennung — Ausreißer im Embedding-Raum identifizieren
- Skalierbarkeit — Milliarden von Vektoren in Millisekunden durchsuchen
Jedes System, das „Ähnliches” statt „Exaktes” finden muss, verlässt sich auf Vektor-Datenbanken.
Wie es funktioniert
┌────────────────────────────────────────────────────────────┐
│ VEKTOR-DATENBANK │
├────────────────────────────────────────────────────────────┤
│ │
│ INDEXIERUNG: │
│ Dokumente → Embed → [0.1, 0.4, ...] → Index (HNSW/IVF) │
│ │
│ ┌─────────────────────────────────────────┐ │
│ │ Vektor-Index (Graphen/Cluster) │ │
│ │ ●──●──● │ │
│ │ /│\ \ │ │
│ │ ● ● ● ●──● │ │
│ └─────────────────────────────────────────┘ │
│ │
│ ABFRAGE: │
│ Query → Embed → [0.2, 0.3, ...] → ANN-Suche → Top K │
│ │ │
│ ▼ │
│ Ähnliche Dokumente │
└────────────────────────────────────────────────────────────┘
- Embedding — Dokumente werden über Embedding-Modell in Vektoren umgewandelt
- Indexierung — Vektoren werden in effiziente Suchstrukturen organisiert (HNSW, IVF, etc.)
- Query-Embedding — Suchanfrage wird in denselben Embedding-Raum umgewandelt
- ANN-Suche — Index wird durchsucht, um annähernde nächste Nachbarn zu finden
- Ergebnisse — Top K ähnlichste Vektoren mit Metadaten zurückgegeben
Häufige Fragen
F: Wie unterscheidet sich eine Vektor-Datenbank von einer traditionellen Datenbank?
A: Traditionelle Datenbanken verwenden exaktes Matching (WHERE name = ‘Hans’). Vektor-Datenbanken verwenden Ähnlichkeitssuche—das Finden von Vektoren, die Ihrer Abfrage im hochdimensionalen Raum am nächsten sind. Sie ergänzen traditionelle Datenbanken, statt sie zu ersetzen.
F: Welche Indexierungsalgorithmen werden verwendet?
A: Gängige Algorithmen sind HNSW (Hierarchical Navigable Small World), IVF (Inverted File Index) und PQ (Product Quantization). HNSW ist am populärsten wegen seines Geschwindigkeits-/Genauigkeits-Kompromisses.
F: Welche Vektor-Datenbanken sind populär?
A: Speziell entwickelte Optionen sind Pinecone, Weaviate, Milvus, Qdrant und Chroma. Traditionelle Datenbanken wie PostgreSQL (pgvector) und Elasticsearch unterstützen ebenfalls Vektorsuche.
F: Wie handhabt man Metadaten-Filterung?
A: Die meisten Vektor-Datenbanken unterstützen hybride Suche, die Vektor-Ähnlichkeit mit Metadaten-Filtern kombiniert (z.B. „ähnlich zu Abfrage UND Kategorie = ‚rechtlich’”). Dies ist kritisch für Produktions-RAG-Systeme.
Verwandte Begriffe
- Embeddings — die in Vektor-Datenbanken gespeicherten Vektoren
- RAG — Retrieval-Architektur, angetrieben von Vektorsuche
- Semantische Ähnlichkeit — das für Ranking verwendete Maß
- Approximate Nearest Neighbor — Kern-Suchalgorithmus
Referenzen
Johnson et al. (2019), “Billion-scale similarity search with GPUs”, IEEE TBD. [2.600+ Zitationen]
Malkov & Yashunin (2020), “Efficient and robust approximate nearest neighbor search using HNSW graphs”, IEEE TPAMI. [1.800+ Zitationen]
Pan et al. (2024), “Vector Database Management Systems: Fundamental Concepts, Use-Cases, and Current Challenges”, arXiv. [100+ Zitationen]
References
Johnson et al. (2019), “Billion-scale similarity search with GPUs”, IEEE TBD. [2,600+ citations]
Malkov & Yashunin (2020), “Efficient and robust approximate nearest neighbor search using HNSW graphs”, IEEE TPAMI. [1,800+ citations]
Pan et al. (2024), “Vector Database Management Systems: Fundamental Concepts, Use-Cases, and Current Challenges”, arXiv. [100+ citations]