Vektordatenbank
Datenbanksystem, das hochdimensionale Vektoren speichert und effiziente Ähnlichkeitssuchen ermöglicht.
Vektordatenbanken sind auf die Speicherung und Suche von Embedding-Vektoren optimiert. Sie unterstützen Approximate Nearest Neighbor (ANN)-Suche, die deutlich schneller als exakte Suche ist.
Bekannte Systeme sind Pinecone, Weaviate, Qdrant und pgvector als PostgreSQL-Erweiterung. Die Wahl hängt von Skalierungsanforderungen, Konsistenzgarantien und Integrationsbedarf ab.
Für produktive RAG-Systeme sind Metadatenfilterung und hybride Suche wichtige Features: Sie erlauben, die semantische Suche mit strukturierten Filtern wie Datum, Kategorie oder Quelle zu kombinieren.
Verwandte Begriffe
- Retrieval-Augmented Generation (RAG)
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
- Embedding (Einbettung)
Dichte Vektordarstellung von Text, Bildern oder anderen Daten in einem hochdimensionalen Raum.
- Semantische Suche
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
- Hybride Suche
Kombination aus semantischer Vektorsuche und lexikalischer Schlüsselwortsuche für bessere Retrievalqualität.