Datenbanksystem, das hochdimensionale Vektoren speichert und effiziente Ähnlichkeitssuchen ermöglicht.
Vektordatenbanken sind auf die Speicherung und Suche von Embedding-Vektoren optimiert. Sie unterstützen Approximate Nearest Neighbor (ANN)-Suche, die deutlich schneller als exakte Suche ist.
Bekannte Systeme sind Pinecone, Weaviate, Qdrant und pgvector als PostgreSQL-Erweiterung. Die Wahl hängt von Skalierungsanforderungen, Konsistenzgarantien und Integrationsbedarf ab.
Für produktive RAG-Systeme sind Metadatenfilterung und hybride Suche wichtige Features: Sie erlauben, die semantische Suche mit strukturierten Filtern wie Datum, Kategorie oder Quelle zu kombinieren.
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
Dichte Vektordarstellung von Text, Bildern oder anderen Daten in einem hochdimensionalen Raum.
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
Kombination aus semantischer Vektorsuche und lexikalischer Schlüsselwortsuche für bessere Retrievalqualität.