Semantische Suche
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
Semantische Suche wandelt Anfragen und Dokumente in Embedding-Vektoren um und findet Treffer über Kosinusähnlichkeit oder andere Distanzmetriken. So werden bedeutungsähnliche Inhalte gefunden, auch ohne Wortüberschneidung.
Im Vergleich zu Keyword-Suche ist semantische Suche robuster gegenüber Synonymen, Paraphrasen und verschiedenen Formulierungen der gleichen Frage.
Schwächen sind präzise Faktensuchen, bei denen exakte Schlüsselwörter wichtig sind, und seltene Fachbegriffe, die das Embedding-Modell nicht gut repräsentiert. Hybride Suche kombiniert beide Ansätze.
Verwandte Begriffe
- Embedding (Einbettung)
Dichte Vektordarstellung von Text, Bildern oder anderen Daten in einem hochdimensionalen Raum.
- Vektordatenbank
Datenbanksystem, das hochdimensionale Vektoren speichert und effiziente Ähnlichkeitssuchen ermöglicht.
- Hybride Suche
Kombination aus semantischer Vektorsuche und lexikalischer Schlüsselwortsuche für bessere Retrievalqualität.
- BM25
Klassischer probabilistischer Retrieval-Algorithmus auf Basis von Term-Frequenz und inverser Dokumenthäufigkeit.