Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
Semantische Suche wandelt Anfragen und Dokumente in Embedding-Vektoren um und findet Treffer über Kosinusähnlichkeit oder andere Distanzmetriken. So werden bedeutungsähnliche Inhalte gefunden, auch ohne Wortüberschneidung.
Im Vergleich zu Keyword-Suche ist semantische Suche robuster gegenüber Synonymen, Paraphrasen und verschiedenen Formulierungen der gleichen Frage.
Schwächen sind präzise Faktensuchen, bei denen exakte Schlüsselwörter wichtig sind, und seltene Fachbegriffe, die das Embedding-Modell nicht gut repräsentiert. Hybride Suche kombiniert beide Ansätze.
Dichte Vektordarstellung von Text, Bildern oder anderen Daten in einem hochdimensionalen Raum.
Datenbanksystem, das hochdimensionale Vektoren speichert und effiziente Ähnlichkeitssuchen ermöglicht.
Kombination aus semantischer Vektorsuche und lexikalischer Schlüsselwortsuche für bessere Retrievalqualität.
Klassischer probabilistischer Retrieval-Algorithmus auf Basis von Term-Frequenz und inverser Dokumenthäufigkeit.