Kombination aus semantischer Vektorsuche und lexikalischer Schlüsselwortsuche für bessere Retrievalqualität.
Hybride Suche fusioniert die Ergebnismengen aus semantischer und lexikalischer Suche. Verbreitete Fusionsmethoden sind Reciprocal Rank Fusion (RRF) und lineare Score-Kombination.
Der Ansatz profitiert von den Stärken beider Methoden: Semantische Suche versteht Bedeutung und Paraphrasen; lexikalische Suche trifft präzise Fachbegriffe und Eigennamen.
Die Gewichtung zwischen beiden Signalen ist ein Hyperparameter, der auf dem spezifischen Anwendungsfall optimiert werden sollte. Evaluierung auf einem repräsentativen Testset ist dafür unerlässlich.
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
Klassischer probabilistischer Retrieval-Algorithmus auf Basis von Term-Frequenz und inverser Dokumenthäufigkeit.
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
Modell, das initial abgerufene Dokumente nach tatsächlicher Relevanz zur Anfrage neu sortiert.