Hybride Suche
Kombination aus semantischer Vektorsuche und lexikalischer Schlüsselwortsuche für bessere Retrievalqualität.
Hybride Suche fusioniert die Ergebnismengen aus semantischer und lexikalischer Suche. Verbreitete Fusionsmethoden sind Reciprocal Rank Fusion (RRF) und lineare Score-Kombination.
Der Ansatz profitiert von den Stärken beider Methoden: Semantische Suche versteht Bedeutung und Paraphrasen; lexikalische Suche trifft präzise Fachbegriffe und Eigennamen.
Die Gewichtung zwischen beiden Signalen ist ein Hyperparameter, der auf dem spezifischen Anwendungsfall optimiert werden sollte. Evaluierung auf einem repräsentativen Testset ist dafür unerlässlich.
Verwandte Begriffe
- Semantische Suche
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
- BM25
Klassischer probabilistischer Retrieval-Algorithmus auf Basis von Term-Frequenz und inverser Dokumenthäufigkeit.
- Retrieval-Augmented Generation (RAG)
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
- Reranker
Modell, das initial abgerufene Dokumente nach tatsächlicher Relevanz zur Anfrage neu sortiert.