Modell, das initial abgerufene Dokumente nach tatsächlicher Relevanz zur Anfrage neu sortiert.
Reranker sind Cross-Encoder-Modelle, die Anfrage und Dokument gemeinsam verarbeiten und eine Relevanzpunktzahl ausgeben. Sie sind genauer als Bi-Encoder-basiertes Retrieval, aber langsamer.
In einer typischen Pipeline ruft ein schneller Bi-Encoder viele Kandidaten ab; der Reranker bewertet die Top-Kandidaten präziser und sortiert sie um. So entsteht Effizienz durch Zweistufigkeit.
Reranker kompensieren Schwächen des initialen Retrievals: Dokumente, die semantisch ähnlich klingen, aber nicht relevant sind, werden heruntergestuft; echte Treffer werden hochgestuft.
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
Kombination aus semantischer Vektorsuche und lexikalischer Schlüsselwortsuche für bessere Retrievalqualität.
Spezialisiertes Modell, das Texte in dichte Vektoren für semantische Suche und RAG umwandelt.