Retrieval & RAG

Reranker

Modell, das initial abgerufene Dokumente nach tatsächlicher Relevanz zur Anfrage neu sortiert.

Reranker sind Cross-Encoder-Modelle, die Anfrage und Dokument gemeinsam verarbeiten und eine Relevanzpunktzahl ausgeben. Sie sind genauer als Bi-Encoder-basiertes Retrieval, aber langsamer.

In einer typischen Pipeline ruft ein schneller Bi-Encoder viele Kandidaten ab; der Reranker bewertet die Top-Kandidaten präziser und sortiert sie um. So entsteht Effizienz durch Zweistufigkeit.

Reranker kompensieren Schwächen des initialen Retrievals: Dokumente, die semantisch ähnlich klingen, aber nicht relevant sind, werden heruntergestuft; echte Treffer werden hochgestuft.

Reranker

Verwandte Begriffe