Retrieval-Augmented Generation (RAG)
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
RAG ergänzt die Generierung eines Sprachmodells um eine Retrievalkomponente: Relevante Dokumente werden zuerst abgerufen und dann als Kontext in den Prompt eingefügt.
So können Modelle auf aktuelles oder unternehmensspezifisches Wissen zugreifen, das nicht im Training enthalten war. Halluzinationen werden durch Verankerung in Quelldokumenten reduziert.
RAG-Pipelines bestehen typischerweise aus Indexierung, Retrieval, Reranking und Generierung. Jede Stufe beeinflusst die Qualität der finalen Antwort und kann separat optimiert werden.
Verwandte Begriffe
- Vektordatenbank
Datenbanksystem, das hochdimensionale Vektoren speichert und effiziente Ähnlichkeitssuchen ermöglicht.
- Semantische Suche
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
- Reranker
Modell, das initial abgerufene Dokumente nach tatsächlicher Relevanz zur Anfrage neu sortiert.
- Embedding-Modell
Spezialisiertes Modell, das Texte in dichte Vektoren für semantische Suche und RAG umwandelt.