Retrieval & RAG

Retrieval-Augmented Generation (RAG)

Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.

RAG ergänzt die Generierung eines Sprachmodells um eine Retrievalkomponente: Relevante Dokumente werden zuerst abgerufen und dann als Kontext in den Prompt eingefügt.

So können Modelle auf aktuelles oder unternehmensspezifisches Wissen zugreifen, das nicht im Training enthalten war. Halluzinationen werden durch Verankerung in Quelldokumenten reduziert.

RAG-Pipelines bestehen typischerweise aus Indexierung, Retrieval, Reranking und Generierung. Jede Stufe beeinflusst die Qualität der finalen Antwort und kann separat optimiert werden.

Retrieval-Augmented Generation (RAG)

Verwandte Begriffe