Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
RAG ergänzt die Generierung eines Sprachmodells um eine Retrievalkomponente: Relevante Dokumente werden zuerst abgerufen und dann als Kontext in den Prompt eingefügt.
So können Modelle auf aktuelles oder unternehmensspezifisches Wissen zugreifen, das nicht im Training enthalten war. Halluzinationen werden durch Verankerung in Quelldokumenten reduziert.
RAG-Pipelines bestehen typischerweise aus Indexierung, Retrieval, Reranking und Generierung. Jede Stufe beeinflusst die Qualität der finalen Antwort und kann separat optimiert werden.
Datenbanksystem, das hochdimensionale Vektoren speichert und effiziente Ähnlichkeitssuchen ermöglicht.
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
Modell, das initial abgerufene Dokumente nach tatsächlicher Relevanz zur Anfrage neu sortiert.
Spezialisiertes Modell, das Texte in dichte Vektoren für semantische Suche und RAG umwandelt.