Retrieval-Technik, die ein LLM nutzt, um hypothetische Antwortdokumente zu generieren und als Suchanfrage einzusetzen.
HyDE lässt ein Sprachmodell eine hypothetische Antwort auf die Anfrage generieren, einbettet diese und sucht damit ähnliche echte Dokumente. Das überbrückt den Stil-Gap zwischen kurzen Anfragen und langen Dokumenten.
Die Intuition dahinter: Ein hypothetisches Antwortdokument ähnelt im Embedding-Raum echten relevanten Dokumenten mehr als die kurze Anfrage selbst.
HyDE verbessert das Retrieval bei Anfragen, die sich sehr von der Sprache der indizierten Dokumente unterscheiden. Bei präzisen Faktenfragen kann es durch Halluzinationen im hypothetischen Dokument schaden.
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
Spezialisiertes Modell, das Texte in dichte Vektoren für semantische Suche und RAG umwandelt.
Ein großes, auf Text trainiertes Sprachmodell — das Fundament moderner generativer KI.