HyDE (Hypothetical Document Embeddings)
Retrieval-Technik, die ein LLM nutzt, um hypothetische Antwortdokumente zu generieren und als Suchanfrage einzusetzen.
HyDE lässt ein Sprachmodell eine hypothetische Antwort auf die Anfrage generieren, einbettet diese und sucht damit ähnliche echte Dokumente. Das überbrückt den Stil-Gap zwischen kurzen Anfragen und langen Dokumenten.
Die Intuition dahinter: Ein hypothetisches Antwortdokument ähnelt im Embedding-Raum echten relevanten Dokumenten mehr als die kurze Anfrage selbst.
HyDE verbessert das Retrieval bei Anfragen, die sich sehr von der Sprache der indizierten Dokumente unterscheiden. Bei präzisen Faktenfragen kann es durch Halluzinationen im hypothetischen Dokument schaden.
Verwandte Begriffe
- Retrieval-Augmented Generation (RAG)
Architektur, die Sprachmodelle mit externer Wissenssuche kombiniert, um Antworten zu verankern.
- Semantische Suche
Suche, die Bedeutungsähnlichkeit statt Schlüsselwort-Übereinstimmung nutzt, um relevante Ergebnisse zu finden.
- Embedding-Modell
Spezialisiertes Modell, das Texte in dichte Vektoren für semantische Suche und RAG umwandelt.
- Large Language Model (LLM)
Ein großes, auf Text trainiertes Sprachmodell — das Fundament moderner generativer KI.