Retrieval & RAG

HyDE (Hypothetical Document Embeddings)

Retrieval-Technik, die ein LLM nutzt, um hypothetische Antwortdokumente zu generieren und als Suchanfrage einzusetzen.

HyDE lässt ein Sprachmodell eine hypothetische Antwort auf die Anfrage generieren, einbettet diese und sucht damit ähnliche echte Dokumente. Das überbrückt den Stil-Gap zwischen kurzen Anfragen und langen Dokumenten.

Die Intuition dahinter: Ein hypothetisches Antwortdokument ähnelt im Embedding-Raum echten relevanten Dokumenten mehr als die kurze Anfrage selbst.

HyDE verbessert das Retrieval bei Anfragen, die sich sehr von der Sprache der indizierten Dokumente unterscheiden. Bei präzisen Faktenfragen kann es durch Halluzinationen im hypothetischen Dokument schaden.

HyDE (Hypothetical Document Embeddings)

Verwandte Begriffe