Evaluation

Perplexität (Perplexity)

Maß dafür, wie gut ein Sprachmodell eine Textsequenz vorhersagt — niedrigere Werte sind besser.

Perplexität ist das geometrische Mittel der inversen Wahrscheinlichkeit jedes Tokens in einem Testtext. Sie misst, wie überraschend der Text für das Modell ist.

Als intrinsische Metrik misst Perplexität die Modellqualität direkt auf Texten, ohne externe Aufgaben zu benötigen. Sie korreliert aber nicht immer mit der Downstream-Aufgabenleistung.

Perplexität ist modell- und tokenizer-spezifisch: Modelle mit unterschiedlichen Vokabularen können nicht direkt verglichen werden. Als Entwicklungsmetrik ist sie dennoch nützlich, um Training-Fortschritt zu verfolgen.

Perplexität (Perplexity)

Verwandte Begriffe

Perplexität (Perplexity)

Verwandte Begriffe