LLM-Konzepte

Temperatur

Sampling-Parameter, der die Zufälligkeit der Token-Auswahl steuert — höher bedeutet kreativer.

Die Temperatur skaliert die Logits eines Sprachmodells vor der Softmax-Transformation. Ein Wert nahe null macht die Ausgabe deterministisch (das wahrscheinlichste Token wird fast immer gewählt), hohe Werte verflachen die Verteilung.

Bei kreativen Aufgaben wie Storytelling können höhere Temperaturen vielfältigere Ausgaben erzeugen. Für präzise Aufgaben wie Code-Generierung oder faktische Fragen sind niedrige Temperaturen vorzuziehen.

Temperatur interagiert mit anderen Sampling-Parametern wie Top-p und Top-k. In der Praxis werden diese oft kombiniert, um eine Balance zwischen Kohärenz und Vielfalt zu erreichen.

Temperatur

Verwandte Begriffe

Temperatur

Verwandte Begriffe