LLM-Konzepte

Token

Kleinste Verarbeitungseinheit eines Sprachmodells — meist Wortteile, Wörter oder Satzzeichen.

Sprachmodelle verarbeiten Text nicht zeichenweise, sondern in Token-Einheiten. Ein Token entspricht je nach Sprache und Kontext einem Wort, einem Wortteil oder einzelnen Zeichen.

Tokenisierung beeinflusst, wie effizient ein Modell Texte verarbeitet. Komprimierte Sprachen wie Englisch benötigen weniger Token pro Information als agglutinative Sprachen.

Die Anzahl der Token im Kontextfenster bestimmt, wie viel Text ein Modell gleichzeitig verarbeiten kann. Kosten für API-Nutzung werden üblicherweise pro Token berechnet.

Token

Verwandte Begriffe

Token

Verwandte Begriffe