Lernverfahren, das ohne Labels Strukturen und Muster in ungekennzeichneten Daten entdeckt.
Unüberwachtes Lernen arbeitet ohne vordefinierte Ausgaben. Das Modell sucht eigenständig nach Mustern, Clustern oder kompakten Repräsentationen in den Rohdaten.
Wichtige Methoden sind Clustering wie k-Means, Dimensionsreduktion wie PCA und autoregressives Pretraining von Sprachmodellen. Letzteres ist technisch eine Form des selbstüberwachten Lernens.
Das Verfahren eignet sich besonders, wenn gelabelte Daten rar oder teuer sind. Durch vorgelerntes unüberwachtes Wissen können Modelle anschließend mit wenigen Labels feinabgestimmt werden.
Teilgebiet der KI, in dem Modelle Muster aus Daten lernen, ohne explizit programmiert zu werden.
Dichte Vektordarstellung von Text, Bildern oder anderen Daten in einem hochdimensionalen Raum.
Erste Trainingsphase, in der ein Modell auf riesigen Textmengen grundlegendes Sprach- und Weltwissen erwirbt.
Messbare Eigenschaft oder Variable, die einem Modell als Eingabeinformation dient.