Architektur

Rekurrentes Neuronales Netz (RNN)

Netzwerkarchitektur mit Zustandsspeicher für sequentielle Daten, weitgehend durch Transformer abgelöst.

RNNs verarbeiten Sequenzen schrittweise und halten einen verborgenen Zustand aufrecht, der Information aus vorherigen Zeitschritten kodiert. Sie waren lange der Standard für Sprachmodellierung und maschinelle Übersetzung.

Vanishing Gradients erschwerten das Lernen langer Abhängigkeiten. LSTM und GRU als Erweiterungen lösten dieses Problem durch Gating-Mechanismen, die selektiv Information speichern und vergessen.

Seit der Einführung von Transformers wurden RNNs in den meisten NLP-Aufgaben abgelöst. In ressourcenarmen Umgebungen und für Echtzeit-Streaming bleiben sequentielle Architekturen jedoch relevant.

Rekurrentes Neuronales Netz (RNN)

Verwandte Begriffe

Rekurrentes Neuronales Netz (RNN)

Verwandte Begriffe