Zum Glossar
Infrastruktur

Edge Inference

Ausführung von KI-Modellen direkt auf Endgeräten ohne Verbindung zu Cloud-Servern.

Edge Inference führt KI-Modelle auf Smartphones, Laptops, IoT-Geräten oder lokalen Servern aus. Das eliminiert Netzwerk-Latenz und ermöglicht Offline-Betrieb sowie höheren Datenschutz.

Die begrenzte Rechenleistung und Speicher von Endgeräten erfordern stark optimierte Modelle. Quantisierung, Pruning und Destillation sind zentrale Techniken für effiziente Edge-Modelle.

Apple Neural Engine, Qualcomm NPU und ähnliche dedizierte KI-Beschleuniger in modernen Chips ermöglichen energieeffiziente Inferenz auf mobilen Geräten ohne Cloud-Abhängigkeit.

Verwandte Begriffe