Latenz: Definition & Erklärung — Glossar
Was ist Latenz?
Latenz (engl. Latency) bezeichnet die Zeit, die vergeht, zwischen dem Absenden einer Anfrage und dem Erhalt der ersten Antwort. In Netzwerken ist es die Übertragungsverzögerung eines Datenpakets. In Anwendungen die Reaktionszeit auf eine Benutzeraktion. In Datenbanken die Zeit bis zur Antwort auf eine Abfrage. Latenz wird typischerweise in Millisekunden (ms) gemessen.
Arten von Latenz
Netzwerklatenz (Round-Trip-Time, RTT) misst die Zeit für einen Paket-Hin- und Rückweg. Festplattenlatenz bezeichnet die Zugriffszeit auf Speichermedien (SSD: ~0,1 ms, HDD: ~5 ms). Anwendungslatenz umfasst die gesamte Verarbeitungszeit einer Applikation. End-to-End-Latenz ist die vom Nutzer wahrgenommene Gesamtverzögerung, die alle Komponenten einschließt. Time to First Byte (TTFB) ist eine wichtige Web-Performance-Metrik.
Latenz und Nutzererfahrung
Google-Studien zeigen: Ladezeiten über 3 Sekunden führen dazu, dass 53 % der mobilen Nutzer eine Seite verlassen. Amazon berechnete, dass 100 ms zusätzliche Latenz 1 % Umsatzeinbuße bedeuten. Für interaktive Anwendungen gilt: unter 100 ms fühlt sich “sofort” an, 100–300 ms sind akzeptabel, über 1 Sekunde verliert der Nutzer den Fokusfluss. Echtzeit-Systeme (Trading, Spiele, Videokonferenzen) benötigen einstellige Millisekunden-Latenzen.
Latenz reduzieren
Maßnahmen zur Latenzreduzierung: CDN (Content Delivery Networks) liefern statische Assets vom nächstgelegenen Server. Caching auf verschiedenen Ebenen (Browser, CDN, Anwendung, Datenbank) vermeidet redundante Berechnungen. Datenbankoptimierung durch Indizes, Query-Optimierung und Verbindungs-Pooling. Asynchrone Verarbeitung verlagert zeitintensive Operationen aus dem Request-Pfad. Edge Computing bringt Verarbeitung näher an den Nutzer.