Latency (задержка)

Latency (задержка) — временной интервал между инициацией запроса и началом получения ответа. Это не то же самое, что пропускная способность (bandwidth): широкий канал при высокой задержке всё равно медленно отвечает на первый байт. В хостинге выделяют несколько видов задержки: сетевую (network latency), дисковую (disk/storage latency) и задержку приложения (application latency).

Виды задержки

Сетевая задержка (RTT). Измеряется утилитой ping в миллисекундах. Складывается из:

Propagation delay — скорость распространения сигнала (в меди ~200 000 км/с, оптике ~200 000 км/с). Между Москвой и Нью-Йорком минимальная физическая задержка ~40 мс.
Transmission delay — время сериализации пакета в канал (зависит от полосы).
Processing delay — обработка пакета на маршрутизаторах.
Queuing delay — ожидание в очередях при перегрузке.

Дисковая задержка. HDD — 5-15 мс (механическое позиционирование). SATA SSD — 0,1-0,5 мс. NVMe — 0,02-0,1 мс. NAS по NFS добавляет сетевую задержку: 0,5-2 мс. Для баз данных разница между HDD и NVMe — десятикратная и более по IOPS.

TTFB (Time to First Byte). Задержка от HTTP-запроса до получения первого байта ответа. Включает DNS-резолвинг, TCP-хендшейк, TLS-хендшейк, обработку запроса сервером. Google PageSpeed учитывает TTFB как один из сигналов качества хостинга. Рекомендуемый TTFB — <200 мс для пользователей в регионе сервера.

История

Понятие сетевой задержки зафиксировано с появлением ARPANET в 1969 году. Первое задокументированное измерение RTT датируется 1969 годом: при первой передаче данных между UCLA и SRI задержка составила несколько сотен миллисекунд. Термин «latency» в компьютерных науках применяется как минимум с 1960-х в контексте памяти (memory latency). В 1990-х осознание latency как ключевой метрики web-производительности совпало с ростом интернета.

Latency и SEO

Google официально включил LCP (Largest Contentful Paint) в Core Web Vitals. LCP зависит от TTFB, который напрямую связан с задержкой хостинга. Для сайта с аудиторией в России идеально размещать сервер в московском дата-центре (RTT от пользователя — 5-20 мс) вместо европейского (40-80 мс) или американского (100-180 мс). CDN снижает latency для статического контента, но не для динамических запросов к СУБД.

На что обращать внимание

При выборе хостинга ориентируйтесь не на заявленную полосу, а на реальную задержку до сервера из целевого региона. Инструменты: ping, mtr (объединяет ping и traceroute), curl -w "%{time_starttransfer}" для TTFB. Для баз данных критична не только сетевая задержка, но и тип хранилища: на SSD/NVMe PostgreSQL выполняет в 10-50 раз больше операций в секунду, чем на HDD.

Типичные ошибки при оценке задержки

Первая ошибка — путать RTT и TTFB. RTT — время туда-обратно на сетевом уровне (ping). TTFB включает RTT + время обработки запроса сервером. Оптимизировать TTFB можно через кэширование: reverse proxy (Nginx, Varnish) кэширует ответы и снижает TTFB до 5–20 мс. Вторая ошибка — оценивать задержку по среднему без анализа процентилей: avg=50 мс при p99=2000 мс означает, что 1% пользователей ждут 2 секунды. Используйте инструменты мониторинга с гистограммами (Prometheus + Grafana).

Виды задержки

История

Latency и SEO

На что обращать внимание

Типичные ошибки при оценке задержки

Другие термины