Latency (задержка) — временной интервал между инициацией запроса и началом получения ответа. Это не то же самое, что пропускная способность (bandwidth): широкий канал при высокой задержке всё равно медленно отвечает на первый байт. В хостинге выделяют несколько видов задержки: сетевую (network latency), дисковую (disk/storage latency) и задержку приложения (application latency).
Виды задержки
Сетевая задержка (RTT). Измеряется утилитой ping в миллисекундах. Складывается из:
- Propagation delay — скорость распространения сигнала (в меди ~200 000 км/с, оптике ~200 000 км/с). Между Москвой и Нью-Йорком минимальная физическая задержка ~40 мс.
- Transmission delay — время сериализации пакета в канал (зависит от полосы).
- Processing delay — обработка пакета на маршрутизаторах.
- Queuing delay — ожидание в очередях при перегрузке.
Дисковая задержка. HDD — 5-15 мс (механическое позиционирование). SATA SSD — 0,1-0,5 мс. NVMe — 0,02-0,1 мс. NAS по NFS добавляет сетевую задержку: 0,5-2 мс. Для баз данных разница между HDD и NVMe — десятикратная и более по IOPS.
TTFB (Time to First Byte). Задержка от HTTP-запроса до получения первого байта ответа. Включает DNS-резолвинг, TCP-хендшейк, TLS-хендшейк, обработку запроса сервером. Google PageSpeed учитывает TTFB как один из сигналов качества хостинга. Рекомендуемый TTFB — <200 мс для пользователей в регионе сервера.
История
Понятие сетевой задержки зафиксировано с появлением ARPANET в 1969 году. Первое задокументированное измерение RTT датируется 1969 годом: при первой передаче данных между UCLA и SRI задержка составила несколько сотен миллисекунд. Термин «latency» в компьютерных науках применяется как минимум с 1960-х в контексте памяти (memory latency). В 1990-х осознание latency как ключевой метрики web-производительности совпало с ростом интернета.
Latency и SEO
Google официально включил LCP (Largest Contentful Paint) в Core Web Vitals. LCP зависит от TTFB, который напрямую связан с задержкой хостинга. Для сайта с аудиторией в России идеально размещать сервер в московском дата-центре (RTT от пользователя — 5-20 мс) вместо европейского (40-80 мс) или американского (100-180 мс). CDN снижает latency для статического контента, но не для динамических запросов к СУБД.
На что обращать внимание
При выборе хостинга ориентируйтесь не на заявленную полосу, а на реальную задержку до сервера из целевого региона. Инструменты: ping, mtr (объединяет ping и traceroute), curl -w "%{time_starttransfer}" для TTFB. Для баз данных критична не только сетевая задержка, но и тип хранилища: на SSD/NVMe PostgreSQL выполняет в 10-50 раз больше операций в секунду, чем на HDD.
Типичные ошибки при оценке задержки
Первая ошибка — путать RTT и TTFB. RTT — время туда-обратно на сетевом уровне (ping). TTFB включает RTT + время обработки запроса сервером. Оптимизировать TTFB можно через кэширование: reverse proxy (Nginx, Varnish) кэширует ответы и снижает TTFB до 5–20 мс. Вторая ошибка — оценивать задержку по среднему без анализа процентилей: avg=50 мс при p99=2000 мс означает, что 1% пользователей ждут 2 секунды. Используйте инструменты мониторинга с гистограммами (Prometheus + Grafana).