Low latency сервер (сервер с низкой задержкой) — серверная система, аппаратно и программно оптимизированная для минимизации времени отклика. Задержка (latency) измеряется в миллисекундах или микросекундах и включает время обработки запроса, передачи данных по сети и ответа приложения. Для алгоритмической торговли, онлайн-игр и систем реального времени каждая миллисекунда задержки влияет на результат.
Как работает оптимизация задержки
Оптимизация начинается на уровне аппаратного обеспечения. NVMe SSD с задержкой чтения 50–100 мкс против 500–3000 мкс у SATA SSD. Сетевые карты с поддержкой RDMA (Remote Direct Memory Access) передают данные между серверами, минуя ядро ОС, — задержка снижается до 1–3 мкс против 50–200 мкс через стандартный TCP-стек. Процессоры высокой тактовой частоты с отключённым CPU governor в режиме «performance» убирают задержки, связанные с динамическим масштабированием частоты.
На уровне ОС применяются: ядро Linux с патчами PREEMPT_RT для детерминированного времени отклика, изоляция ядер процессора через isolcpus=2,3 в параметрах ядра, отключение Hyper-Threading (прерывания от SMT добавляют непредсказуемую задержку), использование huge pages (2 МБ) для снижения промахов TLB. В сети — TCP_NODELAY для отключения алгоритма Нэйгла (Nagle), SO_BUSY_POLL для busy-polling сетевого интерфейса вместо прерываний, jumbo frames (MTU 9000) для уменьшения числа пакетов.
Технологии kernel bypass networking
Для максимальной производительности используется обход ядра ОС при обработке сетевых пакетов:
- DPDK (Data Plane Development Kit) — фреймворк Intel для обработки пакетов в userspace. Задержка 100–500 нс против 50–200 мкс через ядро. Используется в HFT и телекоме.
- RDMA over Converged Ethernet (RoCE) — RDMA через Ethernet. Задержка 1–5 мкс. Требует поддержки в NIC (Mellanox ConnectX, Intel 700 series).
- io_uring — асинхронный I/O Linux 5.1+. Снижает системные вызовы при операциях ввода-вывода через shared ring buffer.
История
Требования к low latency сформировались в HFT (High-Frequency Trading) в начале 2000-х. В 2010 году компания Spread Networks проложила прямой оптоволоконный кабель Чикаго–Нью-Йорк, сократив задержку с 17 до 13 мс — специально для HFT. К 2012 году HFT составлял 70% объёма биржевой торговли США. В 2013 году появились коммерческие предложения colocation в 10 м от биржевых серверов NYSE. С 2015 года технологии low latency распространились на облачные игры, AR/VR и IoT-системы реального времени.
Компоненты low latency стека
- Colocation — физическое размещение сервера в дата-центре, максимально близком к клиентам или биржевым шлюзам. 10 км оптики = 0,05 мс задержки.
- Kernel bypass networking — DPDK или RDMA обходят ядро ОС при обработке пакетов.
- NVMe SSD / Intel Optane — задержка Optane P4800X: 10 мкс против 50–100 мкс у NVMe.
- FPGA-акселераторы — Xilinx/AMD Alveo, Intel Arria: обработка рыночных данных за 100–500 нс.
- Anycast — маршрутизация к ближайшему узлу по BGP для минимизации hop-count.
Применение в хостинге
На VDS и выделенных серверах низкая задержка критична для нескольких задач. Игровые серверы Counter-Strike, Valorant, Dota 2 — требуют менее 5 мс между игроком и сервером; 20+ мс приводят к заметному lag. Брокерские API с WebSocket-соединениями — задержка 1–5 мс к биржевому шлюзу. VoIP/видеоконференции — задержка более 150 мс делает разговор некомфортным, более 300 мс — неприемлемым. При выборе хостинга под low latency задачи ключевой параметр — физическое расстояние до целевой аудитории, наличие прямых пиринговых соединений через MSK-IX или DE-CIX и гарантированные IOPS без «соседей» на дисковой подсистеме.