Low latency сервер

Low latency сервер (сервер с низкой задержкой) — серверная система, аппаратно и программно оптимизированная для минимизации времени отклика. Задержка (latency) измеряется в миллисекундах или микросекундах и включает время обработки запроса, передачи данных по сети и ответа приложения. Для алгоритмической торговли, онлайн-игр и систем реального времени каждая миллисекунда задержки влияет на результат.

Как работает оптимизация задержки

Оптимизация начинается на уровне аппаратного обеспечения. NVMe SSD с задержкой чтения 50–100 мкс против 500–3000 мкс у SATA SSD. Сетевые карты с поддержкой RDMA (Remote Direct Memory Access) передают данные между серверами, минуя ядро ОС, — задержка снижается до 1–3 мкс против 50–200 мкс через стандартный TCP-стек. Процессоры высокой тактовой частоты с отключённым CPU governor в режиме «performance» убирают задержки, связанные с динамическим масштабированием частоты.

На уровне ОС применяются: ядро Linux с патчами PREEMPT_RT для детерминированного времени отклика, изоляция ядер процессора через isolcpus=2,3 в параметрах ядра, отключение Hyper-Threading (прерывания от SMT добавляют непредсказуемую задержку), использование huge pages (2 МБ) для снижения промахов TLB. В сети — TCP_NODELAY для отключения алгоритма Нэйгла (Nagle), SO_BUSY_POLL для busy-polling сетевого интерфейса вместо прерываний, jumbo frames (MTU 9000) для уменьшения числа пакетов.

Технологии kernel bypass networking

Для максимальной производительности используется обход ядра ОС при обработке сетевых пакетов:

DPDK (Data Plane Development Kit) — фреймворк Intel для обработки пакетов в userspace. Задержка 100–500 нс против 50–200 мкс через ядро. Используется в HFT и телекоме.
RDMA over Converged Ethernet (RoCE) — RDMA через Ethernet. Задержка 1–5 мкс. Требует поддержки в NIC (Mellanox ConnectX, Intel 700 series).
io_uring — асинхронный I/O Linux 5.1+. Снижает системные вызовы при операциях ввода-вывода через shared ring buffer.

История

Требования к low latency сформировались в HFT (High-Frequency Trading) в начале 2000-х. В 2010 году компания Spread Networks проложила прямой оптоволоконный кабель Чикаго–Нью-Йорк, сократив задержку с 17 до 13 мс — специально для HFT. К 2012 году HFT составлял 70% объёма биржевой торговли США. В 2013 году появились коммерческие предложения colocation в 10 м от биржевых серверов NYSE. С 2015 года технологии low latency распространились на облачные игры, AR/VR и IoT-системы реального времени.

Компоненты low latency стека

Colocation — физическое размещение сервера в дата-центре, максимально близком к клиентам или биржевым шлюзам. 10 км оптики = 0,05 мс задержки.
Kernel bypass networking — DPDK или RDMA обходят ядро ОС при обработке пакетов.
NVMe SSD / Intel Optane — задержка Optane P4800X: 10 мкс против 50–100 мкс у NVMe.
FPGA-акселераторы — Xilinx/AMD Alveo, Intel Arria: обработка рыночных данных за 100–500 нс.
Anycast — маршрутизация к ближайшему узлу по BGP для минимизации hop-count.

Применение в хостинге

На VDS и выделенных серверах низкая задержка критична для нескольких задач. Игровые серверы Counter-Strike, Valorant, Dota 2 — требуют менее 5 мс между игроком и сервером; 20+ мс приводят к заметному lag. Брокерские API с WebSocket-соединениями — задержка 1–5 мс к биржевому шлюзу. VoIP/видеоконференции — задержка более 150 мс делает разговор некомфортным, более 300 мс — неприемлемым. При выборе хостинга под low latency задачи ключевой параметр — физическое расстояние до целевой аудитории, наличие прямых пиринговых соединений через MSK-IX или DE-CIX и гарантированные IOPS без «соседей» на дисковой подсистеме.

Как работает оптимизация задержки

Технологии kernel bypass networking

История

Компоненты low latency стека

Применение в хостинге

Другие термины