hostprofi.ru
Подобрать хостинг
Термин·буква L

Low latency сервер

краткое определение

Low latency сервер — сервер с минимальной задержкой обработки и передачи данных, оптимизированный для приложений реального времени. Типичная задержка — менее 1 мс в пределах дата-центра, менее 10 мс между регионами.

Low latency сервер (сервер с низкой задержкой) — серверная система, аппаратно и программно оптимизированная для минимизации времени отклика. Задержка (latency) измеряется в миллисекундах или микросекундах и включает время обработки запроса, передачи данных по сети и ответа приложения. Для алгоритмической торговли, онлайн-игр и систем реального времени каждая миллисекунда задержки влияет на результат.

Как работает оптимизация задержки

Оптимизация начинается на уровне аппаратного обеспечения. NVMe SSD с задержкой чтения 50–100 мкс против 500–3000 мкс у SATA SSD. Сетевые карты с поддержкой RDMA (Remote Direct Memory Access) передают данные между серверами, минуя ядро ОС, — задержка снижается до 1–3 мкс против 50–200 мкс через стандартный TCP-стек. Процессоры высокой тактовой частоты с отключённым CPU governor в режиме «performance» убирают задержки, связанные с динамическим масштабированием частоты.

На уровне ОС применяются: ядро Linux с патчами PREEMPT_RT для детерминированного времени отклика, изоляция ядер процессора через isolcpus=2,3 в параметрах ядра, отключение Hyper-Threading (прерывания от SMT добавляют непредсказуемую задержку), использование huge pages (2 МБ) для снижения промахов TLB. В сети — TCP_NODELAY для отключения алгоритма Нэйгла (Nagle), SO_BUSY_POLL для busy-polling сетевого интерфейса вместо прерываний, jumbo frames (MTU 9000) для уменьшения числа пакетов.

Технологии kernel bypass networking

Для максимальной производительности используется обход ядра ОС при обработке сетевых пакетов:

  • DPDK (Data Plane Development Kit) — фреймворк Intel для обработки пакетов в userspace. Задержка 100–500 нс против 50–200 мкс через ядро. Используется в HFT и телекоме.
  • RDMA over Converged Ethernet (RoCE) — RDMA через Ethernet. Задержка 1–5 мкс. Требует поддержки в NIC (Mellanox ConnectX, Intel 700 series).
  • io_uring — асинхронный I/O Linux 5.1+. Снижает системные вызовы при операциях ввода-вывода через shared ring buffer.

История

Требования к low latency сформировались в HFT (High-Frequency Trading) в начале 2000-х. В 2010 году компания Spread Networks проложила прямой оптоволоконный кабель Чикаго–Нью-Йорк, сократив задержку с 17 до 13 мс — специально для HFT. К 2012 году HFT составлял 70% объёма биржевой торговли США. В 2013 году появились коммерческие предложения colocation в 10 м от биржевых серверов NYSE. С 2015 года технологии low latency распространились на облачные игры, AR/VR и IoT-системы реального времени.

Компоненты low latency стека

  • Colocation — физическое размещение сервера в дата-центре, максимально близком к клиентам или биржевым шлюзам. 10 км оптики = 0,05 мс задержки.
  • Kernel bypass networking — DPDK или RDMA обходят ядро ОС при обработке пакетов.
  • NVMe SSD / Intel Optane — задержка Optane P4800X: 10 мкс против 50–100 мкс у NVMe.
  • FPGA-акселераторы — Xilinx/AMD Alveo, Intel Arria: обработка рыночных данных за 100–500 нс.
  • Anycast — маршрутизация к ближайшему узлу по BGP для минимизации hop-count.

Применение в хостинге

На VDS и выделенных серверах низкая задержка критична для нескольких задач. Игровые серверы Counter-Strike, Valorant, Dota 2 — требуют менее 5 мс между игроком и сервером; 20+ мс приводят к заметному lag. Брокерские API с WebSocket-соединениями — задержка 1–5 мс к биржевому шлюзу. VoIP/видеоконференции — задержка более 150 мс делает разговор некомфортным, более 300 мс — неприемлемым. При выборе хостинга под low latency задачи ключевой параметр — физическое расстояние до целевой аудитории, наличие прямых пиринговых соединений через MSK-IX или DE-CIX и гарантированные IOPS без «соседей» на дисковой подсистеме.

Другие термины