Hot-swap (горячая замена) — возможность заменить аппаратный компонент работающего сервера без его выключения и без прерывания работы приложений. Наиболее важна для жёстких дисков, блоков питания и вентиляторов охлаждения. В дата-центрах с требованием SLA 99,99% (52 минуты простоя в год) hot-swap — стандарт, а не опция.
Как работает hot-swap
Шасси сервера с поддержкой hot-swap имеет специальные разъёмы с блокировками и датчиками. При извлечении диска контроллер получает сигнал об отключении устройства, корректно завершает операции и помечает диск как offline. Новый диск вставляется в слот — контроллер обнаруживает его и инициализирует без участия пользователя. В RAID-массиве данные с нового диска восстанавливаются из оставшихся дисков автоматически (процесс rebuild, занимает часы при объёме ТБ+).
Для блоков питания hot-swap реализован через дублирование: сервер имеет 2+ блока питания (N+1 или 2N конфигурация). При отказе одного второй продолжает работу, первый извлекается и заменяется без выключения питания.
Типы компонентов с hot-swap
- Диски — самое распространённое применение. SATA, SAS, NVMe U.2 диски в серверных корзинах (backplane) с hot-swap разъёмами.
- Блоки питания (PSU) — стандарт для серверных шасси Tier III/IV.
- Вентиляторы — в серверах с избыточным охлаждением (N+1 вентиляторов).
- PCIe-карты — редкость, требует специального шасси с поддержкой PCIe hot-plug.
- RAM, CPU — Hot-plug RAM и Hot-plug CPU — отдельные технологии, доступные на серверах с ECC-памятью и специальными чипсетами.
Hot-swap vs Hot-plug
Термины часто смешиваются. Hot-swap подразумевает, что замена одного компонента другим происходит без прерывания сервиса — акцент на замену. Hot-plug — просто добавление нового компонента к работающей системе без перезагрузки. Все hot-swap устройства поддерживают hot-plug, но не наоборот: горячее добавление USB-накопителя — hot-plug, но не hot-swap в полном смысле.
Значение для хостинга
В среде хостинга hot-swap дисков критичен при работе с RAID 5/RAID 6/RAID 10. Без hot-swap замена вышедшего из строя диска требует планового простоя. С hot-swap: диск вышел из строя → hot spare автоматически начинает rebuild → администратор в рабочее время заменяет диск → rebuild продолжается. Сервис не прерывается.
История
Hot-swap для дисков стандартизирован в SCA-2 (Single Connector Attachment) в 1990-х годах для SCSI-массивов. SAS (Serial Attached SCSI) унаследовал hot-swap в 2004 году. SATA hot-swap через AHCI появился в 2004 году с Intel ICH6R. NVMe hot-swap через U.2/U.3 разъёмы появился в 2015–2018 годах, позволив горячую замену NVMe-дисков в серверах без форм-фактора M.2.
Hot-swap в облачных инфраструктурах
В облачных средах hot-swap реализован на уровне гипервизора: при отказе физического диска в СХД данные автоматически перераспределяются между оставшимися устройствами. Клиент не замечает этого — ВМ продолжает работу. Именно поэтому облачные провайдеры декларируют SLA 99,99%+ несмотря на отказы отдельных дисков.
Для собственного сервера в колокейшене hot-swap дисков критичен: сервис работает 24/7, замена при плановом простое требует согласования с владельцем. Hot-swap позволяет заменить диск в рабочее время, пока RAID обеспечивает избыточность. Без поддержки hot-swap в шасси даже замена одного диска требует выключения сервера.
Чек-лист при выборе сервера с hot-swap: поддержка hot-swap в RAID-контроллере (не только в шасси), наличие hot spare дисков, уведомления о сбоях через IPMI/SNMP.