SLA (Service Level Agreement, соглашение об уровне услуг) — документ, описывающий гарантии провайдера клиенту: показатели доступности, время реакции поддержки, порядок компенсации при нарушении. Основа деловых отношений между хостинг-провайдером и клиентом.
Ключевые метрики SLA
Uptime (доступность) — процент времени, когда сервер доступен. Стандартные значения:
- 99% — до 87.6 часов простоя в год
- 99.9% — до 8.76 часов в год («три девятки»)
- 99.95% — до 4.38 часов в год
- 99.99% — до 52.6 минут в год («четыре девятки»)
- 99.999% — до 5.26 минут в год («пять девяток»)
Для большинства бизнесов 99.9% достаточно. Для финтеха и медицины — 99.99%+.
Как работает
Провайдер измеряет доступность через мониторинговые зонды снаружи и изнутри дата-центра. При недостижении гарантированного uptime клиент получает компенсацию: кредит на счёт пропорционально времени простоя. Пример: SLA 99.9%, простой 3 часа → компенсация 3/730 × стоимость месяца ≈ 0.4% от месячного платежа. Компенсация редко покрывает реальный ущерб от простоя — SLA не страховка, а ориентир качества.
История
SLA появились в телекоммуникациях в 1980-х: операторы гарантировали качество выделенных линий. В IT перешли с корпоративными центрами обработки данных в 1990-х. Первые SLA хостинг-провайдеров — середина 1990-х. Кризис надёжности 2000-х («а что если сервер упадёт?») сделал SLA стандартным маркетинговым инструментом. ITIL (IT Infrastructure Library) формализовал SLA как практику управления IT-услугами.
Компоненты SLA хостинга
- Network uptime — доступность сетевой инфраструктуры.
- Hardware uptime — доступность физического оборудования.
- Время реакции поддержки — первый ответ за N минут/часов.
- Время решения инцидента — SLA по категориям: критический (2 часа), высокий (8 часов), средний (24 часа).
- RTO/RPO — параметры восстановления для managed-сервисов.
SLA vs SLO
SLA — внешнее соглашение с клиентом, юридически обязывающее. SLO (Service Level Objective) — внутренняя цель команды, обычно жёстче SLA. Если SLA = 99.9%, команда может установить SLO = 99.95% — запас на реакцию при деградации. Инциденты классифицируются по влиянию на SLO, а не на SLA — это позволяет реагировать до нарушения внешних обязательств.
На что обращать внимание
Читайте SLA внимательно: исключения часто включают плановые работы, форс-мажоры, DDoS-атаки. Время простоя до 1-5 минут может не учитываться. Механизм компенсации: автоматическое зачисление или по запросу? Срок подачи заявки. Многие SLA платных тарифов лучше бесплатных — проверяйте конкретные цифры. Мониторинг с исторической доступностью — ваша независимая метрика для подтверждения нарушений SLA.
Финансовая компенсация на практике
Расчёт компенсации: SLA 99.9%, VPS стоимостью 1000 ₽/мес, простой 5 часов. Допустимый простой 8.76 часов → превышение 0 часов (5 < 8.76). Компенсации нет! Провайдер не нарушил SLA. При простое 10 часов: превышение 10-8.76=1.24 часа → 1.24/730 × 1000 ≈ 1.7 ₽ компенсации. Это подтверждает: SLA — не страховой полис, а индикатор качества.
Реальная защита — BCP с hot/warm standby: при падении основного VPS трафик переключается на резервный за секунды без зависимости от времени реакции провайдера. Мониторинг собственными силами (Uptime Robot, Grafana) — независимая фиксация простоев для споров с провайдером.