SLA (соглашение об уровне услуг)

SLA (Service Level Agreement, соглашение об уровне услуг) — документ, описывающий гарантии провайдера клиенту: показатели доступности, время реакции поддержки, порядок компенсации при нарушении. Основа деловых отношений между хостинг-провайдером и клиентом.

Ключевые метрики SLA

Uptime (доступность) — процент времени, когда сервер доступен. Стандартные значения:

99% — до 87.6 часов простоя в год
99.9% — до 8.76 часов в год («три девятки»)
99.95% — до 4.38 часов в год
99.99% — до 52.6 минут в год («четыре девятки»)
99.999% — до 5.26 минут в год («пять девяток»)

Для большинства бизнесов 99.9% достаточно. Для финтеха и медицины — 99.99%+.

Как работает

Провайдер измеряет доступность через мониторинговые зонды снаружи и изнутри дата-центра. При недостижении гарантированного uptime клиент получает компенсацию: кредит на счёт пропорционально времени простоя. Пример: SLA 99.9%, простой 3 часа → компенсация 3/730 × стоимость месяца ≈ 0.4% от месячного платежа. Компенсация редко покрывает реальный ущерб от простоя — SLA не страховка, а ориентир качества.

История

SLA появились в телекоммуникациях в 1980-х: операторы гарантировали качество выделенных линий. В IT перешли с корпоративными центрами обработки данных в 1990-х. Первые SLA хостинг-провайдеров — середина 1990-х. Кризис надёжности 2000-х («а что если сервер упадёт?») сделал SLA стандартным маркетинговым инструментом. ITIL (IT Infrastructure Library) формализовал SLA как практику управления IT-услугами.

Компоненты SLA хостинга

Network uptime — доступность сетевой инфраструктуры.
Hardware uptime — доступность физического оборудования.
Время реакции поддержки — первый ответ за N минут/часов.
Время решения инцидента — SLA по категориям: критический (2 часа), высокий (8 часов), средний (24 часа).
RTO/RPO — параметры восстановления для managed-сервисов.

SLA vs SLO

SLA — внешнее соглашение с клиентом, юридически обязывающее. SLO (Service Level Objective) — внутренняя цель команды, обычно жёстче SLA. Если SLA = 99.9%, команда может установить SLO = 99.95% — запас на реакцию при деградации. Инциденты классифицируются по влиянию на SLO, а не на SLA — это позволяет реагировать до нарушения внешних обязательств.

На что обращать внимание

Читайте SLA внимательно: исключения часто включают плановые работы, форс-мажоры, DDoS-атаки. Время простоя до 1-5 минут может не учитываться. Механизм компенсации: автоматическое зачисление или по запросу? Срок подачи заявки. Многие SLA платных тарифов лучше бесплатных — проверяйте конкретные цифры. Мониторинг с исторической доступностью — ваша независимая метрика для подтверждения нарушений SLA.

Финансовая компенсация на практике

Расчёт компенсации: SLA 99.9%, VPS стоимостью 1000 ₽/мес, простой 5 часов. Допустимый простой 8.76 часов → превышение 0 часов (5 < 8.76). Компенсации нет! Провайдер не нарушил SLA. При простое 10 часов: превышение 10-8.76=1.24 часа → 1.24/730 × 1000 ≈ 1.7 ₽ компенсации. Это подтверждает: SLA — не страховой полис, а индикатор качества.

Реальная защита — BCP с hot/warm standby: при падении основного VPS трафик переключается на резервный за секунды без зависимости от времени реакции провайдера. Мониторинг собственными силами (Uptime Robot, Grafana) — независимая фиксация простоев для споров с провайдером.