Геораспределённый ЦОД — архитектура, при которой вычислительные ресурсы размещены минимум в двух физически удалённых дата-центрах, синхронизированных между собой. Расстояние между площадками — от нескольких километров (для синхронной репликации) до тысяч километров (для асинхронной).
Как работает
Между площадками организуется выделенный или арендованный канал (часто 10–100 Гбит/с DWDM). Данные реплицируются синхронно (RPO = 0, задержка растёт с расстоянием >100 км) или асинхронно (RPO > 0, расстояние не ограничено). При отказе основной площадки трафик переключается на резервную через DNS с коротким TTL или BGP anycast.
Синхронная репликация возможна на расстоянии до 100–150 км: скорость света в оптоволокне ограничивает round-trip time до 1–2 мс. При большем расстоянии используют асинхронную репликацию с потерей данных за несколько секунд при аварии.
Стратегии размещения
- Active-Passive — основная площадка обрабатывает все запросы, резервная ждёт. RTO несколько минут.
- Active-Active — обе площадки работают одновременно, нагрузка распределена. RTO = 0 (нет переключения).
- Pilot Light — на резервной площадке поддерживается минимальная конфигурация, расширяемая при аварии.
История
Концепция геораспределённости появилась в 1970-х в военных и финансовых системах США, где катастрофоустойчивость (disaster recovery) была критичной. Коммерческие решения появились в 1990-х с развитием аренды оптических каналов. В 2006 году Google ввёл термин «многорегиональные зоны» (multi-region) в публичное облако. В 2010-х облачные провайдеры — AWS, Azure, GCP — стандартизировали модель регионов и зон доступности (Availability Zones).
Связь с хостингом
При выборе облачного хостинга или колокации наличие геораспределения влияет на показатели SLA и аварийного восстановления. Хостинг на одной площадке не защищает от пожара, затопления или отключения электричества на целом объекте. Геораспределение — обязательное условие для банков, e-commerce и госсервисов по требованиям регуляторов (ЦБ РФ, ФСТЭК).
Геораспределённый ЦОД в практике
Геораспределённый ЦОД (geo-distributed datacenter) строится для нескольких целей: снижение задержек для региональных пользователей, Disaster Recovery при катастрофе в одном регионе, соответствие требованиям регуляторов разных стран. Репликация данных между ЦОД: синхронная (оба ЦОД получают запись одновременно, RPO=0) или асинхронная (с задержкой, RPO>0). Синхронная репликация возможна при задержке между ЦОД не более 5--10 мс (~500 км расстояния). Крупные российские хостеры (Selectel, DataLine) имеют ЦОД в Москве и Санкт-Петербурге — расстояние 700 км, задержка ~5 мс. Мультиклауд -- одна из форм геораспределённой инфраструктуры с использованием нескольких облачных провайдеров.
Технические решения для геораспределённого ЦОД
Для репликации данных между ЦОД используются: MySQL/PostgreSQL Streaming Replication (встроенная асинхронная репликация БД), Disaster Recovery через репликацию виртуальных машин (Zerto, Veeam), объектное хранилище с multi-region replication (S3-совместимые хранилища). Для балансировки трафика между регионами применяется GeoDNS — отдаёт разные A-записи в зависимости от геолокации пользователя. Anycast-маршрутизация позволяет одному IP-адресу обслуживаться разными серверами в зависимости от ближайшего узла. Геораспределённый ЦОД требует продуманной сетевой архитектуры и инструментов observability для диагностики межрегиональных проблем.