RAID 5 (Redundant Array of Independent Disks, level 5) — массив из минимум 3 дисков, где данные и информация чётности распределены по всем дискам. При отказе одного диска данные восстанавливаются из оставшихся дисков и блоков чётности. Полезная ёмкость: (N-1) дисков, где N — общее число дисков в массиве.
Как работает RAID 5
Данные делятся на полосы (stripe). Каждая полоса записывается на N-1 дисков, а N-й диск хранит XOR-чётность. При следующей полосе роль диска чётности смещается по кругу (rotating parity). Это равномерно распределяет нагрузку записи. При отказе диска X данные восстанавливаются через XOR всех оставшихся блоков.
Пример: RAID 5 из 3 дисков по 4 ТБ. Полезная ёмкость — 8 ТБ (66%). RAID 5 из 5 дисков по 4 ТБ — 16 ТБ полезных из 20 ТБ (80%). Чем больше дисков, тем выше КПД использования пространства.
Производительность RAID 5
Случайное чтение: близко к производительности отдельного диска × N (параллелизм). Последовательное чтение: быстро, данные читаются со всех дисков параллельно. Случайная запись: медленнее — каждая запись требует чтения старых данных и чётности, вычисления новой чётности, записи нового блока данных и новой чётности (операция Read-Modify-Write). Это называется «write penalty» и составляет 4 I/O на одну логическую запись. RAID-контроллер с кэшем снижает этот эффект.
RAID 5 vs RAID 6 и RAID 10
RAID 6 — два блока чётности, выдерживает отказ 2 дисков. Требует минимум 4 дисков, КПД N-2. RAID 6 предпочтительнее при дисках 4+ ТБ: вероятность второго отказа во время rebuild значительна (rebuild занимает 12–24 часа на 4 ТБ HDD). RAID 10 — зеркало + чередование. Требует чётное число дисков, КПД 50%. Значительно быстрее при записи, быстрый rebuild. Для баз данных с интенсивной записью RAID 10 предпочтительнее RAID 5.
RAID 5 в хостинге
RAID 5 используется для серверов хранения (NAS) с ёмкими HDD: КПД 66–80% при большом числе дисков. Для SSD-массивов с интенсивной записью (базы данных) RAID 5 не оптимален — write penalty + ограниченный ресурс SSD. RAID 10 на SSD — предпочтительный вариант для OLTP-нагрузок. Hot spare — диск-резерв, который автоматически заменяет вышедший из строя диск и начинает rebuild без участия администратора.
История RAID
Концепция RAID разработана Дэвидом Паттерсоном, Гарфом Гибсоном и Рэнди Кацем в 1987 году в Калифорнийском университете Беркли («A Case for Redundant Arrays of Inexpensive Disks»). RAID 5 описан в той же статье. Первые коммерческие RAID-контроллеры появились в 1988 году (CMI, StorTech). К середине 1990-х RAID стал стандартом серверного хранения.
RAID 5 vs RAID 6 vs RAID 10
RAID 6 — два блока чётности вместо одного. Выдерживает одновременный отказ двух дисков. Стоит 2 диска вместо 1 для защиты. Для массивов от 6 дисков RAID 6 предпочтительнее RAID 5 из-за риска «второго отказа» при rebuild. RAID 10 — зеркалирование + стриппинг. Вдвое меньше полезной ёмкости, но лучшая производительность записи и более быстрый rebuild. Для баз данных с интенсивной записью RAID 10 предпочтительнее RAID 5/6.
RAID Write Hole — уязвимость RAID 5 при внезапном отключении питания: данные и блок чётности могут оказаться рассинхронизированы. Решение: UPS + RAID-контроллер с BBU (Battery Backup Unit, аккумулятор для кэша записи).
RAID 5 и SSD: специфика
На SSD-дисках RAID 5 работает, но производители рекомендуют RAID 10: при rebuild SSD с ёмкостью 4 ТБ нагрузка на оставшиеся диски высокая — они могут достичь предела циклов записи раньше обычного. Enterprise SAS SSD с DWPD 3–5 справляются, но потребительские SSD под такой нагрузкой рискуют. NVMe RAID 5 через программный mdadm работает, но программный RAID уступает аппаратному по производительности записи.