====== Резервирование и архитектуры надёжности ======
Раздел обобщает принципы обеспечения надёжности электроснабжения ЦОД: устойчивость внешней сети (СН/ВН), сценарии отказов, требования к ИБП и ДГУ, а также сравнительный анализ основных топологий резервирования (N, N+1, 2N, распределённые схемы). Материал адаптирован под РФ с учётом типовых характеристик сетей и нормативов.
===== 1. Устойчивость архитектуры ЦОД ======
Надёжность электроснабжения ЦОД определяется:
* качеством внешней сети (СН/ВН);
* глубиной резервирования внутри объекта;
* скоростью восстановления при авариях;
* устойчивостью распределительных схем к одиночным отказам (single failure points).
===== 2. Надёжность внешнего электроснабжения ======
==== 2.1. Топология сетей страны ====
В типовой энергосистеме используются три уровня:
* **HV transmission (110–500 кВ)** — кольцевая/ячеистая топология с генерацией сотен МВт.
* **HV/MV sub-transmission (35–110 кВ)** — преимущественно кольцевая схема питания подстанций.
* **MV distribution (6–10–20 кВ)** — открытые или частично кольцевые распределительные сети.
* **LV distribution (0,4 кВ)** — радиальные сети для конечных потребителей.
Кольцевые HV-сети в РФ имеют высокую устойчивость к одиночным отказам, но MV-сети часто работают в «квази-радиальном» режиме и дают основную часть кратковременных перерывов.
==== 2.2. Типовые частоты отказов (по данным Schneider Electric / адаптация под РФ) ====
^ Тип отказа ^ Подключение к MV ^ Подключение к HV ^
| Региональное отключение >4 ч | 0,01–0,02/год | 0,01–0,02/год |
| Длительные отключения >3 мин | 0,5–5/год (в РФ в городах: 1–3/год) | 0,1/год |
| Короткие перерывы <3 мин | 0,5–20/год | 0,5–5/год |
| Глубокие провалы напряжения | 10–30/год | 5–15/год |
При подключении ЦОД к MV (6–10 кВ) вероятность кратких перерывов и провалов выше в 2–5 раз по сравнению с HV. Поэтому при мощностях >10 МВт в РФ рекомендуется HV-ввод 35–110 кВ.
==== 2.3. Поведение сети при аварии ====
**На HV-уровне (35–110–220 кВ):**
* очистка КЗ за 100–200 мс без отключения большинства потребителей;
* при сложных авариях — переключения подстанций без потери питания;
* перезапуск после полного отключения занимает несколько часов.
**На MV-уровне (6–10 кВ):**
* ликвидация КЗ за 150–500 мс;
* возможны повторные автоматические включения (АПВ);
* восстановление питания требует поиска повреждённого участка.
===== 3. Резервирование при кратковременных нарушениях ======
Для провалов/перерывов <3 мин применяется ИБП.
==== 3.1. Технологии ИБП ====
^ Тип ИБП ^ Особенности ^ Применение в ЦОД ^
| **Статические AC ИБП** | Двойное преобразование, батареи, высокий КПД | 90% ЦОД, стандарт |
| **Ротарные AC ИБП** | Аккумуляция на маховике + генератор | Объекты >10 МВт, высокая кратковременная мощность |
| **Статические DC ИБП** | Переход на DC-распределение | Перспективные решения с высокой эффективностью |
| **ИБП на уровне стойки** | Актуально для edge / HPC | Децентрализация, снижение PDU-рисков |
Автономность ИБП определяется временем запуска ДГУ (8–15 с в РФ) и длительностью стабилизации частоты/напряжения.
===== 4. Резервирование при длительных нарушениях ======
Длительные перерывы (>3 мин) покрываются **дизель-генераторными установками (ДГУ)**.
==== 4.1. Архитектура ДГУ ====
ДГУ → Автоматика запуска (PLC) → АВР/ATS → НН/СН щиты → ИТ-нагрузка
Полный запуск ДГУ в РФ: 8–12 с (пуск) + 5–10 с стабилизация → суммарно 10–20 секунд.
==== 4.2. Особенности резервирования ДГУ ====
* резервирование по схеме N+1 или N+2;
* расход топлива 180–220 г/кВт·ч;
* объём аварийного резерва — минимум 8–12 ч при 75% нагрузки;
* дневные баки 1–2 ч → основная ёмкость в цистернах/резервуарах.
===== 5. Внутренние архитектуры электроснабжения и топологии ======
Надёжность внутри ЦОД определяется топологией распределения.
==== 5.1. Основные классы топологий ====
^ Топология ^ Описание ^ Уровень надёжности ^ Комментарий ^
| **N** | Нет резервирования | Низкий | Одиночный отказ вызывает останов ИТ |
| **N+1** | Один резервный модуль | Средний | Один отказ не приводит к остановке |
| **2N** | Полностью независимые цепочки A и B | Высокий | Нет общих точек отказа |
| **N+N** | Две активные цепочки одинаковой мощности | Очень высокий | Дороже 2N, лучше баланс нагрузки |
| **Распределённая N+1** | Несколько систем, резерв равномерно распределён | Высокий | Оптимально для ЦОД 5–20 МВт |
| **DRUPS** | Ротарные ИБП+генератор в одном блоке | Высокий | Для крупных ЦОД, дорогая инфраструктура |
===== 6. Подробный разбор топологий ======
==== 6.1. Топология N (базовая) ====
Любой отказ приводит к отключению нагрузки. Применяется только в малых объектов или второстепенных зонах.
==== 6.2. Топология 2N ====
Характеристики:
* два полностью независимых тракта питания А и B;
* два ввода, две секции РУ, две системы ИБП, два ДГУ-парка;
* каждая стойка имеет два ввода.
Преимущества:
* отсутствие единичных точек отказа;
* полная ремонтопригодность.
Недостатки:
* CAPEX +80–120%;
* повышенный OPEX за счёт удвоения оборудования.
==== 6.3. Топология N+N ====
Разновидность 2N, где обе ветви активны.
Преимущество — баланс нагрузки на 50/50 → сниженные потери.
==== 6.4. Топология N+1 (блочная) ====
Каждый блок ИБП/ДГУ имеет один резерв.
Если один блок выходит из строя — нагрузка распределяется на остальные.
Преимущества:
* оптимально для ЦОД 1–10 МВт;
* более низкая стоимость, чем 2N.
Недостатки:
* риск перегрузки при отказах нескольких элементов;
* сложная логика распределения нагрузок.
==== 6.5. Распределённая топология N+1 ====
Каждый ИБП обслуживает сегмент нагрузки и имеет резервную способность.
Преимущества:
* равномерное распределение риска;
* гибкость масштабирования;
* CAPEX ниже 2N на 30–40%.
Используется в ЦОД 5–20 МВт (в РФ — наиболее распространённая).
==== 6.6. DRUPS (Diesel Rotary UPS) ====
Особенности:
* совмещает ИБП и роторный накопитель с ДГУ;
* высокая устойчивость к кратким помехам;
* часто используется в Tier III/IV ЦОД в Азии и Европе.
В РФ применяется редко из-за высокой стоимости и сложности обслуживания.
===== 7. Ошибки при трактовке «полной отказоустойчивости» ======
Типичная ошибка пользователей — считать схему N+1 полной отказоустойчивой.
Полная fault tolerance обеспечивается только архитектурами 2N или N+N.
===== 8. Отключение одного тракта двойного питания ======
На практике заказчики требуют:
* возможность полного отключения тракта А без потери питания стойки;
* выполнение регламентов без уменьшения резервирования.
Это приводит к:
* удорожанию РУ (дополнительные обходные ячейки);
* увеличению трудозатрат на обслуживание;
* росту рисков при техническом обслуживании (отключение защиты, обходы).
===== 9. Сравнение архитектур ======
^ Топология ^ CAPEX ^ OPEX ^ Надёжность ^ Масштабируемость ^ Сложность эксплуатации ^
| N | низкий | низкий | низкая | высокая | низкая |
| N+1 | средний | средний | средняя | высокая | средняя |
| 2N | высокий | высокий | высокая | средняя | высокая |
| N+N | очень высокий | высокий | очень высокая | средняя | высокая |
| N+1 распределённая | средний | средний | высокая | высокая | средняя |
| DRUPS | очень высокий | низкий | высокая | низкая | высокая |
===== Ключевые идеи =====
* Устойчивость внешней сети определяет выбор точки присоединения: MV для 1–10 МВт, HV для 10+ МВт.
* ИБП покрывают временной разрыв до запуска ДГУ.
* Для Tier III/IV фактически требуется 2N или распределённое N+1 с полной ликвидацией единичных точек отказа.
* Блочная N+1 — оптимальный баланс стоимости и надёжности для большинства проектов в РФ.
* DRUPS актуален только для крупных объектов (>20 МВт).
* Топология должна учитывать не только аварии, но и регламентные отключения — они создают до 60% рисков.