Содержание
Резервирование и архитектуры надёжности
Раздел обобщает принципы обеспечения надёжности электроснабжения ЦОД: устойчивость внешней сети (СН/ВН), сценарии отказов, требования к ИБП и ДГУ, а также сравнительный анализ основных топологий резервирования (N, N+1, 2N, распределённые схемы). Материал адаптирован под РФ с учётом типовых характеристик сетей и нормативов.
1. Устойчивость архитектуры ЦОД
Надёжность электроснабжения ЦОД определяется:
- качеством внешней сети (СН/ВН);
- глубиной резервирования внутри объекта;
- скоростью восстановления при авариях;
- устойчивостью распределительных схем к одиночным отказам (single failure points).
2. Надёжность внешнего электроснабжения
2.1. Топология сетей страны
В типовой энергосистеме используются три уровня:
- HV transmission (110–500 кВ) — кольцевая/ячеистая топология с генерацией сотен МВт.
- HV/MV sub-transmission (35–110 кВ) — преимущественно кольцевая схема питания подстанций.
- MV distribution (6–10–20 кВ) — открытые или частично кольцевые распределительные сети.
- LV distribution (0,4 кВ) — радиальные сети для конечных потребителей.
Кольцевые HV-сети в РФ имеют высокую устойчивость к одиночным отказам, но MV-сети часто работают в «квази-радиальном» режиме и дают основную часть кратковременных перерывов.
2.2. Типовые частоты отказов (по данным Schneider Electric / адаптация под РФ)
| Тип отказа | Подключение к MV | Подключение к HV |
|---|---|---|
| Региональное отключение >4 ч | 0,01–0,02/год | 0,01–0,02/год |
| Длительные отключения >3 мин | 0,5–5/год (в РФ в городах: 1–3/год) | 0,1/год |
| Короткие перерывы <3 мин | 0,5–20/год | 0,5–5/год |
| Глубокие провалы напряжения | 10–30/год | 5–15/год |
При подключении ЦОД к MV (6–10 кВ) вероятность кратких перерывов и провалов выше в 2–5 раз по сравнению с HV. Поэтому при мощностях >10 МВт в РФ рекомендуется HV-ввод 35–110 кВ.
2.3. Поведение сети при аварии
На HV-уровне (35–110–220 кВ):
- очистка КЗ за 100–200 мс без отключения большинства потребителей;
- при сложных авариях — переключения подстанций без потери питания;
- перезапуск после полного отключения занимает несколько часов.
На MV-уровне (6–10 кВ):
- ликвидация КЗ за 150–500 мс;
- возможны повторные автоматические включения (АПВ);
- восстановление питания требует поиска повреждённого участка.
3. Резервирование при кратковременных нарушениях
Для провалов/перерывов <3 мин применяется ИБП.
3.1. Технологии ИБП
| Тип ИБП | Особенности | Применение в ЦОД |
|---|---|---|
| Статические AC ИБП | Двойное преобразование, батареи, высокий КПД | 90% ЦОД, стандарт |
| Ротарные AC ИБП | Аккумуляция на маховике + генератор | Объекты >10 МВт, высокая кратковременная мощность |
| Статические DC ИБП | Переход на DC-распределение | Перспективные решения с высокой эффективностью |
| ИБП на уровне стойки | Актуально для edge / HPC | Децентрализация, снижение PDU-рисков |
Автономность ИБП определяется временем запуска ДГУ (8–15 с в РФ) и длительностью стабилизации частоты/напряжения.
4. Резервирование при длительных нарушениях
Длительные перерывы (>3 мин) покрываются дизель-генераторными установками (ДГУ).
4.1. Архитектура ДГУ
ДГУ → Автоматика запуска (PLC) → АВР/ATS → НН/СН щиты → ИТ-нагрузка
Полный запуск ДГУ в РФ: 8–12 с (пуск) + 5–10 с стабилизация → суммарно 10–20 секунд.
4.2. Особенности резервирования ДГУ
- резервирование по схеме N+1 или N+2;
- расход топлива 180–220 г/кВт·ч;
- объём аварийного резерва — минимум 8–12 ч при 75% нагрузки;
- дневные баки 1–2 ч → основная ёмкость в цистернах/резервуарах.
5. Внутренние архитектуры электроснабжения и топологии
Надёжность внутри ЦОД определяется топологией распределения.
5.1. Основные классы топологий
| Топология | Описание | Уровень надёжности | Комментарий |
|---|---|---|---|
| N | Нет резервирования | Низкий | Одиночный отказ вызывает останов ИТ |
| N+1 | Один резервный модуль | Средний | Один отказ не приводит к остановке |
| 2N | Полностью независимые цепочки A и B | Высокий | Нет общих точек отказа |
| N+N | Две активные цепочки одинаковой мощности | Очень высокий | Дороже 2N, лучше баланс нагрузки |
| Распределённая N+1 | Несколько систем, резерв равномерно распределён | Высокий | Оптимально для ЦОД 5–20 МВт |
| DRUPS | Ротарные ИБП+генератор в одном блоке | Высокий | Для крупных ЦОД, дорогая инфраструктура |
6. Подробный разбор топологий
6.1. Топология N (базовая)
Любой отказ приводит к отключению нагрузки. Применяется только в малых объектов или второстепенных зонах.
6.2. Топология 2N
Характеристики:
- два полностью независимых тракта питания А и B;
- два ввода, две секции РУ, две системы ИБП, два ДГУ-парка;
- каждая стойка имеет два ввода.
Преимущества:
- отсутствие единичных точек отказа;
- полная ремонтопригодность.
Недостатки:
- CAPEX +80–120%;
- повышенный OPEX за счёт удвоения оборудования.
6.3. Топология N+N
Разновидность 2N, где обе ветви активны. Преимущество — баланс нагрузки на 50/50 → сниженные потери.
6.4. Топология N+1 (блочная)
Каждый блок ИБП/ДГУ имеет один резерв. Если один блок выходит из строя — нагрузка распределяется на остальные.
Преимущества:
- оптимально для ЦОД 1–10 МВт;
- более низкая стоимость, чем 2N.
Недостатки:
- риск перегрузки при отказах нескольких элементов;
- сложная логика распределения нагрузок.
6.5. Распределённая топология N+1
Каждый ИБП обслуживает сегмент нагрузки и имеет резервную способность.
Преимущества:
- равномерное распределение риска;
- гибкость масштабирования;
- CAPEX ниже 2N на 30–40%.
Используется в ЦОД 5–20 МВт (в РФ — наиболее распространённая).
6.6. DRUPS (Diesel Rotary UPS)
Особенности:
- совмещает ИБП и роторный накопитель с ДГУ;
- высокая устойчивость к кратким помехам;
- часто используется в Tier III/IV ЦОД в Азии и Европе.
В РФ применяется редко из-за высокой стоимости и сложности обслуживания.
7. Ошибки при трактовке «полной отказоустойчивости»
Типичная ошибка пользователей — считать схему N+1 полной отказоустойчивой. Полная fault tolerance обеспечивается только архитектурами 2N или N+N.
8. Отключение одного тракта двойного питания
На практике заказчики требуют:
- возможность полного отключения тракта А без потери питания стойки;
- выполнение регламентов без уменьшения резервирования.
Это приводит к:
- удорожанию РУ (дополнительные обходные ячейки);
- увеличению трудозатрат на обслуживание;
- росту рисков при техническом обслуживании (отключение защиты, обходы).
9. Сравнение архитектур
| Топология | CAPEX | OPEX | Надёжность | Масштабируемость | Сложность эксплуатации |
|---|---|---|---|---|---|
| N | низкий | низкий | низкая | высокая | низкая |
| N+1 | средний | средний | средняя | высокая | средняя |
| 2N | высокий | высокий | высокая | средняя | высокая |
| N+N | очень высокий | высокий | очень высокая | средняя | высокая |
| N+1 распределённая | средний | средний | высокая | высокая | средняя |
| DRUPS | очень высокий | низкий | высокая | низкая | высокая |
Ключевые идеи
- Устойчивость внешней сети определяет выбор точки присоединения: MV для 1–10 МВт, HV для 10+ МВт.
- ИБП покрывают временной разрыв до запуска ДГУ.
- Для Tier III/IV фактически требуется 2N или распределённое N+1 с полной ликвидацией единичных точек отказа.
- Блочная N+1 — оптимальный баланс стоимости и надёжности для большинства проектов в РФ.
- DRUPS актуален только для крупных объектов (>20 МВт).
- Топология должна учитывать не только аварии, но и регламентные отключения — они создают до 60% рисков.
