====== Резервирование и архитектуры надёжности ====== Раздел обобщает принципы обеспечения надёжности электроснабжения ЦОД: устойчивость внешней сети (СН/ВН), сценарии отказов, требования к ИБП и ДГУ, а также сравнительный анализ основных топологий резервирования (N, N+1, 2N, распределённые схемы). Материал адаптирован под РФ с учётом типовых характеристик сетей и нормативов. ===== 1. Устойчивость архитектуры ЦОД ====== Надёжность электроснабжения ЦОД определяется: * качеством внешней сети (СН/ВН); * глубиной резервирования внутри объекта; * скоростью восстановления при авариях; * устойчивостью распределительных схем к одиночным отказам (single failure points). ===== 2. Надёжность внешнего электроснабжения ====== ==== 2.1. Топология сетей страны ==== В типовой энергосистеме используются три уровня: * **HV transmission (110–500 кВ)** — кольцевая/ячеистая топология с генерацией сотен МВт. * **HV/MV sub-transmission (35–110 кВ)** — преимущественно кольцевая схема питания подстанций. * **MV distribution (6–10–20 кВ)** — открытые или частично кольцевые распределительные сети. * **LV distribution (0,4 кВ)** — радиальные сети для конечных потребителей. Кольцевые HV-сети в РФ имеют высокую устойчивость к одиночным отказам, но MV-сети часто работают в «квази-радиальном» режиме и дают основную часть кратковременных перерывов. ==== 2.2. Типовые частоты отказов (по данным Schneider Electric / адаптация под РФ) ==== ^ Тип отказа ^ Подключение к MV ^ Подключение к HV ^ | Региональное отключение >4 ч | 0,01–0,02/год | 0,01–0,02/год | | Длительные отключения >3 мин | 0,5–5/год (в РФ в городах: 1–3/год) | 0,1/год | | Короткие перерывы <3 мин | 0,5–20/год | 0,5–5/год | | Глубокие провалы напряжения | 10–30/год | 5–15/год | При подключении ЦОД к MV (6–10 кВ) вероятность кратких перерывов и провалов выше в 2–5 раз по сравнению с HV. Поэтому при мощностях >10 МВт в РФ рекомендуется HV-ввод 35–110 кВ. ==== 2.3. Поведение сети при аварии ==== **На HV-уровне (35–110–220 кВ):** * очистка КЗ за 100–200 мс без отключения большинства потребителей; * при сложных авариях — переключения подстанций без потери питания; * перезапуск после полного отключения занимает несколько часов. **На MV-уровне (6–10 кВ):** * ликвидация КЗ за 150–500 мс; * возможны повторные автоматические включения (АПВ); * восстановление питания требует поиска повреждённого участка. ===== 3. Резервирование при кратковременных нарушениях ====== Для провалов/перерывов <3 мин применяется ИБП. ==== 3.1. Технологии ИБП ==== ^ Тип ИБП ^ Особенности ^ Применение в ЦОД ^ | **Статические AC ИБП** | Двойное преобразование, батареи, высокий КПД | 90% ЦОД, стандарт | | **Ротарные AC ИБП** | Аккумуляция на маховике + генератор | Объекты >10 МВт, высокая кратковременная мощность | | **Статические DC ИБП** | Переход на DC-распределение | Перспективные решения с высокой эффективностью | | **ИБП на уровне стойки** | Актуально для edge / HPC | Децентрализация, снижение PDU-рисков | Автономность ИБП определяется временем запуска ДГУ (8–15 с в РФ) и длительностью стабилизации частоты/напряжения. ===== 4. Резервирование при длительных нарушениях ====== Длительные перерывы (>3 мин) покрываются **дизель-генераторными установками (ДГУ)**. ==== 4.1. Архитектура ДГУ ==== ДГУ → Автоматика запуска (PLC) → АВР/ATS → НН/СН щиты → ИТ-нагрузка Полный запуск ДГУ в РФ: 8–12 с (пуск) + 5–10 с стабилизация → суммарно 10–20 секунд. ==== 4.2. Особенности резервирования ДГУ ==== * резервирование по схеме N+1 или N+2; * расход топлива 180–220 г/кВт·ч; * объём аварийного резерва — минимум 8–12 ч при 75% нагрузки; * дневные баки 1–2 ч → основная ёмкость в цистернах/резервуарах. ===== 5. Внутренние архитектуры электроснабжения и топологии ====== Надёжность внутри ЦОД определяется топологией распределения. ==== 5.1. Основные классы топологий ==== ^ Топология ^ Описание ^ Уровень надёжности ^ Комментарий ^ | **N** | Нет резервирования | Низкий | Одиночный отказ вызывает останов ИТ | | **N+1** | Один резервный модуль | Средний | Один отказ не приводит к остановке | | **2N** | Полностью независимые цепочки A и B | Высокий | Нет общих точек отказа | | **N+N** | Две активные цепочки одинаковой мощности | Очень высокий | Дороже 2N, лучше баланс нагрузки | | **Распределённая N+1** | Несколько систем, резерв равномерно распределён | Высокий | Оптимально для ЦОД 5–20 МВт | | **DRUPS** | Ротарные ИБП+генератор в одном блоке | Высокий | Для крупных ЦОД, дорогая инфраструктура | ===== 6. Подробный разбор топологий ====== ==== 6.1. Топология N (базовая) ==== Любой отказ приводит к отключению нагрузки. Применяется только в малых объектов или второстепенных зонах. ==== 6.2. Топология 2N ==== Характеристики: * два полностью независимых тракта питания А и B; * два ввода, две секции РУ, две системы ИБП, два ДГУ-парка; * каждая стойка имеет два ввода. Преимущества: * отсутствие единичных точек отказа; * полная ремонтопригодность. Недостатки: * CAPEX +80–120%; * повышенный OPEX за счёт удвоения оборудования. ==== 6.3. Топология N+N ==== Разновидность 2N, где обе ветви активны. Преимущество — баланс нагрузки на 50/50 → сниженные потери. ==== 6.4. Топология N+1 (блочная) ==== Каждый блок ИБП/ДГУ имеет один резерв. Если один блок выходит из строя — нагрузка распределяется на остальные. Преимущества: * оптимально для ЦОД 1–10 МВт; * более низкая стоимость, чем 2N. Недостатки: * риск перегрузки при отказах нескольких элементов; * сложная логика распределения нагрузок. ==== 6.5. Распределённая топология N+1 ==== Каждый ИБП обслуживает сегмент нагрузки и имеет резервную способность. Преимущества: * равномерное распределение риска; * гибкость масштабирования; * CAPEX ниже 2N на 30–40%. Используется в ЦОД 5–20 МВт (в РФ — наиболее распространённая). ==== 6.6. DRUPS (Diesel Rotary UPS) ==== Особенности: * совмещает ИБП и роторный накопитель с ДГУ; * высокая устойчивость к кратким помехам; * часто используется в Tier III/IV ЦОД в Азии и Европе. В РФ применяется редко из-за высокой стоимости и сложности обслуживания. ===== 7. Ошибки при трактовке «полной отказоустойчивости» ====== Типичная ошибка пользователей — считать схему N+1 полной отказоустойчивой. Полная fault tolerance обеспечивается только архитектурами 2N или N+N. ===== 8. Отключение одного тракта двойного питания ====== На практике заказчики требуют: * возможность полного отключения тракта А без потери питания стойки; * выполнение регламентов без уменьшения резервирования. Это приводит к: * удорожанию РУ (дополнительные обходные ячейки); * увеличению трудозатрат на обслуживание; * росту рисков при техническом обслуживании (отключение защиты, обходы). ===== 9. Сравнение архитектур ====== ^ Топология ^ CAPEX ^ OPEX ^ Надёжность ^ Масштабируемость ^ Сложность эксплуатации ^ | N | низкий | низкий | низкая | высокая | низкая | | N+1 | средний | средний | средняя | высокая | средняя | | 2N | высокий | высокий | высокая | средняя | высокая | | N+N | очень высокий | высокий | очень высокая | средняя | высокая | | N+1 распределённая | средний | средний | высокая | высокая | средняя | | DRUPS | очень высокий | низкий | высокая | низкая | высокая | ===== Ключевые идеи ===== * Устойчивость внешней сети определяет выбор точки присоединения: MV для 1–10 МВт, HV для 10+ МВт. * ИБП покрывают временной разрыв до запуска ДГУ. * Для Tier III/IV фактически требуется 2N или распределённое N+1 с полной ликвидацией единичных точек отказа. * Блочная N+1 — оптимальный баланс стоимости и надёжности для большинства проектов в РФ. * DRUPS актуален только для крупных объектов (>20 МВт). * Топология должна учитывать не только аварии, но и регламентные отключения — они создают до 60% рисков.