Раздел описывает подходы к обеспечению высокой доступности систем электропитания в ЦОД: ограничения показателя MTBF, практическое использование метрики доступности, схемы резервирования ИБП (N+1, 2N, двойная шина, системы «ловушка»), а также вопросы аккумуляторных батарей и риски, связанные с ними.
MTBF (среднее время между отказами) применяется для оценки надёжности компонентов, но не отражает реальную доступность системы питания в целом.
Основные проблемы MTBF:
Вывод: MTBF полезен только как ориентир. Для оценки надёжности архитектур питания используется доступность.
Доступность — доля времени, когда система работоспособна и обеспечивает питание нагрузке.
$$A = \frac{MTBF}{MTBF + MTTR}$$
где:
Пример: MTBF = 500 000 ч, MTTR = 4 ч → доступность ≈ 0,999992 (≈ 4,2 мин простоя в год).
MTTR должен учитывать:
Элементы цепочки:
Наиболее частые причины отказов — не силовые модули ИБП, а:
Несколько ИБП совместно питают нагрузку, один — резервный.
Типовой выбор для Tier III: хороший баланс доступности и стоимости.
Пример схемы:
AC → [ИБП 1] ─┐ AC → [ИБП 2] ─┼──→ Общая шина AC → [ИБП 3] ─┘ (резерв)
Риски N+1:
Каждый путь питания способен нести полную нагрузку.
Путь A: Сеть A → ИБП A → Шина A → PSU A Путь B: Сеть B → ИБП B → Шина B → PSU B
2N — архитектура максимальной надёжности (Tier IV).
Недостатки:
Каждый ИБП имеет свой байпас.
[ИБП 1 + байпас] ─┐ [ИБП 2 + байпас] ─┼──→ Шина нагрузки [ИБП 3 + байпас] ─┘
Преимущества:
Ограничения:
ИБП 1 ─┐
ИБП 2 ─┼──→ Шина нагрузки
ИБП 3 ─┘
↑
Централизованный байпас
Плюсы:
Минусы:
Каждый сервер с двумя блоками питания питается от независимых путей A и B.
Шина A ← ИБП A → PSU A → Сервер Шина B ← ИБП B → PSU B → Сервер
Проблема — наличие оборудования с одним вводом: требует STS.
Для одношнурового оборудования.
Шина A ──────────┐
│
[STS] → Нагрузка
│
Шина B ──────────┘
Риски:
Один резервный ИБП способен заменить любой из рабочих.
[ИБП 1] → Нагрузка 1 [ИБП 2] → Нагрузка 2 [ИБП 3] → Нагрузка 3 [ИБП-ловушка] → резерв всех трёх
Плюсы:
Минусы:
Используется ПЛК и управляющая логика.
[ИБП-ловушка] → Общая резервная линия
[ИБП 1] ──┬─→ Нагрузка 1
└─→ Резерв (через ПЛК)
[ИБП 2] ──┬─→ Нагрузка 2
└─→ Резерв
Преимущества:
Риски:
Последовательное соединение десятков аккумуляторов.
Отказ одного элемента выводит из строя всю цепочку.
Строка 1: B1 — B2 — … — Bn Строка 2: B1' — B2' — … — Bn' Выход ИБП: Строка 1 || Строка 2
Преимущества:
Ограничения:
| Архитектура | Надёжность | CAPEX | Сложность | Область применения |
|---|---|---|---|---|
| N+1 | Высокая | Средний | Средняя | Tier III |
| 2N | Очень высокая | Высокий | Низкая | Tier IV |
| Распределённый байпас | Высокая | Средний | Высокая | Модульные ЦОД |
| Централизованный байпас | Средняя | Низкий | Низкая | Малые ЦОД |
| Двойная шина | Очень высокая | Высокий | Средняя | Крупные ЦОД |
| STS | Средняя | Средний | Высокая | Наследованные одношнуровые системы |
| Catcher | Средне-высокая | Ниже N+1 | Средняя | Средние ЦОД |
| Smart-catcher | Высокая | Средний | Высокая | Автоматизированные ЦОД |
Особенности эксплуатации в России: