Содержание
Комплексные стратегии устойчивости
Раздел описывает системный подход к обеспечению устойчивости зданий ЦОД к природным и техногенным угрозам. Рассматриваются этапы планирования до и после чрезвычайных ситуаций, оценка портфеля объектов, выбор целевого уровня работоспособности, стратегии модернизации существующих зданий и увязка инженерных решений с бизнес-рисками и SLA.
Предаварийное планирование
Первый шаг в повышении устойчивости — понять, каким угрозам подвержены площадки компании и каковы последствия для бизнеса.
Рекомендуемая последовательность:
- Сформировать перечень всех площадок (действующие ЦОД, резервные узлы, ключевые коммуникационные центры).
- Для каждой площадки построить матрицу природных опасностей: землетрясения, экстремальный ветер, снег/дождь, наводнения, оползни и др.
- Для каждой угрозы оценить уровень опасности (низкий / средний / высокий) с учётом:
- региональных карт опасностей (сейсмика, ветровые и снеговые районы, паводковые зоны);
- локальных факторов (рельеф, близость рек, состояние дренажа, наличие потенциально опасных объектов поблизости).
- Для ключевых площадок выделить «критические сценарии» — сочетания угроз и отказов инженерных систем, ведущие к длительному простою.
Для ЦОД важно не только избежать обрушения и гибели людей, но и минимизировать время недоступности услуг. Поэтому целевые показатели устойчивости должны задаваться не только в терминах строительных норм, но и в терминах SLA, RTO/RPO и финансовых потерь.
Уровни требуемой работоспособности здания
В инженерной практике используются уровни поведения здания после воздействия (performance levels). Их удобно адаптировать для целей ЦОД:
- Только безопасность людей (Life Safety) — конструкции не обрушаются, люди могут эвакуироваться, но здание может получить серьёзные повреждения и надолго выйти из эксплуатации.
- Пригодность к немедленной эксплуатации (Immediate Occupancy) — повреждения ограничены; здание безопасно и может использоваться после краткой проверки и локального ремонта.
- Контроль повреждений (Damage Control) — конструкции сохраняют запас прочности, повреждения минимальны; инженерные системы и ИТ-инфраструктура продолжают работать либо быстро восстанавливаются.
Для коммерческого ЦОД уровень «только безопасность людей» недостаточен. Целевой уровень должен быть не ниже Immediate Occupancy, а для опорных площадок — близок к Damage Control.
Оценка и ранжирование объектов портфеля
После определения целевых уровней работоспособности нужно оценить, насколько существующие здания им соответствуют.
Подход:
- Выполнить экспресс-оценку всех зданий (по чек-листам): год постройки, применённые нормы, тип конструкций, состояние, наличие модернизаций, особенности инженерных систем.
- На основе первичной оценки выделить здания:
- с приемлемым уровнем риска;
- требующие углублённого анализа;
- заведомо не соответствующие требованиям (кандидаты на замену или вывод из эксплуатации).
- Для приоритетных объектов провести детальное обследование и расчёты (в т.ч. по методикам вероятностного / расчётного проектирования).
Результатом должна стать корпоративная карта риска: для каждого здания заданы актуальный уровень работоспособности, слабые места и рекомендуемые меры.
Стратегии для существующих зданий
По итогам оценки выбирается одна из базовых стратегий:
| Стратегия | Суть | Плюсы | Минусы |
|---|---|---|---|
| Усилить (retrofit) | Усиление несущих конструкций, крепление инженерных систем, перенос/защита оборудования | Сохранение локации, использование существующей инфраструктуры | Стоимость, сложность работ в действующем ЦОД, ограниченный эффект, если исходный каркас слабый |
| Заменить (rebuild) | Строительство нового здания с требуемым уровнем устойчивости | Оптимальные решения «с нуля», возможность заложить все SLA | Высокий CAPEX, необходимость новой площадки или временной миграции |
| Застраховать (insure) | Финансовое покрытие ущерба по полисам страхования | Снижение финансовых потерь | Не снижает фактический простой и имиджевые риски |
| Принять риск (accept) | Осознанное решение не предпринимать дополнительных мер | Нулевые вложения сейчас | Потенциально неприемлемые последствия при ЧС |
Для ЦОД стратегию «принять риск» допустимо применять только к объектам низкой значимости (локальные узлы, кэш-площадки). Для опорных ЦОД применение исключительно финансовых инструментов без технического повышения устойчивости обычно недопустимо.
Конструктивные меры усиления
- добавление связевых элементов, усиление колонн и диафрагм жёсткости;
- устройство наружных рам, пилонов и опоясывающих поясов без остановки работы внутри здания;
- локальное усиление узлов крепления оборудования, участков с высокими сосредоточенными нагрузками;
- перераспределение тяжёлого инженерного оборудования (ИБП, батареи, Чиллеры) для снижения эксцентриситетов и перегрузки перекрытий.
Неструктурные меры усиления
- сейсмостойкое крепление шкафов, фальшполов, кабельных лотков, трубопроводов и воздуховодов;
- защита кровельного оборудования от ветровых и снеговых нагрузок (экраны, парапеты, усиленные крепления);
- перенос критичного оборудования из подвалов и первых этажей выше уровня возможного подтопления;
- обеспечение стойкости ограждающих конструкций к ударным воздействиям и вылету заполнений проёмов.
Предаварийные корпоративные стандарты
На уровне компании целесообразно принять корпоративный стандарт по устойчивости, который:
- задаёт целевые уровни работоспособности для разных типов объектов (опорный ЦОД, региональный ЦОД, узел доступа, офис);
- определяет минимальные требования к новым зданиям (категория ответственности, расчётные уровни нагрузок и воздействий, требования по защите от прогрессирующего обрушения);
- устанавливает порядок due diligence при покупке/аренде зданий под ЦОД;
- увязывает инженерные требования с SLA, DRP/BCP и критериями выбора площадок.
Такой стандарт должен быть согласован с требованиями технического регламента о безопасности зданий и сооружений и профильных сводов правил (по нагрузкам, основаниям, конструкциям, прогрессирующему обрушению, антитеррористической защищённости и специализирующему СП по ЦОД).
Поставарийное планирование
Даже при высоком уровне устойчивости полностью исключить ущерб невозможно. Поэтому необходим план действий после ЧС.
Ключевые элементы:
- Обучение персонала действию при землетрясениях, ураганах, наводнениях (укрытие, безопасная эвакуация, запрет самостоятельного осмотра повреждённых зон).
- Наличие ответственных за первичную оценку состояния здания и инженерных систем, обученных фиксировать опасные признаки (трещины, деформации, утечки, запахи газа и т.п.).
- Заключение рамочных договоров с проектными и экспертными организациями, которые в короткий срок могут:
- выполнить осмотр,
- выдать заключение о пригодности к эксплуатации,
- предложить временные и постоянные меры усиления.
- Регламенты по:
- переключению ИТ-нагрузки на резервные площадки (DR-планы);
- взаимодействию с арендодателями и управляющими компаниями;
- вводу здания в эксплуатацию после аварийных ремонтов.
Чётко прописанный поставарийный план позволяет сократить время неопределённости, когда решение о возобновлении работы откладывается из-за отсутствия специалистов или процедур.
Интеграция с управлением рисками и SLA
Комплексная стратегия устойчивости должна быть интегрирована в общую систему управления рисками компании:
- при разработке SLA и бизнес-кейсов учитываются риск природных и техногенных ЧС и стоимость простоев;
- в техзадания на проектирование и закупку включаются требования по уровню работоспособности здания, резервированию инженерных систем и возможностям модернизации;
- в договора аренды и страхования вносятся положения о минимально допустимых уровнях устойчивости, обязанностях по обследованиям и усилению;
- результаты регулярных обследований и учения по ЧС включаются в отчётность по операционным рискам.
Ключевые идеи
- Устойчивость ЦОД — это не только расчёт конструкций, но и портфельная стратегия по выбору площадок, усилению, резервированию и страхованию.
- Целевой уровень поведения здания должен быть выше, чем просто «безопасность людей»; для ключевых ЦОД требуется как минимум «немедленная пригодность к эксплуатации».
- Для существующих зданий необходимо сочетать инженерные меры (усиление конструкций и крепления оборудования) с организационными (DR-планы, договоры с экспертами, обучение персонала).
- Корпоративный стандарт по устойчивости позволяет сделать требования к новым и существующим объектам прозрачными и сопоставимыми, снизив риск недоинвестирования в критические элементы.
- Продуманное поставарийное планирование уменьшает время простоя и неопределённости после крупных событий, обеспечивая более предсказуемый уровень доступности ИТ-сервисов.
