Инструменты пользователя

Инструменты сайта


topics:27:integrated_strategies

Комплексные стратегии устойчивости

Раздел описывает системный подход к обеспечению устойчивости зданий ЦОД к природным и техногенным угрозам. Рассматриваются этапы планирования до и после чрезвычайных ситуаций, оценка портфеля объектов, выбор целевого уровня работоспособности, стратегии модернизации существующих зданий и увязка инженерных решений с бизнес-рисками и SLA.

Предаварийное планирование

Первый шаг в повышении устойчивости — понять, каким угрозам подвержены площадки компании и каковы последствия для бизнеса.

Рекомендуемая последовательность:

  1. Сформировать перечень всех площадок (действующие ЦОД, резервные узлы, ключевые коммуникационные центры).
  2. Для каждой площадки построить матрицу природных опасностей: землетрясения, экстремальный ветер, снег/дождь, наводнения, оползни и др.
  3. Для каждой угрозы оценить уровень опасности (низкий / средний / высокий) с учётом:
    • региональных карт опасностей (сейсмика, ветровые и снеговые районы, паводковые зоны);
    • локальных факторов (рельеф, близость рек, состояние дренажа, наличие потенциально опасных объектов поблизости).
  4. Для ключевых площадок выделить «критические сценарии» — сочетания угроз и отказов инженерных систем, ведущие к длительному простою.

Для ЦОД важно не только избежать обрушения и гибели людей, но и минимизировать время недоступности услуг. Поэтому целевые показатели устойчивости должны задаваться не только в терминах строительных норм, но и в терминах SLA, RTO/RPO и финансовых потерь.

Уровни требуемой работоспособности здания

В инженерной практике используются уровни поведения здания после воздействия (performance levels). Их удобно адаптировать для целей ЦОД:

  • Только безопасность людей (Life Safety) — конструкции не обрушаются, люди могут эвакуироваться, но здание может получить серьёзные повреждения и надолго выйти из эксплуатации.
  • Пригодность к немедленной эксплуатации (Immediate Occupancy) — повреждения ограничены; здание безопасно и может использоваться после краткой проверки и локального ремонта.
  • Контроль повреждений (Damage Control) — конструкции сохраняют запас прочности, повреждения минимальны; инженерные системы и ИТ-инфраструктура продолжают работать либо быстро восстанавливаются.

Для коммерческого ЦОД уровень «только безопасность людей» недостаточен. Целевой уровень должен быть не ниже Immediate Occupancy, а для опорных площадок — близок к Damage Control.

Оценка и ранжирование объектов портфеля

После определения целевых уровней работоспособности нужно оценить, насколько существующие здания им соответствуют.

Подход:

  1. Выполнить экспресс-оценку всех зданий (по чек-листам): год постройки, применённые нормы, тип конструкций, состояние, наличие модернизаций, особенности инженерных систем.
  2. На основе первичной оценки выделить здания:
    • с приемлемым уровнем риска;
    • требующие углублённого анализа;
    • заведомо не соответствующие требованиям (кандидаты на замену или вывод из эксплуатации).
  3. Для приоритетных объектов провести детальное обследование и расчёты (в т.ч. по методикам вероятностного / расчётного проектирования).

Результатом должна стать корпоративная карта риска: для каждого здания заданы актуальный уровень работоспособности, слабые места и рекомендуемые меры.

Стратегии для существующих зданий

По итогам оценки выбирается одна из базовых стратегий:

Стратегия Суть Плюсы Минусы
Усилить (retrofit) Усиление несущих конструкций, крепление инженерных систем, перенос/защита оборудования Сохранение локации, использование существующей инфраструктуры Стоимость, сложность работ в действующем ЦОД, ограниченный эффект, если исходный каркас слабый
Заменить (rebuild) Строительство нового здания с требуемым уровнем устойчивости Оптимальные решения «с нуля», возможность заложить все SLA Высокий CAPEX, необходимость новой площадки или временной миграции
Застраховать (insure) Финансовое покрытие ущерба по полисам страхования Снижение финансовых потерь Не снижает фактический простой и имиджевые риски
Принять риск (accept) Осознанное решение не предпринимать дополнительных мер Нулевые вложения сейчас Потенциально неприемлемые последствия при ЧС

Для ЦОД стратегию «принять риск» допустимо применять только к объектам низкой значимости (локальные узлы, кэш-площадки). Для опорных ЦОД применение исключительно финансовых инструментов без технического повышения устойчивости обычно недопустимо.

Конструктивные меры усиления

  • добавление связевых элементов, усиление колонн и диафрагм жёсткости;
  • устройство наружных рам, пилонов и опоясывающих поясов без остановки работы внутри здания;
  • локальное усиление узлов крепления оборудования, участков с высокими сосредоточенными нагрузками;
  • перераспределение тяжёлого инженерного оборудования (ИБП, батареи, Чиллеры) для снижения эксцентриситетов и перегрузки перекрытий.

Неструктурные меры усиления

  • сейсмостойкое крепление шкафов, фальшполов, кабельных лотков, трубопроводов и воздуховодов;
  • защита кровельного оборудования от ветровых и снеговых нагрузок (экраны, парапеты, усиленные крепления);
  • перенос критичного оборудования из подвалов и первых этажей выше уровня возможного подтопления;
  • обеспечение стойкости ограждающих конструкций к ударным воздействиям и вылету заполнений проёмов.

Предаварийные корпоративные стандарты

На уровне компании целесообразно принять корпоративный стандарт по устойчивости, который:

  • задаёт целевые уровни работоспособности для разных типов объектов (опорный ЦОД, региональный ЦОД, узел доступа, офис);
  • определяет минимальные требования к новым зданиям (категория ответственности, расчётные уровни нагрузок и воздействий, требования по защите от прогрессирующего обрушения);
  • устанавливает порядок due diligence при покупке/аренде зданий под ЦОД;
  • увязывает инженерные требования с SLA, DRP/BCP и критериями выбора площадок.

Такой стандарт должен быть согласован с требованиями технического регламента о безопасности зданий и сооружений и профильных сводов правил (по нагрузкам, основаниям, конструкциям, прогрессирующему обрушению, антитеррористической защищённости и специализирующему СП по ЦОД).

Поставарийное планирование

Даже при высоком уровне устойчивости полностью исключить ущерб невозможно. Поэтому необходим план действий после ЧС.

Ключевые элементы:

  • Обучение персонала действию при землетрясениях, ураганах, наводнениях (укрытие, безопасная эвакуация, запрет самостоятельного осмотра повреждённых зон).
  • Наличие ответственных за первичную оценку состояния здания и инженерных систем, обученных фиксировать опасные признаки (трещины, деформации, утечки, запахи газа и т.п.).
  • Заключение рамочных договоров с проектными и экспертными организациями, которые в короткий срок могут:
    • выполнить осмотр,
    • выдать заключение о пригодности к эксплуатации,
    • предложить временные и постоянные меры усиления.
  • Регламенты по:
    • переключению ИТ-нагрузки на резервные площадки (DR-планы);
    • взаимодействию с арендодателями и управляющими компаниями;
    • вводу здания в эксплуатацию после аварийных ремонтов.

Чётко прописанный поставарийный план позволяет сократить время неопределённости, когда решение о возобновлении работы откладывается из-за отсутствия специалистов или процедур.

Интеграция с управлением рисками и SLA

Комплексная стратегия устойчивости должна быть интегрирована в общую систему управления рисками компании:

  • при разработке SLA и бизнес-кейсов учитываются риск природных и техногенных ЧС и стоимость простоев;
  • в техзадания на проектирование и закупку включаются требования по уровню работоспособности здания, резервированию инженерных систем и возможностям модернизации;
  • в договора аренды и страхования вносятся положения о минимально допустимых уровнях устойчивости, обязанностях по обследованиям и усилению;
  • результаты регулярных обследований и учения по ЧС включаются в отчётность по операционным рискам.

Ключевые идеи

  • Устойчивость ЦОД — это не только расчёт конструкций, но и портфельная стратегия по выбору площадок, усилению, резервированию и страхованию.
  • Целевой уровень поведения здания должен быть выше, чем просто «безопасность людей»; для ключевых ЦОД требуется как минимум «немедленная пригодность к эксплуатации».
  • Для существующих зданий необходимо сочетать инженерные меры (усиление конструкций и крепления оборудования) с организационными (DR-планы, договоры с экспертами, обучение персонала).
  • Корпоративный стандарт по устойчивости позволяет сделать требования к новым и существующим объектам прозрачными и сопоставимыми, снизив риск недоинвестирования в критические элементы.
  • Продуманное поставарийное планирование уменьшает время простоя и неопределённости после крупных событий, обеспечивая более предсказуемый уровень доступности ИТ-сервисов.
topics/27/integrated_strategies.txt · Последнее изменение: admin