Содержание
Текущее состояние систем управления в ЦОД
Современные ЦОД характеризуются высокой динамичностью ИТ-нагрузок и растущими затратами на энергию. При отсутствии комплексной системы управления возрастает риск неэффективного использования ресурсов, избыточных мощностей и нерационального расхода электроэнергии. Управление инфраструктурой по-прежнему разделено на два независимых контура — эксплуатацию инженерных систем и управление ИТ-оборудованием.
Структура управления инфраструктурой
Сегодня в большинстве ЦОД управление разделено на два функциональных блока:
- Эксплуатация инженерных систем (Facility Operations) — управление электроснабжением, охлаждением, ИБП, дизель-генераторами, системами автоматизации здания.
- Управление ИТ-нагрузками (IT Operations) — поддержание требуемой вычислительной производительности, сетевых ресурсов и хранения данных.
Данные блоки функционируют как поставщик (инженерные системы) и потребитель (ИТ-нагрузка) энергоресурсов и холода. Между ними отсутствует полноценная интеграция, что создаёт «информационный разрыв».
Эксплуатация инженерных систем
Инженерная эксплуатация обеспечивает стабильность работы вспомогательных систем ЦОД, но обычно не обладает данными о реальном состоянии ИТ-нагрузки.
Основные характеристики:
- управление ИБП, шинопроводами, ДГУ, чиллерами и вентмашинами;
- применение систем диспетчеризации для контроля инженерных параметров;
- отсутствие динамической адаптации режимов охлаждения под изменения ИТ-нагрузки.
Охлаждение и электропитание, как правило, работают по статичным уставкам. Чиллеры, насосы и вентиляторы редко адаптируются к фактическим ИТ-нагрузкам, что снижает энергоэффективность.
Для повышения прозрачности стороны инженерии внедряют элементы сенсорных сетей (IoT) для мониторинга оборудования, однако такие подсистемы:
- стоят дорого,
- требуют обслуживания и обновлений,
- часто не интегрируются с ИТ-контуром.
Управление ИТ-оборудованием
ИТ-операции отвечают за размещение и эксплуатацию серверов, СХД и сетевых устройств. Нагрузка планируется исходя из максимальных паспортных значений.
Ключевые особенности:
- наличие «буфера мощности»: например, при доступных 5 кВт стойка загружается лишь на 3–4 кВт;
- расчёт нагрузки выполняется по лабораторным значениям или паспортам производителя;
- фактическое энергопотребление ИТ-оборудования не отслеживается в реальном времени.
Отсутствие реальных телеметрических данных приводит к избыточному резервированию, росту PUE и неэффективному использованию стойкового пространства.
Проблемы учёта и мониторинга
Многие ЦОД до сих пор ведут учёт ИТ-оборудования в Excel или отдельных базах, фиксируя лишь факт размещения устройства, но не его фактическую загрузку.
Основные проблемы:
- устаревшие устройства могут продолжать потреблять электроэнергию, хотя рабочие нагрузки давно перенесены на новые платформы;
- отсутствует мониторинг в реальном времени для ИТ-оборудования;
- риск незапланированных простоев повышается из-за недостаточной видимости состояния инфраструктуры.
Недостаточная интеграция Facility и IT Operations ведёт к увеличению расходов, снижению эффективности охлаждения и возможности крупных аварий с многомиллионными потерями.
Ключевые идеи
- Управление ЦОД остаётся разделённым на инженерный и ИТ-контур с минимальным обменом данными.
- Инженерные системы не адаптируются к динамике нагрузок, работая по статичным уставкам.
- ИТ-оборудование не имеет полноценного мониторинга энергопотребления в реальном времени.
- Учёт оборудования ведётся вручную или в разрозненных системах, что создаёт риски ошибок.
- Отсутствие единой системы приводит к неэффективному расходу энергии и увеличению PUE.
- Интеграция мониторинга двух контуров — ключевой фактор повышения энергоэффективности.
