Системы управления и мониторинга ИБП
Раздел описывает средства управления, мониторинга и автоматизации работы ИБП в инфраструктуре ЦОД: функции программного обеспечения, интеграцию с виртуализацией, требования к интерфейсам управления, возможности удалённого контроля, а также применение прогнозной аналитики.
Назначение систем управления ИБП
Даже при наличии ИБП возможны отказ и потеря питания ИТ-нагрузки при длительном отсутствии внешнего электроснабжения или перегрузке. Управляющее ПО должно:
своевременно уведомлять о переходе ИБП на батареи и об аварийных состояниях;
выполнять контролируемое завершение работы серверов;
обеспечивать дистанционный мониторинг параметров (напряжение, ток, температура, ресурс батарей);
предотвращать потерю данных и некорректное завершение процессов.
Изначально связь с серверами реализовывалась по последовательным интерфейсам (RS-232, далее USB). По мере усложнения инфраструктуры управление перешло на сетевое взаимодействие по IP — каждый ИБП получает собственный адрес в сети.
Интеграция с виртуализацией
В современных ЦОД большая часть вычислительных ресурсов работает во виртуальных средах. Критически важно, чтобы:
управляющее ПО ИБП корректно взаимодействовало с гипervisором;
команды на завершение работы выполнялись для каждой виртуальной машины;
при аварии происходила автоматическая миграция ВМ между узлами кластера (VMware vCenter, Microsoft SCVMM, Citrix XenCenter);
отключение физических серверов происходило только после успешной миграции и сохранения состояния ВМ.
Интеграция ПО ИБП с платформами виртуализации уменьшает риск неконтролируемого выключения ВМ и повышает доступность сервисов.
Функции современных систем управления питанием
Современные платформы мониторинга и управления ИБП позволяют:
контролировать состояние ИБП и стоечных PDU через интернет;
автоматически уведомлять ответственных сотрудников о событиях (e-mail, SMS, push-уведомления);
выполнять программируемые сценарии: остановка отдельных сервисов, вызов внешних скриптов, запуск резервных мощностей;
выбирать порядок отключения второстепенных систем для увеличения времени автономной работы;
анализировать тренды параметров нагрузки и состояния батарей;
интегрироваться с системами управления ЦОД через стандартизированные протоколы.
Требования к визуальному интерфейсу
Хорошая система мониторинга должна иметь:
единый экран для отображения всех объектов ИБП;
«вендорно-независимый» интерфейс, поддерживающий оборудование разных производителей;
визуализацию в виде 3D-моделей или графических планов стоек;
прогнозирование загрузки и остаточного ресурса;
отчёты по потреблению, трендам и событиям;
настройки пороговых значений и уведомлений;
отображение свободного пространства, мощности и охлаждения в стойках (power & cooling capacity planning).
Локальное и удалённое управление
Система управления должна позволять выполнять:
локальное или удалённое переведение нагрузки на резервные источники;
автоматические действия при отклонении параметров электросети;
миграцию рабочих нагрузок с учётом политики надежности;
отключение не критичных систем для увеличения времени автономии;
взаимодействие с ПО крупных производителей (Cisco, HPE, Dell EMC, Microsoft, VMware, Nutanix).
Наличие удалённого контроля позволяет снижать риск аварийных отключений и уменьшает MTTR за счёт более быстрых действий персонала.
Прогнозная аналитика (predictive analytics)
Современные ИБП оснащаются десятками датчиков (напряжения, температуры, тока, внутреннего сопротивления батарей). Эти данные используются для:
прогнозирования отказов компонентов ещё до момента выхода параметров за допустимые пределы;
предупреждения необходимости замены батарей, вентиляторов, плат управления;
автоматического формирования заявок на обслуживание;
предотвращения незапланированных простоев.
Прогнозная аналитика позволяет переходить от реактивного обслуживания к проактивному и существенно снижает риск простоя оборудования.
Требования к выбору системы мониторинга
При выборе платформы мониторинга и управления необходимо учитывать:
масштабируемость (от нескольких ИБП до тысячи устройств);
совместимость с сетевыми и серверными платформами;
поддержку открытых стандартов (SNMP, Modbus TCP, Redfish);
наличие
API или интеграции с DCIM;
возможности удалённого обновления прошивок ИБП;
сервисы по прогнозированию отказов;
инструменты для отчётности и соответствия SLA.
Ключевые идеи
Управляющее ПО — обязательный элемент надёжности ИБП, без которого невозможно контролировать сценарии аварийного завершения работы.
Интеграция с виртуализацией предотвращает потерю данных и обеспечивает контролируемую миграцию ВМ.
Единая система мониторинга должна быть вендорно-независимой, масштабируемой и иметь расширенные средства визуализации.
Прогнозная аналитика позволяет заранее выявлять деградацию батарей и компонентов, снижая риск незапланированных отключений.
Системы управления ИБП должны поддерживать удалённое управление и политическую автоматизацию действий при авариях.
Интеграция с DCIM даёт возможность видеть полную картину по мощности, охлаждению и загрузке стоек.