Раздел рассматривает принципы компонуемой (composable) и дезагрегированной (disaggregated) архитектуры центров обработки данных — физическую основу для реализации программно-определяемых сред (SDE). Главная цель — разделить ресурсы на независимые пулы и объединять их программно в соответствии с требованиями нагрузки.
Традиционные ЦОД построены по модели spine–leaf, где серверы в стойках соединены с коммутаторами уровня Top-of-Rack (ToR), а те, в свою очередь, связаны через центральный коммутатор (spine). Каждый сервер включает вычислительные ядра, память, накопители и сетевые интерфейсы, объединённые физически в один блок.
Такое проектирование создаёт проблему синхронного обновления: если требуется заменить один компонент, приходится обновлять весь узел целиком. Это ограничивает внедрение новых технологий и снижает эффективность использования оборудования.
Дезагрегация устраняет эту зависимость, разделяя процессоры, память, диски, графические ускорители и сетевые адаптеры на отдельные модули. Компоновка (composition) позволяет программно объединять их в нужную конфигурацию под конкретную задачу.
1. Разделение ресурсов по типам. Вычислительные узлы, память, графические ускорители и хранилища существуют как независимые элементы инфраструктуры.
2. Формирование пула ресурсов. Ресурсы объединяются в пулы (CPU, RAM, GPU, SSD, сеть), доступные для динамического выделения.
3. Программная компоновка. Логические серверы создаются на основе политик SDE, которые определяют требуемые характеристики нагрузки.
4. Динамическое масштабирование. Состав «виртуального узла» изменяется автоматически при изменении нагрузки или отказе компонентов.
5. Гибкость обновления. Модули могут модернизироваться независимо, без замены всего узла или стойки.
Логика работы компонуемой инфраструктуры
- Локализация данных. Совместное использование ресурсов требует высокой пропускной способности сетевых соединений. Например, при работе с базами данных доступ к данным по Ethernet снижает задержки по сравнению с SATA.
- Обеспечение кэширования. Рекомендуется сохранять часть локальной DRAM для ускорения обмена между ЦП и внешними пулами памяти, чтобы снизить задержки при обращении к удалённым ресурсам.
- Сбалансированное распределение нагрузки. Использование SMT (Simultaneous Multithreading) и высокопараллельных приложений помогает уменьшить потери производительности при разделении памяти и I/O.
- Синхронизация и задержки. В компонуемых системах наблюдается полнее использование ЦП и повышение пропускной способности до 1,5–1,6 раз по сравнению с традиционными архитектурами, при этом снижение производительности при удалённом доступе к данным минимально (до 10–15 %).
1. Аппаратный уровень. Используются высокоскоростные межсоединения (PCIe, CXL, InfiniBand) и механизмы RDMA для низкой задержки при доступе к удалённым ресурсам.
2. Уровень гипервизора и ОС. Управление ресурсами реализуется через драйверы и диспетчеры памяти, поддерживающие «горячее» подключение модулей.
3. Платформенный уровень. Плоскость SDE обеспечивает взаимодействие приложений с пулами ресурсов через политики, SLA и шаблоны конфигурации.
4. Прикладной уровень. Приложения взаимодействуют с инфраструктурой через API и политики, формируя нужный набор характеристик без прямого доступа к оборудованию.
Исследования показывают, что:
Такая архитектура особенно эффективна для сред, где сочетаются разные типы нагрузок — аналитика, машинное обучение, транзакции. Ресурсы при этом перераспределяются без остановки приложений и без физического вмешательства в конфигурацию стоек.
- Компонуемая архитектура позволяет программно объединять физически разделённые ресурсы. - Дезагрегация снижает зависимость между компонентами и продлевает срок службы инфраструктуры. - Управление осуществляется через единую программно-определяемую плоскость. - Архитектура обеспечивает оптимизацию нагрузки, гибкость масштабирования и энергоэффективность. - ЦОД становится модульным, самонастраиваемым и экономически устойчивым.