Компонуемая и дезагрегированная архитектура ЦОД

Раздел рассматривает принципы компонуемой (composable) и дезагрегированной (disaggregated) архитектуры центров обработки данных — физическую основу для реализации программно-определяемых сред (SDE). Главная цель — разделить ресурсы на независимые пулы и объединять их программно в соответствии с требованиями нагрузки.

Общая идея

Традиционные ЦОД построены по модели spine–leaf, где серверы в стойках соединены с коммутаторами уровня Top-of-Rack (ToR), а те, в свою очередь, связаны через центральный коммутатор (spine). Каждый сервер включает вычислительные ядра, память, накопители и сетевые интерфейсы, объединённые физически в один блок.

Такое проектирование создаёт проблему синхронного обновления: если требуется заменить один компонент, приходится обновлять весь узел целиком. Это ограничивает внедрение новых технологий и снижает эффективность использования оборудования.

Дезагрегация устраняет эту зависимость, разделяя процессоры, память, диски, графические ускорители и сетевые адаптеры на отдельные модули. Компоновка (composition) позволяет программно объединять их в нужную конфигурацию под конкретную задачу.

Принципы построения

1. Разделение ресурсов по типам. Вычислительные узлы, память, графические ускорители и хранилища существуют как независимые элементы инфраструктуры.

2. Формирование пула ресурсов. Ресурсы объединяются в пулы (CPU, RAM, GPU, SSD, сеть), доступные для динамического выделения.

3. Программная компоновка. Логические серверы создаются на основе политик SDE, которые определяют требуемые характеристики нагрузки.

4. Динамическое масштабирование. Состав «виртуального узла» изменяется автоматически при изменении нагрузки или отказе компонентов.

5. Гибкость обновления. Модули могут модернизироваться независимо, без замены всего узла или стойки.

Логика работы компонуемой инфраструктуры

flowchart TB classDef big font-size:12px,stroke-width:1.2px,padding:10px; Pools["Пулы ресурсов: CPU / GPU / RAM / SSD / Network"]:::big --> Composition["Плоскость компоновки (Software-Defined Control)"]:::big Composition --> Workload1["Конфигурация A (аналитика)"]:::big Composition --> Workload2["Конфигурация B (OLTP)"]:::big Composition --> Workload3["Конфигурация C (AI/ML)"]:::big Monitoring["Мониторинг и управление политиками"]:::big --- Composition

Преимущества

Гибкость. Возможность создавать любые конфигурации без физического вмешательства.
Оптимизация затрат. Повышение загрузки оборудования и снижение избыточных ресурсов.
Масштабируемость. Быстрое расширение мощностей за счёт добавления отдельных модулей.
Долговечность. Замена и обновление оборудования выполняются по мере необходимости, а не синхронно.
Энергоэффективность. Отсутствие постоянного резервирования вычислительных блоков.

Практические особенности

- Локализация данных. Совместное использование ресурсов требует высокой пропускной способности сетевых соединений. Например, при работе с базами данных доступ к данным по Ethernet снижает задержки по сравнению с SATA.

- Обеспечение кэширования. Рекомендуется сохранять часть локальной DRAM для ускорения обмена между ЦП и внешними пулами памяти, чтобы снизить задержки при обращении к удалённым ресурсам.

- Сбалансированное распределение нагрузки. Использование SMT (Simultaneous Multithreading) и высокопараллельных приложений помогает уменьшить потери производительности при разделении памяти и I/O.

- Синхронизация и задержки. В компонуемых системах наблюдается полнее использование ЦП и повышение пропускной способности до 1,5–1,6 раз по сравнению с традиционными архитектурами, при этом снижение производительности при удалённом доступе к данным минимально (до 10–15 %).

Технологические уровни реализации

1. Аппаратный уровень. Используются высокоскоростные межсоединения (PCIe, CXL, InfiniBand) и механизмы RDMA для низкой задержки при доступе к удалённым ресурсам.

2. Уровень гипервизора и ОС. Управление ресурсами реализуется через драйверы и диспетчеры памяти, поддерживающие «горячее» подключение модулей.

3. Платформенный уровень. Плоскость SDE обеспечивает взаимодействие приложений с пулами ресурсов через политики, SLA и шаблоны конфигурации.

4. Прикладной уровень. Приложения взаимодействуют с инфраструктурой через API и политики, формируя нужный набор характеристик без прямого доступа к оборудованию.

Эффективность и примеры

Исследования показывают, что:

компонуемые системы выдерживают нагрузку до 1,6× выше по сравнению с классическими серверами;
при оптимальном выделении памяти и кэшировании DRAM потери производительности составляют не более 10 %;
возможно снижение потребности в выделенной памяти до 60 % при динамическом перераспределении ресурсов между кластерами.

Такая архитектура особенно эффективна для сред, где сочетаются разные типы нагрузок — аналитика, машинное обучение, транзакции. Ресурсы при этом перераспределяются без остановки приложений и без физического вмешательства в конфигурацию стоек.

Ключевые идеи

- Компонуемая архитектура позволяет программно объединять физически разделённые ресурсы. - Дезагрегация снижает зависимость между компонентами и продлевает срок службы инфраструктуры. - Управление осуществляется через единую программно-определяемую плоскость. - Архитектура обеспечивает оптимизацию нагрузки, гибкость масштабирования и энергоэффективность. - ЦОД становится модульным, самонастраиваемым и экономически устойчивым.