====== Компонуемая и дезагрегированная архитектура ЦОД ======
Раздел рассматривает принципы **компонуемой (composable)** и **дезагрегированной (disaggregated)** архитектуры центров обработки данных — физическую основу для реализации программно-определяемых сред (SDE).
Главная цель — разделить ресурсы на независимые пулы и объединять их программно в соответствии с требованиями нагрузки.
===== Общая идея =====
Традиционные ЦОД построены по модели **spine–leaf**, где серверы в стойках соединены с коммутаторами уровня Top-of-Rack (ToR), а те, в свою очередь, связаны через центральный коммутатор (spine).
Каждый сервер включает вычислительные ядра, память, накопители и сетевые интерфейсы, объединённые физически в один блок.
Такое проектирование создаёт проблему синхронного обновления: если требуется заменить один компонент, приходится обновлять весь узел целиком. Это ограничивает внедрение новых технологий и снижает эффективность использования оборудования.
**Дезагрегация** устраняет эту зависимость, разделяя процессоры, память, диски, графические ускорители и сетевые адаптеры на отдельные модули.
**Компоновка** (composition) позволяет программно объединять их в нужную конфигурацию под конкретную задачу.
===== Принципы построения =====
1. **Разделение ресурсов по типам.**
Вычислительные узлы, память, графические ускорители и хранилища существуют как независимые элементы инфраструктуры.
2. **Формирование пула ресурсов.**
Ресурсы объединяются в пулы (CPU, RAM, GPU, SSD, сеть), доступные для динамического выделения.
3. **Программная компоновка.**
Логические серверы создаются на основе политик SDE, которые определяют требуемые характеристики нагрузки.
4. **Динамическое масштабирование.**
Состав «виртуального узла» изменяется автоматически при изменении нагрузки или отказе компонентов.
5. **Гибкость обновления.**
Модули могут модернизироваться независимо, без замены всего узла или стойки.
**Логика работы компонуемой инфраструктуры**
flowchart TB
classDef big font-size:12px,stroke-width:1.2px,padding:10px;
Pools["Пулы ресурсов: CPU / GPU / RAM / SSD / Network"]:::big --> Composition["Плоскость компоновки (Software-Defined Control)"]:::big
Composition --> Workload1["Конфигурация A (аналитика)"]:::big
Composition --> Workload2["Конфигурация B (OLTP)"]:::big
Composition --> Workload3["Конфигурация C (AI/ML)"]:::big
Monitoring["Мониторинг и управление политиками"]:::big --- Composition
===== Преимущества =====
* **Гибкость.** Возможность создавать любые конфигурации без физического вмешательства.
* **Оптимизация затрат.** Повышение загрузки оборудования и снижение избыточных ресурсов.
* **Масштабируемость.** Быстрое расширение мощностей за счёт добавления отдельных модулей.
* **Долговечность.** Замена и обновление оборудования выполняются по мере необходимости, а не синхронно.
* **Энергоэффективность.** Отсутствие постоянного резервирования вычислительных блоков.
===== Практические особенности =====
- **Локализация данных.**
Совместное использование ресурсов требует высокой пропускной способности сетевых соединений. Например, при работе с базами данных доступ к данным по Ethernet снижает задержки по сравнению с SATA.
- **Обеспечение кэширования.**
Рекомендуется сохранять часть локальной DRAM для ускорения обмена между ЦП и внешними пулами памяти, чтобы снизить задержки при обращении к удалённым ресурсам.
- **Сбалансированное распределение нагрузки.**
Использование SMT (Simultaneous Multithreading) и высокопараллельных приложений помогает уменьшить потери производительности при разделении памяти и I/O.
- **Синхронизация и задержки.**
В компонуемых системах наблюдается полнее использование ЦП и повышение пропускной способности до 1,5–1,6 раз по сравнению с традиционными архитектурами, при этом снижение производительности при удалённом доступе к данным минимально (до 10–15 %).
===== Технологические уровни реализации =====
1. **Аппаратный уровень.**
Используются высокоскоростные межсоединения (PCIe, CXL, InfiniBand) и механизмы RDMA для низкой задержки при доступе к удалённым ресурсам.
2. **Уровень гипервизора и ОС.**
Управление ресурсами реализуется через драйверы и диспетчеры памяти, поддерживающие «горячее» подключение модулей.
3. **Платформенный уровень.**
Плоскость SDE обеспечивает взаимодействие приложений с пулами ресурсов через политики, SLA и шаблоны конфигурации.
4. **Прикладной уровень.**
Приложения взаимодействуют с инфраструктурой через API и политики, формируя нужный набор характеристик без прямого доступа к оборудованию.
===== Эффективность и примеры =====
Исследования показывают, что:
* компонуемые системы выдерживают нагрузку до **1,6×** выше по сравнению с классическими серверами;
* при оптимальном выделении памяти и кэшировании DRAM потери производительности составляют не более **10 %**;
* возможно снижение потребности в выделенной памяти до **60 %** при динамическом перераспределении ресурсов между кластерами.
Такая архитектура особенно эффективна для сред, где сочетаются разные типы нагрузок — аналитика, машинное обучение, транзакции.
Ресурсы при этом перераспределяются без остановки приложений и без физического вмешательства в конфигурацию стоек.
===== Ключевые идеи =====
- Компонуемая архитектура позволяет программно объединять физически разделённые ресурсы.
- Дезагрегация снижает зависимость между компонентами и продлевает срок службы инфраструктуры.
- Управление осуществляется через единую программно-определяемую плоскость.
- Архитектура обеспечивает оптимизацию нагрузки, гибкость масштабирования и энергоэффективность.
- ЦОД становится модульным, самонастраиваемым и экономически устойчивым.