Инструменты пользователя

Инструменты сайта


topics:18:clusters

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слеваПредыдущая версия
Следующая версия
Предыдущая версия
topics:18:clusters [2025/11/15 16:43] – [6.4 Повторное использование тепла (Heat Reuse)] admintopics:18:clusters [2025/11/15 16:52] (текущий) – [4.6 Расширяемые] admin
Строка 78: Строка 78:
  
 ==== 3.1 Материнская плата ==== ==== 3.1 Материнская плата ====
-* Топология линий PCIe, расположение VRM и слотов DIMM определяют сопротивление потокам воздуха и тепловые режимы.   +  * Топология линий PCIe, расположение VRM и слотов DIMM определяют сопротивление потокам воздуха и тепловые режимы.   
-* Компактные стоечные платы оптимизируются под 19″, 1U–2U, с приоритетом прямого фронт-то-бэк обдува.+  * Компактные стоечные платы оптимизируются под 19″, 1U–2U, с приоритетом прямого фронт-то-бэк обдува.
  
 ==== 3.2 CPU ==== ==== 3.2 CPU ====
-* Выбор ядёр/частоты — под профиль задач (HPC, базы данных, виртуализация).   +  * Выбор ядёр/частоты — под профиль задач (HPC, базы данных, виртуализация).   
-* Эталонные тесты на основе геометрического среднего корректнее отражают «ватт-эффект» при смешанных нагрузках.   +  * Эталонные тесты на основе геометрического среднего корректнее отражают «ватт-эффект» при смешанных нагрузках.   
-* Ограничители эффективности: нехватка пропускной способности памяти, межпроцессорные задержки, «холодные» ветви кода.+  * Ограничители эффективности: нехватка пропускной способности памяти, межпроцессорные задержки, «холодные» ветви кода.
  
 ==== 3.3 Память ==== ==== 3.3 Память ====
-* Переход к новым поколениям (DDR4→DDR5) обычно улучшает энергоёмкость за счёт понижения напряжений и роста пропускной способности.   +  * Переход к новым поколениям (DDR4→DDR5) обычно улучшает энергоёмкость за счёт понижения напряжений и роста пропускной способности.   
-* Расстановка модулей по каналам важнее номинального объёма для производительности на ватт. +  * Расстановка модулей по каналам важнее номинального объёма для производительности на ватт. 
 + 
 ==== 3.4 Накопители ==== ==== 3.4 Накопители ====
-**SSD против HDD** (пример удельной производительности на ватт):  +**SSD против HDD** (пример удельной производительности на ватт):  
 ^ Параметр ^ SSD (2.5", ~960 ГБ) ^ HDD (2.5", ~900 ГБ) ^ ^ Параметр ^ SSD (2.5", ~960 ГБ) ^ HDD (2.5", ~900 ГБ) ^
 | Активная мощность, Вт | ~3.2 | ~7.6 | | Активная мощность, Вт | ~3.2 | ~7.6 |
Строка 97: Строка 97:
 | Удельная производительность, МБ/с·Вт | ~176 | ~39 | | Удельная производительность, МБ/с·Вт | ~176 | ~39 |
  
-* Компоновка **front-loading** упрощает замену дисков и улучшает сервисопригодность; **top-loading** потенциално повышает плотность, но усложняет обдув.+  * Компоновка **front-loading** упрощает замену дисков и улучшает сервисопригодность; **top-loading** потенциално повышает плотность, но усложняет обдув.
  
 ==== 3.5 Сетевые адаптеры (NIC) ==== ==== 3.5 Сетевые адаптеры (NIC) ====
-* 1 Гбит/с — минимальный стандарт на плате; высокоскоростные интерфейсы (25/40/100 Гбит/с, InfiniBand) требуют теплового резервирования и оценки энергетики порта.+  * 1 Гбит/с — минимальный стандарт на плате; высокоскоростные интерфейсы (25/40/100 Гбит/с, InfiniBand) требуют теплового резервирования и оценки энергетики порта.
  
 ==== 3.6 Блок питания (PSU) ==== ==== 3.6 Блок питания (PSU) ====
-КПД по классу **80 PLUS** (типовые значения при 230 В):  +КПД по классу **80 PLUS** (типовые значения при 230 В):  
 ^ Класс ^ КПД при 20 % ^ 50 % ^ 100 % ^ ^ Класс ^ КПД при 20 % ^ 50 % ^ 100 % ^
 | Gold | ~90 % | ~94 % | ~91 % | | Gold | ~90 % | ~94 % | ~91 % |
 | Platinum | ~92 % | ~96 % | ~94 % | | Platinum | ~92 % | ~96 % | ~94 % |
 | Titanium | ~94 % | ~96 % | ~94 % | | Titanium | ~94 % | ~96 % | ~94 % |
-* Использование постоянного тока (например, 380–400 В DC шины от ИБП к стойкам) снижает число преобразований и потери (актуально для новых ЦОД; в РФ — требуется индивидуальное технико-экономическое обоснование и соответствие нормам электробезопасности).+  * Использование постоянного тока (например, 380–400 В DC шины от ИБП к стойкам) снижает число преобразований и потери (актуально для новых ЦОД; в РФ — требуется индивидуальное технико-экономическое обоснование и соответствие нормам электробезопасности).
  
 ===== 4. Классы серверов по профилю вычислений ===== ===== 4. Классы серверов по профилю вычислений =====
 ==== 4.1 CPU-ориентированные ==== ==== 4.1 CPU-ориентированные ====
-* Сокеты 1/2/4, высокая пропускная способность памяти, строгий фронт-то-бэк обдув.   +  * Сокеты 1/2/4, высокая пропускная способность памяти, строгий фронт-то-бэк обдув.   
-* Допускается активное охлаждение на уровне радиаторов CPU, локально — жидкостные контуры для высоких TDP.+  * Допускается активное охлаждение на уровне радиаторов CPU, локально — жидкостные контуры для высоких TDP.
  
 ==== 4.2 GPU-серверы ==== ==== 4.2 GPU-серверы ====
-* Тепловая мощность одной GPU до 300 Вт и выше; **суммарно 2.5–3 кВт** на 4U — типичный уровень.   +  * Тепловая мощность одной GPU до 300 Вт и выше; **суммарно 2.5–3 кВт** на 4U — типичный уровень.   
-* Требуются канальные воздухо-барьеры, точные ограничения по зазорам PCIe, возможна изоляция зон питания/логики от турбулентности.+  * Требуются канальные воздухо-барьеры, точные ограничения по зазорам PCIe, возможна изоляция зон питания/логики от турбулентности.
  
 ==== 4.3 Хранилищные (Storage) ==== ==== 4.3 Хранилищные (Storage) ====
-* Ограничение — аэродинамика: блоки дисков в «носовой» части ухудшают подачу воздуха к CPU/памяти.   +  * Ограничение — аэродинамика: блоки дисков в «носовой» части ухудшают подачу воздуха к CPU/памяти.   
-* Новые форм-факторы (EDSFF) повышают плотность, сохраняя приемлемые аэродинамические сопротивления.+  * Новые форм-факторы (EDSFF) повышают плотность, сохраняя приемлемые аэродинамические сопротивления.
  
 ==== 4.4 Сетевые (Network) ==== ==== 4.4 Сетевые (Network) ====
-* Большие карты высокоскоростного трафика концентрируются в передней зоне; критичны к прогреву, желательно разделение тепловых зон.+  * Большие карты высокоскоростного трафика концентрируются в передней зоне; критичны к прогреву, желательно разделение тепловых зон.
  
 ==== 4.5 ASIC-ориентированные ==== ==== 4.5 ASIC-ориентированные ====
-* Под конкретные задачи (шифрование, маршрутизация, хэш-вычисления). Обеспечивают «сладкую точку» эффективности за счёт узкой специализации.   +  * Под конкретные задачи (шифрование, маршрутизация, хэш-вычисления). Обеспечивают «сладкую точку» эффективности за счёт узкой специализации.   
-* Возможны конфликтующие требования: ASIC горячий, CPU маломощный — важна направленная подача «холодного» воздуха к ASIC.+  * Возможны конфликтующие требования: ASIC горячий, CPU маломощный — важна направленная подача «холодного» воздуха к ASIC.
  
 ==== 4.6 Расширяемые ==== ==== 4.6 Расширяемые ====
-* Слоты под GPU/FPGA/NIC. Требуют расчёта «воздушного бюджета» при наращивании. Не каждая конфигурация энергосберегающа для любой задачи.+  * Слоты под GPU/FPGA/NIC. Требуют расчёта «воздушного бюджета» при наращивании. Не каждая конфигурация энергосберегающа для любой задачи.
  
 ===== 5. Концепции системного дизайна ===== ===== 5. Концепции системного дизайна =====
Строка 138: Строка 138:
 </WRAP> </WRAP>
  
-* **Баланс потоков воздуха**: прямой фронт-то-бэк, без перетоков между зонами CPU/GPU/накопителей.   +  * **Баланс потоков воздуха**: прямой фронт-то-бэк, без перетоков между зонами CPU/GPU/накопителей.   
-* **Тепловые решения**: тепло-распределительные крышки DIMM, воздуховоды, задние теплообменные двери, при необходимости — локальные жидкостные контуры.   +  * **Тепловые решения**: тепло-распределительные крышки DIMM, воздуховоды, задние теплообменные двери, при необходимости — локальные жидкостные контуры.   
-* **Электропитание**: выбор класса 80 PLUS с учётом реального диапазона нагрузки (чаще 30–60 %).   +  * **Электропитание**: выбор класса 80 PLUS с учётом реального диапазона нагрузки (чаще 30–60 %).   
-* **Постоянный ток**: сокращение двойных преобразований AC↔DC на пути «ИБП — PDU — сервер» (в условиях РФ — пилотные проекты, оценка надёжности и нормативов).+  * **Постоянный ток**: сокращение двойных преобразований AC↔DC на пути «ИБП — PDU — сервер» (в условиях РФ — пилотные проекты, оценка надёжности и нормативов).
  
 ===== 6. Эксплуатационные практики высокой эффективности ===== ===== 6. Эксплуатационные практики высокой эффективности =====
 ==== 6.1 Рациональное использование вычислительных ресурсов ==== ==== 6.1 Рациональное использование вычислительных ресурсов ====
-* Оптимальный профиль сервера ≠ «максимальная загрузка». Требуется настройка под конкретный вид работ: CPU-интенсивный рендеринг — на CPU-оптимизированном сервере; обучение ИИ — на GPU-системе.   +  * Оптимальный профиль сервера ≠ «максимальная загрузка». Требуется настройка под конкретный вид работ: CPU-интенсивный рендеринг — на CPU-оптимизированном сервере; обучение ИИ — на GPU-системе.   
-* Следить за средней загрузкой CPU 70–80 %; устойчивые 90–100 % — признак перегруза и рисков по температуре кристалла.+  * Следить за средней загрузкой CPU 70–80 %; устойчивые 90–100 % — признак перегруза и рисков по температуре кристалла.
  
 ==== 6.2 Виртуализация, VDI и SDDC ==== ==== 6.2 Виртуализация, VDI и SDDC ====
-* Виртуализация/контейнеризация повышают коэффициент использования CPU, памяти и дисков.   +  * Виртуализация/контейнеризация повышают коэффициент использования CPU, памяти и дисков.   
-* VDI консолидирует рабочие места, позволяя делить циклы CPU и сокращать «пустые» персональные машины.   +  * VDI консолидирует рабочие места, позволяя делить циклы CPU и сокращать «пустые» персональные машины.   
-* SDDC объединяет ресурсы (CPU/память/хранилище/сеть) программно, снижая издержки на единицу полезной работы.+  * SDDC объединяет ресурсы (CPU/память/хранилище/сеть) программно, снижая издержки на единицу полезной работы.
  
 ==== 6.3 Автоматизация и режимы простоя ==== ==== 6.3 Автоматизация и режимы простоя ====
-* Управление через BMC: автоматическое включение/выключение серверов по расписанию задач (снижение «холостых» потерь).   +  * Управление через BMC: автоматическое включение/выключение серверов по расписанию задач (снижение «холостых» потерь).   
-* Переходы в пониженные C-/P-состояния, корректные уставки частот и лимитов мощности.+  * Переходы в пониженные C-/P-состояния, корректные уставки частот и лимитов мощности.
  
 ==== 6.4 Повторное использование тепла (Heat Reuse) ==== ==== 6.4 Повторное использование тепла (Heat Reuse) ====
topics/18/clusters.1763225019.txt.gz · Последнее изменение: admin