Различия

Показаны различия между двумя версиями страницы.

--- topics:reliability [2025/11/25 18:52] – admin
+++ topics:reliability [2025/11/25 18:59] (текущий) – admin
@@ Строка 44: / Строка 44: @@
 <mermaid>
 flowchart LR
-  A["1. Определение функций и критичных систем"] --> B["2. Сбор данных о надёжности"]
+  classDef big font-size:32px,stroke-width:2px,padding:18px;
-  B --> C["3. Применение методов анализа (FMEA, FTA, RBD, Markov)"]
-  C --> D["4. Оценка вероятностей отказов и времени простоя"]
+  A["1. Определение функций и критичных систем"]:::big -->
-  D --> E["5. Разработка мероприятий (резервирование, тесты, процедуры)"]
+  B["2. Сбор данных о надёжности"]:::big
-  E --> F["6. Внедрение, контроль и периодический пересмотр"]
+  B -->
+  C["3. Методы анализа:<br/>FMEA / FTA / RBD / Марковские модели"]:::big
+  C -->
+  D["4. Оценка вероятностей отказов<br/>и времени простоя"]:::big
+  D -->
+  E["5. Разработка мероприятий:<br/>резервирование, тесты, процедуры"]:::big
+  E -->
+  F["6. Внедрение, контроль<br/>и регулярный пересмотр"]:::big
 </mermaid>
 </WRAP>
@@ Строка 66: / Строка 78: @@
 **Ключевые параметры надёжности**
-  * *MTBF (Mean Time Between Failures)** — среднее время между отказами.
+  * **MTBF (Mean Time Between Failures)** — среднее время между отказами.
   * **MTTR (Mean Time To Repair)** — среднее время восстановления.
-  * **MDT (Mean Down Time)** — среднее время простоя с учётом логистики, диагностики, ТО.
+  * **MDT (Mean Down Time)** — среднее время простоя с учётом логистики, диагностики и ТО.
-  * **Availability A = MTBF / (MTBF + MDT)** — доступность системы.
+  * **Availability (A = MTBF / (MTBF + MDT))** — доступность системы.
-  * **Failure frequency λ (1/год, 1/час)** — частота отказов.
+  * **Failure frequency λ** (1/год или 1/час) — частота отказов.
   * **Dependability indexes** — показатели надёжности и доступности для критичных событий (UE).
-  * **Criticality** — уровень серьёзности последствий отказа.
+  * **Criticality** — серьёзность последствий отказа.
 </WRAP>
 <WRAP box round>
 **Типовые критичные события (UE) для ЦОД**
-  * UE1 — Loss of IT process (потеря IT-услуги)
+  * **UE1 — Loss of IT process** (потеря IT-услуги)
-  * UE2 — Safety risk (риск для персонала)
+  * **UE2 — Safety risk** (риск для персонала)
-  * UE3 — Environment pollution (экологические последствия)
+  * **UE3 — Environment pollution** (экологические последствия)
-UE могут декомпозироваться по длительности и тяжести (например, >4h, <4h, loss of data).
+UE могут дополнительно декомпозироваться по длительности и тяжести
+(например: *> 4h*, *< 4h*, *loss of data*).
 </WRAP>
 <WRAP box round>
 **Основные вопросы при оценке надёжности ЦОД**
-  * Правильно ли определены функции инфраструктуры (F1…F7)?
+  * Определены ли функции инфраструктуры (F1…F7)?
-  * Выделены ли UE и сформированы цели по недоступности/частоте отказов?
+  * Выделены ли UE и цели по недоступности/частоте отказов?
   * Собраны ли данные о надёжности оборудования (λ, MDT, MTTR)?
-  * Оценены ли слабые места архитектуры (single points of failure)?
+  * Идентифицированы ли слабые места архитектуры (SPOF)?
   * Применены ли корректные методы анализа (FMEA/FMECA, FTA, RBD, Markov)?
-  * Проверена ли соответствие Tier-требованиям?
+  * Проверено ли соответствие Tier-требованиям?
-  * Учитываются ли деградированные режимы, отказ датчиков, автоматики, SCADA?
+  * Учтены ли деградированные режимы, отказ автоматики, датчиков, SCADA?
-  * Учтены ли common-mode failures (общие причины отказов)?
+  * Учитываются ли common-mode failures (общие причины отказов)?
-  * Обновляется ли анализ на стадиях проектирования, строительно-монтажных работ и эксплуатации?
+  * Обновляется ли анализ на стадиях проектирования, монтажа и эксплуатации?
 </WRAP>
 <WRAP box round>
-**Результат применения инженерии надёжности**
+**Результаты применения инженерии надёжности**
-  * корректно подобранный уровень резервирования N+1/N+2/2N;
+  * корректно подобранная схема резервирования (N+1, N+2, 2N);
-  * отсутствие невыявленных SPOF;
+  * отсутствие скрытых SPOF;
-  * выверенный баланс стоимости и надёжности;
+  * баланс стоимости и надёжности;
   * соответствие Tier-требованиям;
   * количественные показатели надёжности по каждому UE;
-  * единая методология для инженеров, эксплуатации и проектировщиков.
+  * единая методология для проектирования и эксплуатации.
 </WRAP>