Инструменты пользователя

Инструменты сайта


topics:reliability

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слеваПредыдущая версия
Следующая версия
Предыдущая версия
topics:reliability [2025/11/25 18:52] admintopics:reliability [2025/11/25 18:59] (текущий) admin
Строка 44: Строка 44:
 <mermaid> <mermaid>
 flowchart LR flowchart LR
-  A["1. Определение функций и критичных систем"] --> B["2. Сбор данных о надёжности"+  classDef big font-size:32px,stroke-width:2px,padding:18px; 
-  B --> C["3. Применение методов анализа (FMEAFTARBD, Markov)"] + 
-  C --> D["4. Оценка вероятностей отказов и времени простоя"+  A["1. Определение функций и критичных систем"]:::big -->  
-  D --> E["5. Разработка мероприятий (резервирование, тесты, процедуры)"] +  B["2. Сбор данных о надёжности"]:::big 
-  E --> F["6. Внедрение, контроль и периодический пересмотр"]+ 
 +  B -->  
 +  C["3. Методы анализа:<br/>FMEA FTA RBD / Марковские модели"]:::big 
 + 
 +  C -->  
 +  D["4. Оценка вероятностей отказов<br/>и времени простоя"]:::big 
 + 
 +  D -->  
 +  E["5. Разработка мероприятий:<br/>резервирование, тесты, процедуры"]:::big 
 + 
 +  E -->  
 +  F["6. Внедрение, контроль<br/>и регулярный пересмотр"]:::big
 </mermaid> </mermaid>
 +
 </WRAP> </WRAP>
  
Строка 66: Строка 78:
 **Ключевые параметры надёжности** **Ключевые параметры надёжности**
  
-  * *MTBF (Mean Time Between Failures)** — среднее время между отказами.  +  **MTBF (Mean Time Between Failures)** — среднее время между отказами.  
   * **MTTR (Mean Time To Repair)** — среднее время восстановления.     * **MTTR (Mean Time To Repair)** — среднее время восстановления.  
-  * **MDT (Mean Down Time)** — среднее время простоя с учётом логистики, диагностикиТО.   +  * **MDT (Mean Down Time)** — среднее время простоя с учётом логистики, диагностики и ТО.   
-  * **Availability A = MTBF / (MTBF + MDT)** — доступность системы.   +  * **Availability (A = MTBF / (MTBF + MDT))** — доступность системы.   
-  * **Failure frequency λ (1/год1/час)** — частота отказов.  +  * **Failure frequency λ** (1/год или 1/час) — частота отказов.  
   * **Dependability indexes** — показатели надёжности и доступности для критичных событий (UE).     * **Dependability indexes** — показатели надёжности и доступности для критичных событий (UE).  
-  * **Criticality** — уровень серьёзности последствий отказа.  +  * **Criticality** — серьёзность последствий отказа.  
 </WRAP> </WRAP>
 +
  
 <WRAP box round> <WRAP box round>
 **Типовые критичные события (UE) для ЦОД** **Типовые критичные события (UE) для ЦОД**
  
-  * UE1 — Loss of IT process (потеря IT-услуги) +  * **UE1 — Loss of IT process** (потеря IT-услуги)   
-  * UE2 — Safety risk (риск для персонала) +  * **UE2 — Safety risk** (риск для персонала)   
-  * UE3 — Environment pollution (экологические последствия)+  * **UE3 — Environment pollution** (экологические последствия)
  
-UE могут декомпозироваться по длительности и тяжести (например>4h, <4h, loss of data).+UE могут дополнительно декомпозироваться по длительности и тяжести   
 +(например: *> 4h**< 4h**loss of data*).
 </WRAP> </WRAP>
 +
  
 <WRAP box round> <WRAP box round>
 **Основные вопросы при оценке надёжности ЦОД** **Основные вопросы при оценке надёжности ЦОД**
  
-  * Правильно ли определены функции инфраструктуры (F1…F7)?   +  * Определены ли функции инфраструктуры (F1…F7)?   
-  * Выделены ли UE и сформированы цели по недоступности/частоте отказов?  +  * Выделены ли UE и цели по недоступности/частоте отказов?  
   * Собраны ли данные о надёжности оборудования (λ, MDT, MTTR)?     * Собраны ли данные о надёжности оборудования (λ, MDT, MTTR)?  
-  * Оценены ли слабые места архитектуры (single points of failure)?  +  * Идентифицированы ли слабые места архитектуры (SPOF)?  
   * Применены ли корректные методы анализа (FMEA/FMECA, FTA, RBD, Markov)?     * Применены ли корректные методы анализа (FMEA/FMECA, FTA, RBD, Markov)?  
-  * Проверена ли соответствие Tier-требованиям?   +  * Проверено ли соответствие Tier-требованиям?   
-  * Учитываются ли деградированные режимы, отказ датчиков, автоматики, SCADA?   +  * Учтены ли деградированные режимы, отказ автоматики, датчиков, SCADA?   
-  * Учтены ли common-mode failures (общие причины отказов)?   +  * Учитываются ли common-mode failures (общие причины отказов)?   
-  * Обновляется ли анализ на стадиях проектирования, строительно-монтажных работ и эксплуатации?  +  * Обновляется ли анализ на стадиях проектирования, монтажа и эксплуатации?  
 </WRAP> </WRAP>
 +
  
 <WRAP box round> <WRAP box round>
-**Результат применения инженерии надёжности**+**Результаты применения инженерии надёжности**
  
-  * корректно подобранный уровень резервирования N+1/N+2/2N;   +  * корректно подобранная схема резервирования (N+1N+22N);   
-  * отсутствие невыявленных SPOF;   +  * отсутствие скрытых SPOF;   
-  * выверенный баланс стоимости и надёжности;  +  * баланс стоимости и надёжности;  
   * соответствие Tier-требованиям;     * соответствие Tier-требованиям;  
   * количественные показатели надёжности по каждому UE;     * количественные показатели надёжности по каждому UE;  
-  * единая методология для инженеровэксплуатации и проектировщиков.+  * единая методология для проектирования и эксплуатации.  
 </WRAP> </WRAP>
 +
  
topics/reliability.1764096735.txt.gz · Последнее изменение: admin