topics:reliability
Различия
Показаны различия между двумя версиями страницы.
| Предыдущая версия справа и слеваПредыдущая версияСледующая версия | Предыдущая версия | ||
| topics:reliability [2025/11/25 18:57] – admin | topics:reliability [2025/11/25 18:59] (текущий) – admin | ||
|---|---|---|---|
| Строка 78: | Строка 78: | ||
| **Ключевые параметры надёжности** | **Ключевые параметры надёжности** | ||
| - | * *MTBF (Mean Time Between Failures)** — среднее время между отказами. | + | |
| * **MTTR (Mean Time To Repair)** — среднее время восстановления. | * **MTTR (Mean Time To Repair)** — среднее время восстановления. | ||
| - | * **MDT (Mean Down Time)** — среднее время простоя с учётом логистики, | + | * **MDT (Mean Down Time)** — среднее время простоя с учётом логистики, |
| - | * **Availability A = MTBF / (MTBF + MDT)** — доступность системы. | + | * **Availability |
| - | * **Failure frequency λ (1/год, 1/час)** — частота отказов. | + | * **Failure frequency λ** (1/ |
| * **Dependability indexes** — показатели надёжности и доступности для критичных событий (UE). | * **Dependability indexes** — показатели надёжности и доступности для критичных событий (UE). | ||
| - | * **Criticality** — уровень | + | * **Criticality** — серьёзность последствий отказа. |
| </ | </ | ||
| Строка 91: | Строка 91: | ||
| **Типовые критичные события (UE) для ЦОД** | **Типовые критичные события (UE) для ЦОД** | ||
| - | * UE1 — Loss of IT process (потеря IT-услуги) | + | |
| - | * UE2 — Safety risk (риск для персонала) | + | |
| - | * UE3 — Environment pollution (экологические последствия) | + | |
| - | UE могут декомпозироваться по длительности и тяжести (например, >4h, <4h, loss of data). | + | UE могут |
| + | (например: *> 4h*, *< 4h*, *loss of data*). | ||
| </ | </ | ||
| Строка 101: | Строка 102: | ||
| <WRAP box round> | <WRAP box round> | ||
| **Основные вопросы при оценке надёжности ЦОД** | **Основные вопросы при оценке надёжности ЦОД** | ||
| - | | + | |
| - | * Выделены ли UE и сформированы | + | |
| + | * Выделены ли UE и цели по недоступности/ | ||
| * Собраны ли данные о надёжности оборудования (λ, MDT, MTTR)? | * Собраны ли данные о надёжности оборудования (λ, MDT, MTTR)? | ||
| - | * Оценены ли слабые места архитектуры (single points of failure)? | + | * Идентифицированы ли слабые места архитектуры (SPOF)? |
| * Применены ли корректные методы анализа (FMEA/ | * Применены ли корректные методы анализа (FMEA/ | ||
| - | * Проверена ли соответствие Tier-требованиям? | + | * Проверено ли соответствие Tier-требованиям? |
| - | * Учитываются | + | * Учтены ли деградированные режимы, |
| - | * Учтены ли common-mode failures (общие причины отказов)? | + | * Учитываются |
| - | * Обновляется ли анализ на стадиях проектирования, | + | * Обновляется ли анализ на стадиях проектирования, |
| </ | </ | ||
| <WRAP box round> | <WRAP box round> | ||
| - | **Результат применения инженерии надёжности** | + | **Результаты применения инженерии надёжности** |
| - | * корректно подобранный уровень резервирования N+1/N+2/2N; | + | * корректно подобранная схема резервирования |
| - | * отсутствие | + | * отсутствие |
| - | * выверенный | + | * баланс стоимости и надёжности; |
| * соответствие Tier-требованиям; | * соответствие Tier-требованиям; | ||
| * количественные показатели надёжности по каждому UE; | * количественные показатели надёжности по каждому UE; | ||
| - | * единая методология для инженеров, эксплуатации | + | * единая методология для |
| </ | </ | ||
| + | |||
topics/reliability.1764097052.txt.gz · Последнее изменение: — admin
