Это старая версия документа!
Содержание
Финансово-техническое обоснование проекта
Раздел рассматривает взаимосвязь бизнес-требований, проектных решений и допустимого уровня риска при проектировании центров обработки данных. Оптимальный баланс между стоимостью, надёжностью и устойчивостью достигается на этапе формирования концепции и архитектуры объекта.
Соответствие бизнес-требованиям
Первая фаза цикла Колба в контексте ЦОД соответствует бизнес-аспекту проекта. На этом этапе заказчик формулирует исходные требования (Owner’s Project Requirements, OPR) — назначение объекта, целевые показатели надёжности и доступности, допустимый уровень простоев.
В Великобритании данная стадия перекрывает первые два уровня системы RIBA:
- Stage 0 — стратегическое определение проекта;
- Stage 1 — подготовка и формирование задания.
Задача проектировщика — обеспечить соответствие проектных решений уровню приемлемого риска для бизнеса. Например:
- Небольшая инжиниринговая компания может позволить себе простой веб-сайта на 2 дня без значимых последствий.
- Крупный онлайн-трейдер не может допустить даже кратковременного сбоя.
Оценка стоимости отказа
Для количественной оценки риска используется базовая зависимость:
$$ Риск = Вероятность\ отказа \times Тяжесть\ последствий $$
Где:
- Риск — экономический эквивалент убытков (в год);
- Вероятность отказа — число сбоев в год;
- Тяжесть последствий — средняя стоимость одного отказа.
Пример расчёта: Если сбой происходит раз в два года, а стоимость одного отказа составляет 10 млн $, годовой риск равен:
$$ Риск = \frac{1}{2}\times10{\,}000{\,}000 = 5{\,}000{\,}000\ \$/год $$ </WRAP> Если такие сбои происходят в течение 10 лет, общий ущерб составит 50 млн $. Теперь рассмотрим вариант модернизации, уменьшающий вероятность отказа до одного случая за 10 лет при дополнительных инвестициях в 2 млн $:
$$ Риск = \frac{1}{10}\times10{\,}000{\,}000 = 1{\,}000{\,}000\ \$/год $$ </WRAP> Совокупные потери снижаются с 50 млн $ до 12 млн $ (включая инвестиции), то есть экономия составляет 38 млн $. Период окупаемости дополнительных вложений:
$$ T_{окуп} = \frac{2{\,}000{\,}000}{(5{\,}000{\,}000 - 1{\,}000{\,}000)} = 0{,}5\ года $$
- Математическая оценка риска позволяет обосновать инвестиции в надёжность. - Правильно рассчитанный уровень резервирования снижает общие издержки на жизненном цикле объекта.
Топология и уровень отказоустойчивости
Топология инженерных систем определяет допустимый уровень простоев и стоимость владения. Классификация надёжности в соответствии с типовыми уровнями резервирования:
| Уровень | Описание |
|---|---|
| Tier 1 | Отсутствие резервирования систем. |
| Tier 2 | Частичное резервирование (N+1), допускает кратковременные простои. |
| Tier 3 | Полное резервирование активных и пассивных путей, обслуживание без остановки. |
| Tier 4 | Отказоустойчивость с избыточными путями и отсутствием единичных точек отказа. |
Выбор топологии должен определяться бизнес-требованиями. Чем выше уровень надёжности — тем выше капитальные затраты, но ниже риск потерь от простоя.
Выбор площадки
Каждая площадка несёт собственные риски. При выборе необходимо учитывать:
- природные и климатические угрозы (паводки, землетрясения, ураганы);
- близость транспортных узлов и инфраструктуры;
- риски внешних воздействий (терроризм, аварии на промышленных объектах);
- энергетическую надёжность и резервирование сетей;
- санитарные и экологические ограничения.
Для распределения нагрузки и снижения совокупного риска могут применяться:
- несколько взаиморезервируемых площадок;
- географическое разделение объектов (redundant sites);
- зеркалирование и дублирование данных.
При чрезмерной близости площадок растёт вероятность одновременного отказа. При избыточной удалённости — увеличиваются затраты и задержки связи. Оптимум определяется бизнес-моделью.
Формирование обучающей среды
Для снижения риска важно, чтобы организация поддерживала культуру обучения и передачи опыта. Операторы, не обладающие знаниями о причинах отказов, чаще допускают ошибки. Ключевые принципы:
- обучение персонала до ввода объекта в эксплуатацию;
- формирование среды, где ошибки рассматриваются как источник знаний;
- закрепление опыта в инструкциях, планах эксплуатации и процедурах реагирования;
- создание механизма передачи знаний между сменами и подразделениями.
- Инвестиции в обучение окупаются через снижение частоты отказов и повышение надёжности. - Формирование «обучающей организации» является частью экономического обоснования ЦОДа.
