Контакты
Подписка
МЕНЮ
Контакты
Подписка

В рубрику "Центры обработки данных (ЦОД)" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Отказоустойчивый ЦОД – цена вопросаData Center Sustainability and Uptime – The Price of the Question

В статье рассматривается вопрос отказоустойчивости центров обработки данных, а также основные элементы, обеспечивающие надежность ЦОД. От устойчивой работы дата-центра зависит бизнес и развитие компании. Автор приходит к выводу, что тема "цены вопроса" отказоустойчивого ЦОД должна быть включена в бизнес-стратегию компании.

The article discusses the sus-tainability and uptime of the data centers andthe main elements to ensure the reliability of the data center. Business and development of the company depend highly on reliable operation of the data center. The author concludes that the "issue price" of resilient data center should be considered as part of the business strategy of the company.

Сергей Рассказов
Президент и генеральный директор DataSpace
Sergei Rasskazov
President at DataSpace
Ключевые слова:
центр обработки данных, отказоустойчивость, надежность, безопасность, квалификация, бизнес
Keywords:
data center, reliability, safety, qualification, business, resilience

Центр обработки данных и вопросы его надежности для организации, в которой информационные технологии являются частью ключевого стратегического преимущества, – это вопрос жизни или смерти. От того, с какой степенью надежности и непрерывности работают IТ, в конечном итоге может зависеть успех или полный провал компании.

По оценкам аналитиков, исследующих стоимость простоя в различных индустриях, в среднем бизнес теряет $84 000–108 000 за час простоя, однако есть области, такие как биржевая торговля, энергетика, телекоммуникационные услуги, где эта величина составляет $6,46 млн, 2,8 млн и 2 млн долларов соответственно1. Именно эти величины стоит ставить во главу угла при принятии решения о том, каким должен быть ЦОД и насколько вопрос отказоустойчивости важен для бизнеса. В конечном счете, это и будет определять "цену вопроса" ЦОД, выделяемый бюджет, его архитектуру и составляющие его компоненты.

Архитектура

Архитектура ЦОД напрямую влияет на показатели отказоустойчивости. В английском языке есть очень весомый термин "uptime", пионером которого стал Uptime Institute, основанный в 1993 г., именно он представил хорошо структурированную систему классификации по Tier: I, II, III и IV, где IV представляет собой наиболее высокий уровень ожидаемой доступности и отказоустойчивости. Сегодня система сертификации Uptime Institute является общепризнанной, и ее участниками являются крупнейшие глобальные компании.

Сертификация

Сертификация оценивает как дизайн и архитектуру ЦОД, уровни резервирования и отказоустойчивости отдельных компонент, так и практики операционного управления.

Термины, используемые в стандарте, такие как "N, N+1 и 2N", обычно говорят о количестве отдельных компонентов, составляющих инфраструктуру ЦОД, где N – минимальное количество элементов того или иного компонента, необходимых для поддержания критической нагрузки. Система из N элементов не имеет резервирования, и выход из строя какого-либо элемента приведет к перерыву в работе. Соответственно, рейтинги "N+1" и "2N" говорят о повышенных уровнях резервирования.


Кроме резервирования очень важным фактором является возможность обслуживания и ремонта каждого из элементов без необходимости вывода из строя всего компонента.

Ключевые подсистемы и компоненты отказоустойчивости

Система электроснабжения, системы охлаждения, автоматическая система пожаротушения, системы безопасности, служба технической поддержки, план действий в чрезвычайных ситуациях, подготовка персонала для предотвращения аварий, профилактический ремонт и техническое обслуживание – все это считается ключевыми компонентами и подсистемами отказоустойчивости.

Система электроснабжения

ЦОД должен быть способен обеспечить автономное гарантированное электропитание IТ-инфраструктуры своих клиентов. Единственной гарантией надежного и бесперебойного электропитания (и охлаждения) оборудования является соответствие центра обработки данных требованиям к системе параллельного технического обслуживания. Такая система подразумевает возможность производить проверку, техническое обслуживание, ремонт и замену любого из критически важных элементов инженерной инфраструктуры ЦОД без остановки и отключения IТ-нагрузки. Если объект не обеспечивает возможности параллельного техобслуживания систем электропитания и охлаждения, то аварии неизбежны.

Системы охлаждения

Несмотря на то, что охлаждение оборудования столь же важно, как и его электропитание, зачастую ему уделяют гораздо меньше внимания. Плохо спроектированные и некачественно эксплуатируемые ЦОД способны обеспечить электропитание при потере городского ввода, чего, к сожалению, нельзя сказать об их системах охлаждения. Это происходит потому, что система охлаждения не была зарезервирована на требуемом уровне избыточности.

Автоматическая система пожаротушения

Большинство центров обработки данных использует машинные залы большой площади, в которых размещается большое количество оборудования. И, как правило, в такой ситуации достаточно сложно держать руку на пульсе всего происходящего в машинном зале. При этом очень важно понимать, какой тип системы пожаротушения используется в ЦОД. Ее надежность и безопасность для людей существенно влияют на стоимость, но сбои в ее работе и бесконтрольная активация приведут к приостановке оказываемых услуг.

Служба технической поддержки

Цель предоставления таких услуг – помощь клиентам в обслуживании их IТ-инфраструктуры и оборудования. Ключевыми для таких услуг являются четкая и прозрачная система получения, обработки и исполнения заявок, а также постоянное присутствие на объекте опытных и квалифицированных сотрудников в режиме 24/7/365.

Обучение и квалификация персонала

Обучение – важнейший элемент надежности ЦОД. У вас может быть идеальный с технической точки зрения дата-центр с прекрасно продуманной системой параллельного обслуживания, но причиной подавляющего большинства аварий в центрах обработки данных является человеческий фактор. Инвестиции в обучение и отработку практических навыков инженеров, для того чтобы и ЦОД, и команда, эксплуатирующая его, были одинаково надежными, являются существенными, но без них нельзя говорить об отказоустойчивости.

Системы безопасности

Физическая безопасность – не менее важный элемент, чем среда и условия, в которых функционирует оборудование. Важно, чтобы инвестиции в безопасность покрывали все ее уровни – от защиты периметра и промежуточной зоны до инженерных систем обеспечения физической безопасности и внутреннего режима объекта.

Каждый из вышеперечисленных элементов имеет свои стоимостные характеристики, и существует достаточно широкий выбор вариантов и технологий, на которых может быть построен ЦОД, но только сбалансированный дизайн и слаженное функционирование их всех сможет в итоге гарантировать бесперебойную работу.

Дата-центр – это очень сложное в инженерном и технологическом плане сооружение, проектирование, строительство, ввод в эксплуатацию и обслуживание которого требует специального опыта и компетенций. Для банка или финансового института компетенции в области систем пожаротушения, электроснабжения, охлаждения, кондиционирования и мониторинга не всегда являются чем-то широко распространенным. От того, насколько организация готова инвестировать в этот набор компетенций и развивать их самостоятельно или использовать внешнего поставщика, в конечном итоге будут зависеть ее бизнес-показатели, такие, например, как скорость выхода на рынок ее конечного продукта, возврат на инвестиции и т.д.

Важным компонентом является также баланс между операционными и капитальными затратами и то, как этот баланс влияет на финансовые приоритеты.

Очень часто работа с внешним поставщиком, особенно являющимся лидером в своей области, может быть более прогнозируемой, так как это позволит синхронизировать уровень операционных затрат с уровнем доходов и прибыльности и позволит гарантированно получать стабильный уровень услуг, избегая существенных капитальных инвестиций.

Подводя итог, хочется отметить, что тема "цены вопроса" отказоустойчивого ЦОД должна рассматриваться как часть бизнес-стратегии компании, как отражение ее приоритетов в тесной связи с общими подходами к оценке бизнес-рисков.

___________________________________________
1 Источник: Assessing the Financial Impact of Downtime. Vision Solutions

Литература

  1. Инфраструктура ЦОД // Tier. Журнал о дата-центрах. – 201. – № 3. – С. 6–17
  2. Орлов С. // Журнал сетевых решений/LAN. – 2014. – № 7. – С. 55
  3. Михнев О. Коммерческий ЦОД: правила эффективного инвестирования // Журнал сетевых решений/LAN. – 2010. – № 03 [online]. Доступ через http://www.osp.ru/lan/2010/03/13001374/
  4. Куперман М., Аверьянов Д. Резервный центр обработки данных. Оценка надежности // Электроника: наука, технология, бизнес. – 2010. [online]. Доступ через http://www.electronics.ru/journal/article/75
  5. Решения для повышения надежности центров обработки данных // Элек.ру. – 2013. [online]. Доступ через http://www.elec.ru/articles/resheniya-dlya-povysheniya-nadyozhnosti-centrov-ob/
  6. The Lowdown on Data Center Downtime: Frequency, Root Causes and Costs // Emerson Network Power. – 2014. [online]. Доступ через http://www.emersonnetwork-power.com/en-US/Solutions/ByApplication/DataCenterNe-tworking/Data-Center-Insights/Pages/Causes_of_Downti-me_Study.aspx
  7. Семенов А.Б. Структурированные кабельные системы для центров обработки данных. – М.: ДМК-Пресс, 2014. – 232 с.
  8. Орлов С. IТ-инфраструктура ЦОД: новые подходы // Журнал сетевых решений/LAN. – 2014. – № 7. – C. 22–28

Опубликовано: Журнал "Технологии и средства связи" #6, 2014
Посещений: 8543

Статьи по теме

  Автор

Сергей Рассказов

Сергей Рассказов

Президент и генеральный директор DataSpace

Всего статей:  1

В рубрику "Центры обработки данных (ЦОД)" | К списку рубрик  |  К списку авторов  |  К списку публикаций