В рубрику "Решения корпоративного класса" | К списку рубрик | К списку авторов | К списку публикаций

Анализ современных систем мониторинга работоспособности вычислительной сети и порядка ее восстановленияThe analysis of the modern health monitoring system of computer networks and order for its recovery

Современная система мониторинга требует комплексного подхода к решению всех возникающих проблем работоспособности вычислительной сети. Modern communication system requires a comprehensive approach to the solution of all problems by health area network.

Вячеслав
Палащенко

Майор внутренней службы, главный специалист отдела информационных технологий, АСУ и связи Северо-Кавказского регионального центра МЧС России

Vyacheslav
PalashchenkoThe main specialist of the department of information technology and communications North-Caucasian regional center of The Ministry of the Russian Federation for Affairs for Civil Defence, Emergencies and Elimination of Consequences of Natural Disasters

Антон
Судьин

Старший лейтенант внутренней службы, инженер отделения стационарных средств связи и технических систем оповещения ФКУ "Центр управления в кризисных ситуациях главного управления МЧС России по Астраханской области"

Anton
Sud’inSenior lieutenant of internal service, engineer office stationary communications and technical systems, Centre of crisis situations of the main department of The Ministry of the Russian Federation for Affairs for Civil Defence, Emergencies and Elimination of Consequences of Natural Disasters in the Astrakhan region

Ключевые слова:

мониторинг, работоспособность, безопасность

Keywords:

monitoring, performance, security

Необходимость мониторинга

Мониторинг работоспособности вычислительной сети – это работа системы, которая выполняет постоянное наблюдение за вычислительной сетью в поисках медленных или неисправных систем, а при обнаружении таковых сообщает о них администратору сети с помощью средств оповещения. Мониторинг является одной из самых важных задач, необходимых для организации полноценного управления вычислительной сетью. Процесс выявления самих неисправностей и формирования комплекса мероприятий может занять значительное время и существенно повлиять на функционирование системы автоматизации предприятия в целом. Частые отказы или длительные периоды неработоспособного состояния сети могут привести к полной потере работоспособности системы автоматизации предприятия. Для повышения оперативности принятия мер, способных вернуть вычислительную сеть в режим штатного функционирования, необходимо проведение мониторинга сети, который в большей части зависит от человеческого фактора. Профессионального опыта специалиста, эксплуатирующего большие вычислительные сети, зачастую не хватает для оперативной диагностики сети и принятия решения при устранении сбоев в ее работе.

Детализируя понятие вычислительной сети, можно сказать, что вычислительная сеть состоит из среды (сред) передачи данных, каналообразующего оборудования, оконечного пользовательского оборудования. Осуществление мониторинга необходимо производить за каждым элементом вычислительной сети, в дальнейшем объединяя результат мониторинга в единую оценку всей вычислительной сети.

Виды и способы мониторинга

Наиболее простой системой мониторинга, или, правильнее сказать, командой для мониторинга, используемой практически во всех небольших организациях, в которых отсутствуют любые программные или аппаратные системы мониторинга, является команда "ping". Контроль осуществляется периодически, при пропадании сети или в постоянном режиме до определенных узлов сети. После того, как выявляется отсутствие связи с каким-либо из узлов сети, проводится уточняющая работа по выявлению конкретной неисправности сети (сети связи, каналообразующая аппаратура и т.п.). Однако использование команды "ping" не позволяет оперативно найти неисправность и требует постоянного операторского присутствия. При использовании больших вычислительных сетей или разнородных сетей данная команда может просто не работать.

Современные требования к вычислительным сетям требуют более точного и гибкого подхода к мониторингу. От корректной работы Web-серверов и серверов баз данных может зависеть работоспособность внутрикорпоративных приложений и важных внешних сервисов для клиентов. Сбои и нарушения работы маршрутизаторов могут нарушать связь между различными частями корпорации и ее филиалами. Серверы внутренней почты и сетевых мессенджеров, автоматических обновлений и резервного копирования, принт-серверы – любые из этих элементов могут страдать от программных и аппаратных сбоев. Задача системы мониторинга – это предупреждение, так как перерывы в работе сети в целом влияют на авторитет организации, коммерческие организации теряют заработок при неработоспособности вычислительной сети, а государственные организации, такие как МВД или МЧС России, теряют управление подразделениями, а следовательно, неработоспособность вычислительной сети может быть прямой угрозой для жизни и здоровья людей.

Поэтому эти организации используют разнообразные средства и продукты для мониторинга. Рассмотрим несколько классов этих продуктов.

Средства мониторинга

Системы управления сетью (Network Management Systems) – это централизованные программные системы, которые собирают данные о состоянии узлов и коммуникационных устройств сети, а также о трафике, циркулирующем в сети. Эти системы не только осуществляют мониторинг и анализ сети, но и выполняют в автоматическом или полуавтоматическом режиме действия по управлению сетью – включение и отключение портов устройств, изменение параметров мостов адресных таблиц, коммутаторов и маршрутизаторов и т.п. Примерами систем управления могут служить популярные системы HP OpenView, SunNet Manager, IBM NetView и др.

Средства управления системой (System Management) часто выполняют функции, аналогичные функциям систем управления, но по отношению к другим объектам. В первом случае объектом управления является программное и аппаратное обеспечение компьютеров сети, а во втором – коммуникационное оборудование. Вместе с тем, некоторые функции этих двух видов систем управления могут дублироваться, например средства управления системой могут выполнять простейший анализ сетевого трафика.

Встроенные системы диагностики и управления (Embedded Systems) – эти системы исполнены в виде программно-аппаратных модулей, устанавливаемых в коммуникационное оборудование, а также в виде программных модулей, встроенных в операционные системы. Они выполняют функции диагностики и управления только одним устройством, и в этом их основное отличие от централизованных систем управления. Примером средств этого класса может служить модуль управления концентратором Distributed 5000, реализующий функции автосегментации портов при обнаружении неисправностей, приписывания портов внутренним сегментам концентратора и некоторые другие. Как правило, встроенные модули управления "по совместительству" выполняют роль SNMP-агентов, поставляющих данные о состоянии устройства для систем управления.

Анализаторы протоколов (Protocol Analyzers) представляют собой программные или аппаратно-программные системы, которые ограничиваются, в отличие от систем управления, лишь функциями мониторинга и анализа трафика в сетях. Хороший анализатор протоколов может захватывать и декодировать пакеты большого количества применяемых в сетях протоколов – обычно несколько десятков. Анализаторы протоколов позволяют установить некоторые логические условия для захвата отдельных пакетов и выполняют полное декодирование захваченных пакетов, то есть показывают в удобной для специалиста форме вложенность пакетов протоколов разных уровней друг в друга с расшифровкой содержания отдельных полей каждого пакета.

Экспертные системы аккумулируют человеческие знания о выявлении причин аномальной работы сетей и возможных способах приведения сети в работоспособное состояние. Экспертные системы часто реализуются в виде отдельных подсистем различных средств мониторинга и анализа сетей: систем управления сетями, анализаторов протоколов, сетевых анализаторов. Простейшим вариантом экспертной системы является контекстно-зависимая help-система. Более сложные экспертные системы представляют собой так называемые базы знаний, обладающие элементами искусственного интеллекта.

Многофункциональные устройства анализа и диагностики. В последние годы в связи с повсеместным распространением вычислительных сетей возникла необходимость разработки недорогих портативных приборов, совмещающих функции нескольких устройств: анализаторов протоколов, кабельных сканеров и даже некоторых возможностей программного обеспечения сетевого управления.

Направление развития систем мониторинга

Еще одной из важных задач мониторинга является контроль за безопасностью вычислительной сети. Все перечисленные средства и продукты мониторинга контролируют работу элементов вычислительной сети, но не контролируют безопасность проходящего трафика и степень защищенности элементов сети и всей сети в целом.

Безопасность компьютерной сети (в смысле защищенности ее от вредоносных действий) обеспечивается двумя методами: аудитом и контролем. Аудит безопасности – проверка настройки сети (открытых портов, доступности "внутренних" приложений извне, надежности аутентификации пользователей). Сущность контроля безопасности состоит в выявлении аномальных событий в функционировании сети и контролирует:

нагрузку на серверное ПО и "железо": аномально высокие уровни загрузки процессора, внезапное сокращение свободного места на дисках, резкое увеличение сетевого трафика зачастую являются признаками сетевой атаки;
журналы и отчеты на наличие ошибок: отдельные сообщения об ошибках в лог-файлах программ-серверов или журнале событий серверной операционной системы допустимы, но накопление и анализ таких сообщений помогает выявить неожиданно частые или систематические отказы;
состояние потенциально уязвимых объектов – например, тех, "защищенность" которых тяжело проконтролировать напрямую (ненадежное стороннее ПО, изменившаяся/ непроверенная конфигурация сети): нежелательные изменения прав доступа к некоторому ресурсу или содержимого файла может свидетельствовать о проникновении "врага".

Заключение

Имеющиеся системы мониторинга вычислительной сети являются узконаправленными, решающими определенные задачи, не способными видеть всю проблему в целом. Необходима разработка универсальной системы мониторинга, которая позволит в комплексе решить все важнейшие проблемы вычислительной сети. Универсальная система мониторинга должна обеспечить контроль за безопасностью сети, работоспособностью сети передачи данных, каналообразующего оборудования и оконечного оборудования пользователей, в том числе контроль наличия или отсутствия технического обслуживания всех элементов. Все указанное позволит обеспечить своевременное реагирование на все возникающие неисправности, в некоторых случаях даже до их возникновения, сократит временные и трудовые затраты на восстановление сети после возникновения неисправностей.

Литература

Лысков О.В. Автоматизация поддержки процесса обеспечения работоспособности вычислительной сети предприятия. Диссертация. 2008.
Проблемы современных компьютерных сетей. Московский государственный университет имени М.В. Ломоносова, факультет вычислительной математики и кибернетики.
Концепция развития системы связи и информационно-телекоммуникационных технологий МЧС России на период до 2015 г., утвержденной решением коллегии МЧС России от 24.07.2013 № 8/IV.
Апрышкина Г. Мониторинг в корпоративных сетях // КомпьютерПресс. – № 7. – 2001. [online]. Доступ через: http://compress.ru/article.aspx?id=11239.

Опубликовано: Журнал "Технологии и средства связи" #5, 2016
Посещений: 14818