Система мониторинга сбоев в крупных информационных системах работает путём отслеживания состояния ИТ-инфраструктуры. 2 Её цель — своевременное выявление аномалий, которые могут привести к нарушению работы систем. 2
Некоторые ключевые компоненты системы мониторинга:
Для контроля за аппаратной частью системы используют датчики и сенсоры, для наблюдения за программной — специализированные утилиты. 4
Вся собранная информация поступает на сервер мониторинга, где её анализируют и вводят в действие различные сценарии реагирования. 4 Таким образом можно своевременно выявить аномальное поведение пользователей или состояние аппаратной части, затем быстро устранить проблему до того, как она перерастёт в масштабный сбой. 4
Порядок действий в случае обнаружения проблемы зависит от настройки системы мониторинга. 4 В их число входят, например, передача информации администратору в автоматическом режиме, запуск алгоритмов восстановления сервисов, создание отчёта для дальнейшего анализа и составления плана по устранению проблемы. 4