Управление неисправностями¶
Управление неисправностями - это процесс сбора и обработки входящих событий, поступающих из различных источников. NOC предоставляет гибкий конвейер обработки событий, разделенный на четко разграниченные этапы:
- Сбор - сбор событий из внешних источников, таких как Syslog, SNMP Trap, активные проверки, пороги метрик и их внедрение в конвейер обработки событий.
- Классификация - удаление всех зависимых от устройства характеристик и их замена обобщенными классами событий. NOC распознает около 300 классов событий из коробки.
- Корреляция - анализ возможных событий открытия и закрытия тревог, корреляция на основе правил, корреляция на основе топологии, поднятие и снятие тревог, расчет влияния на обслуживание.
- Эскалация - обработка тревог на основе правил, уведомление и эскалация во внешние системы учета неисправностей.
Каждый этап обрабатывается разным набором микросервисов, что позволяет настраивать количество рабочих в соответствии с текущей нагрузкой. Многоэтапная обработка позволяет сосредотачивать персонал мониторинга только на актуальных проблемах, которые вызывают деградацию обслуживания.