Системы мониторинга ИТ инфраструктуры позволяют получать консолидированную информацию о работоспособности и уровне производительности различных бизнес-сервисов. Для этого системы мониторинга осуществляют сбор данных с различных компонентов ИТ инфраструктуры: серверного и сетевого оборудования, виртуальных серверных инфраструктур, операционных систем, серверов приложений, веб-серверов, систем совместной работы и т.п.
Системы мониторинга позволяют:
Обеспечить проактивное определение возможных сбоев до того, как они приведут к недоступности сервисов
Сократить время на поиск компонентов ИТ инфраструктуры, служащих причиной простоев бизнес-сервисов
Получать сводные данные о производительности и прогнозировать появление «узких мест» в рамках ИТ инфраструктуры
Отслеживать соблюдение соглашения об уровне обслуживания (SLA) для различных бизнес-сервисов
Специалисты компании ПИРИТ в качестве решений задач по отслеживанию состояния ИТ инфраструктуры используют ключевые решения, присутствующие на рынке.
IBM Tivoli Monitoring– продукт, позволяющий контролировать события и доступность распределённых информационных систем, операционных систем, сетевой инфраструктуры и приложений. В основу входит ряд сервисных компонентов совместно именуемые Tivoli Management Services, куда входят модули по безопасности, передаче и хранения данных, механизмы оповещения, интерфейс управления и коммуникационные сервисы в клиент-серверной архитектуре.
Рисунок 1. Архитектура Tivoli Monitoring
Базовая архитектура содержит серверные компоненты Tivoli Data Warehouse, Tivoli Enterprise Portal Server, Tivoli Enterprise Monitoring Server в дополнение к центральному клиентскому порталу управления. Так же есть агенты для мониторинга различных сред: AIX, Linux, UNIX, Windows, и агенты для сбора, суммирования и построения исторических данных.
Одно из кардинальных преимуществ решения IBM, возможность автоматического создания агентов под различные новые системы, даже если их нет в широкой библиотеке.
Проекты по внедрению систем мониторинга приводят к увеличению качества работы ИТ инфраструктуры, повышению уровня SLA, доступности и работоспособности предоставляемых сервисов, возможность прогнозировать сбои и отслеживать изменения, искать причинно-следственные связи в случае сбоев.