Разработка сервиса мониторинга программных систем эксперимента BM@N
Аннотации
Аннотация
Программная инфраструктура эксперимента BM@N содержит набор различных информационных систем, необходимых для работы с экспериментальными или моделируемыми данными на всех этапах обработки, включая сбор, хранение, промежуточную обработку и физический анализ данных. Некоторыми примерами таких систем являются платформа электронного журналирования, база данных условий эксперимента и система управления метаданными событий эксперимента. В случае прекращения функционирования одной из систем работа участников коллаборации с данными BM@N становится либо невозможной, либо существенно менее продуктивной. В связи с этим достаточно важным является своевременное обнаружение возможных сбоев в работе систем из-за проблем программного или аппаратного обеспечения. Разработанный сервис мониторинга используется для проверки доступности и состояния работоспособности информационных систем. Сюда входят измерение, хранение, визуализация и отправка оповещений по отслеживаемым параметрам, таким как загрузка ЦП, памяти и диска, параметры функционирования СУБД, время ответа баз данных и конечных точек API, время прохождения пингов, а также отправка предупреждающих уведомлений в случае неисправностей. Подробно описана текущая реализация сервиса мониторинга эксперимента BM@N. Также кратко отмечена связанная с этим задача создания высокодоступных информационных служб.