Разработка программного комплекса для тестирования серверного оборудования
Аннотации
Аннотация
Тестирование серверного оборудования перед вводом его в эксплуатацию имеет ключевое значение для обеспечения стабильной и бесперебойной работы систем Многофункционального информационно-вычислительного комплекса Объединенного института ядерных исследований. Основной целью тестирования является выявление скрытых дефектов, которые могут возникнуть при критических нагрузках на оборудование. Для выявления дефектов оборудования используются различные эмпирические методы, описанные в производственных стандартах. В статье представлена автоматизированная система тестирования серверного оборудования, включающая автоматизацию установки системы, запуска тестов и сбора журналов тестирования. В текущей реализации системы тестирование проводится с использованием метода Highly Accelerated Stress Screening (HASS). Не менее важной частью системы является подсистема мониторинга, необходимая для сбора и анализа температур тестируемых компонентов. Анализ данных температур на этапе тестирования позволяет с заданной точностью определить продолжительность тестирования. Помимо таких инструментов мониторинга, как Node Exporter, Prometheus, Prometheus Gateway и Grafana, система использует Stress-ng для нагрузки оборудования синтетическими тестами. Все эти подсистемы распространяются свободно, и предлагаемая система может быть легко внедрена для тестирования в аналогичных инфраструктурах.

