Симуляция выполнения задач в распределенных гетерогенных вычислительных инфраструктурах
Аннотация
Выполнение одной вычислительной задачи демонстрирует корректность работы программного обеспечения. Но когда та же самая задача должна быть выполнена в тысячах экземпляров, это может вызывать ошибки. Для такого массированного запуска активно используются распределенные гетерогенные вычислительные инфраструктуры. Основной вопрос при работе большого количества однотипных задач — это ограничения, связанные со скоростью сети. Эти ограничения могут возникать на разных уровнях: сервера, кластера или системы хранения. С ограниченной пропускной способностью сети существует порог, после которого добавление дополнительных вычислительных ресурсов не ускорит выполнение пакета задач. Цель данной работы — создание программной платформы для симуляции выполнения задач в распределенной гетерогенной вычислительной сети. Основная задача разрабатываемой системы — прогноз скорости выполнения задач на доступных вычислительных инфраструктурах. Система разработана и протестирована. В качестве языка программирования использовался Python. База данных InfluxDB используется для хранения и последующей визуализации полученных
данных.