Вариант реализации для ИИ в инфраструктуре Azure
В этой статье приведены рекомендации по реализации для организаций, работающих с рабочими нагрузками искусственного интеллекта в инфраструктуре Azure (IaaS). После развертывания целевой зоны Azure можно настроить целевую зону приложения с помощью рабочей области CycleCloud для Slurm. Azure CycleCloud Workspace for Slurm предлагает несколько преимуществ для пользователей, которые хотят запускать рабочие нагрузки ИИ с помощью планировщика Slurm.
Простое и быстрое создание кластера. Пользователи могут быстро создавать кластеры Slurm в Azure с помощью простого графического интерфейса. Они могут выбирать различные размеры и типы виртуальных машин Azure, а также настраивать параметры кластера, такие как количество узлов, конфигурация сети, параметры хранения (например, Azure NetApp Files и управляемая файловая система Lustre) и параметры Slurm.
Гибкое и динамическое управление кластерами. Azure CycleCloud масштабирует кластеры Slurm вверх или вниз автоматически. Пользователи могут отслеживать состояние кластера, производительность и использование, а также просматривать журналы и метрики с помощью графического интерфейса. Они могут удалять кластеры, если они не нужны, и платить только за используемые ресурсы.
Полный контроль над инфраструктурой. Пользователи имеют полный контроль над развернутой инфраструктурой, позволяя им принести собственный код, библиотеки и пакеты, а также использовать ресурсы по требованию.
Рекомендации по проектированию
В следующих статьях приведены рекомендации по рабочим нагрузкам искусственного интеллекта в инфраструктуре Azure (IaaS):
Архитектура
Рис. 1. Приложение ИИ в инфраструктуре Azure в целевой зоне Azure.
Развертывание рабочей области CycleCloud для Slurm
Рабочая область CycleCloud для Slurm может использоваться в качестве начального развертывания в корпоративной среде. Вы можете разрабатывать и настраивать код, чтобы расширить функциональные возможности и /или адаптировать его к среде целевой зоны Azure. Затем следуйте инструкциям, чтобы точно настроить модель диффузии от Hugging Face с помощью рабочей области Azure CycleCloud для Slurm.