Option d’implémentation pour l’IA sur l’infrastructure Azure
Cet article fournit des recommandations d’implémentation pour les organisations exécutant des charges de travail d’IA sur l’infrastructure Azure (IaaS). Après le déploiement d’une zone d’atterrissage Azure, vous pouvez configurer la zone d’atterrissage de l’application en utilisant l’espace de travail CycleCloud pour Slurm. L’espace de travail Azure CycleCloud pour Slurm offre plusieurs avantages aux utilisateurs souhaitant exécuter des charges de travail d’IA avec le planificateur Slurm.
Création de clusters facile et rapide. Les utilisateurs peuvent créer rapidement des clusters Slurm sur Azure via une interface graphique simple. Ils peuvent choisir parmi divers types et tailles de machines virtuelles (VM) Azure et personnaliser les paramètres du cluster, comme le nombre de nœuds, la configuration réseau, les options de stockage (telles que Azure NetApp Files et le système de fichiers Azure Managed Lustre), ainsi que les paramètres Slurm.
Gestion de cluster flexible et dynamique. Azure CycleCloud redimensionne automatiquement les clusters Slurm. Les utilisateurs peuvent surveiller l’état du cluster, les performances et l’utilisation, et consulter les journaux et les métriques via l’interface graphique. Ils peuvent supprimer les clusters lorsqu’ils ne sont pas nécessaires et ne paient que pour les ressources utilisées.
Contrôle total de l’infrastructure. Les utilisateurs disposent d’un contrôle total sur l’infrastructure déployée, ce qui leur permet d’utiliser leur propre code, leurs bibliothèques et leurs packages, et de consommer les ressources à la demande.
Recommandations en matière de conception
Les articles suivants fournissent des lignes directrices pour les charges de travail d’IA sur l’infrastructure Azure (IaaS) :
Architecture
Figure 1. Application d’IA sur l’infrastructure Azure dans la zone d’atterrissage Azure.
Déployer l’espace de travail CycleCloud pour Slurm
L’espace de travail CycleCloud pour Slurm peut être utilisé comme déploiement initial dans l’environnement d’entreprise. Vous pouvez développer et personnaliser le code pour étendre sa fonctionnalité et/ou l’adapter à votre environnement de zone d’atterrissage Azure. Ensuite, suivez les instructions pour affiner un modèle de diffusion de Hugging Face en utilisant l’espace de travail Azure CycleCloud pour Slurm.