Implementierungsoption für KI in Azure-Infrastruktur
Dieser Artikel enthält Implementierungsempfehlungen für Organisationen, die KI-Workloads (künstliche Intelligenz) in der Azure-Infrastruktur (Infrastructure-as-a-Service, IaaS) ausführen. Nach der Bereitstellung einer Azure-Zielzone können Sie die Anwendungszielzone mit dem CycleCloud-Arbeitsbereich für SLURM einrichten. Der Azure CycleCloud-Arbeitsbereich für SLURM bietet Benutzern, die KI-Workloads mit dem SLURM-Planer ausführen möchten, mehrere Vorteile.
Einfache und schnelle Clustererstellung. Benutzer können SLURM-Cluster in Azure schnell über eine einfache grafische Benutzeroberfläche erstellen. Sie können aus verschiedenen Azure-VM-Größen und -Typen wählen und Clustereinstellungen wie Knotenanzahl, Netzwerkkonfiguration, Speicheroptionen (z. B. Azure NetApp Files und Azure Managed Lustre-Dateisystem) sowie die SLURM-Parameter anpassen.
Flexible und dynamische Clusterverwaltung. Azure CycleCloud skaliert SLURM-Cluster automatisch hoch oder herunter. Über die grafische Benutzeroberfläche können Benutzer den Clusterstatus, die Leistung und die Nutzung überwachen sowie Protokolle und Metriken anzeigen. Sie können Cluster löschen, wenn sie nicht benötigt werden, und bezahlen nur für die Ressourcen, die sie verwenden.
Vollständige Kontrolle über die Infrastruktur. Benutzer haben die volle Kontrolle über die bereitgestellte Infrastruktur, sodass sie ihren eigenen Code, eigene Bibliotheken und Pakete nutzen sowie Ressourcen nach Bedarf verwenden können.
Entwurfsrichtlinien
Die folgenden Artikel enthalten Richtlinien für KI-Workloads in der Azure-Infrastruktur (IaaS):
Aufbau
Abbildung 1. KI-Anwendung in Azure-Infrastruktur in der Azure-Zielzone
Bereitstellen des CycleCloud-Arbeitsbereichs für Slurm
Der CycleCloud-Arbeitsbereich für Slurm kann als erste Bereitstellung in der Unternehmensumgebung verwendet werden. Sie können den Code weiterentwickeln und anpassen, um seine Funktionalität zu erweitern und/oder ihn an Ihre Azure-Zielzonenumgebung anzupassen. Befolgen Sie dann den Leitfaden zum Optimieren eines Diffusionsmodells von Hugging Face im Azure CycleCloud-Arbeitsbereich für SLURM.