Partager via


Accélérateur de zone d’atterrissage HPC (High-Performance Computing) Azure

L’accélérateur de zone d’atterrissage HPC (High-Performance Computing) automatise le déploiement d’un environnement. Cet environnement fournit une infrastructure de base que vous pouvez personnaliser pour créer un mécanisme de déploiement de bout en bout pour une solution de cluster HPC complète dans Azure. L’accélérateur est une collection de modèles de scripts open source qui peuvent préparer vos zones d’atterrissage à l’échelle de l’entreprise. Il peut fournir une approche architecturale spécifique et une implémentation de référence qui adhèrent à l’architecture et aux meilleures pratiques du Cloud Adoption Framework.

Les clients adoptent HPC de différentes manières pour répondre à leurs besoins métier, et vous pouvez adapter l’accélérateur de zone d’atterrissage HPC pour produire une architecture qui vous convient. L’utilisation de l’accélérateur permet de mettre votre organisation sur la voie d’une échelle durable.

Implémenter une zone d’atterrissage à l’échelle de l’entreprise

L’accélérateur de zone d’atterrissage HPC suppose que vous commencez avec une zone d’atterrissage à l’échelle de l’entreprise qui a été implémentée avec succès. Pour plus d’informations sur cette configuration requise, consultez les articles suivants :

Que fournit l’accélérateur de zone d’atterrissage HPC ?

L’approche des zones d’atterrissage de l’accélérateur de zone d’atterrissage HPC fournit les ressources suivantes à votre projet :

  • Approche modulaire vous permettant de personnaliser les variables d’environnement
  • Instructions de conception pour faciliter l’évaluation des décisions critiques
  • Architecture de la zone d’atterrissage
  • L’implémentation comprend :
    • Une référence déployable en mesure de créer l’environnement pour votre déploiement HPC
    • Une implémentation de référence HPC approuvée par Microsoft pour tester l’environnement déployé

Directives de conception pour l’énergie, la fabrication et les finances

Les architectures des zones d’atterrissage varient en fonction du secteur d’activité, en plus de varier selon l’organisation. Cette section répertorie les articles par secteur qui fournissent des instructions pour la création de votre zone d’atterrissage :

Recommandations de conception pour choisir le calcul HPC des charges de travail d’IA

Le choix de la bonne référence SKU de calcul à processeur graphique optimisé pour les charges de travail d’IA est important afin d’optimiser les performances et contrôler les coûts. Microsoft propose de nombreuses références SKU qui sont optimisées pour les charges de travail demandant une plus grande puissance de processeur graphique. Plusieurs points sont à prendre en compte lors du choix de la référence SKU appropriée pour les charges de travail d’IA. Les charges de travail plus petites peuvent tirer parti d’une fraction seulement du processeur, du processeur graphique et de la bande passante des références SKU plus puissantes comme NDv4. Vous pouvez choisir d’autres références SKU de calcul comme NCv4 et NDv2 pour les travaux plus petits. Voici quelques points à prendre en compte lors du choix de la bonne référence SKU de calcul à processeur graphique optimisé pour les charges de travail d’IA :

  • Points de contrôle. Tenez compte de facteurs comme l’intervalle de points de contrôle pendant l’exécution de vos modèles Machine Learning. Cela peut impacter les performances du processeur graphique pendant la phase d’entraînement. Trouvez un équilibre entre efficacité du stockage et opérations fluides de processeur graphique. Monitorez l’utilisation de votre processeur graphique.
  • Inférence. Les exigences d’inférence diffèrent des exigences d’entraînement, avec une charge de processeur potentiellement plus élevée qui peut plafonner les performances du processeur. Tenez compte des exigences d’inférence de votre modèle quand vous sélectionnez une référence SKU de calcul. Monitorez l’utilisation de votre processeur.
  • Entraînement. Tenez compte des exigences de votre modèle pendant l’entraînement, en monitorant à la fois l’utilisation du processeur et du processeur graphique.
  • Taille du travail. Quand vous recherchez la référence SKU de calcul adaptée à vos charges de travail d’IA, tenez compte de la taille du travail. Les travaux plus petits, par exemple autour d’OPT 1.3B, peuvent ne pas tirer parti des grandes tailles de référence SKU et avoir une puissance de processeur/processeur graphique inactive selon la phase du travail (inférence, entraînement).
  • à la bande passante ; Une bande passante plus grande et avec une latence plus faible peut représenter un coût quand elle n’est pas utilisée. Utilisez InfiniBand seulement pour les plus grands modèles qui nécessitent une bande passante supplémentaire.

Consultez lestailles de machine virtuelle à processeur graphique optimisé Azure.

Exemple : architecture de référence conceptuelle pour l’énergie

L'architecture de référence conceptuelle suivante est un exemple qui montre les domaines de conception et les meilleures pratiques pour les environnements énergétiques.

Diagram that shows an example architecture for an energy environment, including compute, storage, subnets, a database, and a front end for on-premises users.

Exemple : architecture de référence conceptuelle pour la finance

L'architecture de référence conceptuelle suivante est un exemple qui montre les domaines de conception et les meilleures pratiques pour les environnements financiers.

Diagram that shows an example architecture for a finance environment, including on-premises resources, virtual network, subnets, and network security groups.

Exemple : architecture de référence conceptuelle pour la fabrication

L'architecture de référence conceptuelle suivante est un exemple qui montre les domaines de conception et les meilleures pratiques pour les environnements de fabrication.

Diagram that shows an example architecture for a manufacturing environment, including on-premises and cloud resources and an HPC landing zone.

Obtenir l’accélérateur de zone d’atterrissage HPC

L’accélérateur de zone d’atterrissage HPC est disponible sur GitHub : Accélérateur de plateforme Azure HPC OnDemand

Étapes suivantes

Pour obtenir des considérations et des recommandations concernant votre architecture d’accélérateur de zone d’atterrissage HPC, consultez les zones de conception critiques de l’accélérateur de zone d’atterrissage HPC dans Gestion de l’identité et de l’accès Azure.