Accélérateur de zone d’atterrissage HPC (High-Performance Computing) Azure
L’accélérateur de zone d’atterrissage HPC (High-Performance Computing) automatise le déploiement d’un environnement. Cet environnement fournit une infrastructure de base que vous pouvez personnaliser pour créer un mécanisme de déploiement de bout en bout pour une solution de cluster HPC complète dans Azure. L’accélérateur est une collection de modèles de scripts open source qui peuvent préparer vos zones d’atterrissage à l’échelle de l’entreprise. Il peut fournir une approche architecturale spécifique et une implémentation de référence qui adhèrent à l’architecture et aux meilleures pratiques du Cloud Adoption Framework.
Les clients adoptent HPC de différentes manières pour répondre à leurs besoins métier, et vous pouvez adapter l’accélérateur de zone d’atterrissage HPC pour produire une architecture qui vous convient. L’utilisation de l’accélérateur permet de mettre votre organisation sur la voie d’une échelle durable.
Implémenter une zone d’atterrissage à l’échelle de l’entreprise
L’accélérateur de zone d’atterrissage HPC suppose que vous commencez avec une zone d’atterrissage à l’échelle de l’entreprise qui a été implémentée avec succès. Pour plus d’informations sur cette configuration requise, consultez les articles suivants :
- Commencer à utiliser les zone d’atterrissage à l’échelle de l’entreprise avec Cloud Adoption Framework
- Implémenter une zone d’atterrissage à l’échelle de l’entreprise avec le Cloud Adoption Framework dans Azure
Que fournit l’accélérateur de zone d’atterrissage HPC ?
L’approche des zones d’atterrissage de l’accélérateur de zone d’atterrissage HPC fournit les ressources suivantes à votre projet :
- Approche modulaire vous permettant de personnaliser les variables d’environnement
- Instructions de conception pour faciliter l’évaluation des décisions critiques
- Architecture de la zone d’atterrissage
- L’implémentation comprend :
- Une référence déployable en mesure de créer l’environnement pour votre déploiement HPC
- Une implémentation de référence HPC approuvée par Microsoft pour tester l’environnement déployé
Directives de conception pour l’énergie, la fabrication et les finances
Les architectures des zones d’atterrissage varient en fonction du secteur d’activité, en plus de varier selon l’organisation. Cette section répertorie les articles par secteur qui fournissent des instructions pour la création de votre zone d’atterrissage :
Énergie (pétrole et gaz)
- Facturation Azure et locataires Microsoft Entra pour HPC dans l’énergie
- Gestion des identités et des accès pour Azure HPC dans l’énergie
- Gestion d’Azure HPC dans l’énergie
- Topologie et connectivité réseau pour Azure HPC en énergie
- Automatisation de la plateforme et DevOps pour Azure HPC dans l’énergie
- Organisation des ressources pour HPC dans le secteur de l’énergie
- Gouvernance du HPC dans les secteurs de l’énergie
- Sécurité d’Azure HPC dans l’énergie
- Calculer des charges de travail d’application HPC à grande échelle dans des machines virtuelles Azure
- Stockage pour les environnements HPC énergie
Fabrication
- Facturation Azure et locataires Active Directory pour HPC dans la production industrielle
- Gestion des identités et des accès Azure pour HPC dans la production industrielle
- Gestion pour HPC dans la production industrielle
- Topologie de réseau et connectivité pour HPC dans la production industrielle
- Automatisation de la plateforme et DevOps pour Azure HPC dans la production industrielle
- Organisation des ressources pour HPC dans la production industrielle
- Gouvernance Azure pour HPC fabrication
- Sécurité pour HPC dans les industries manufacturières
- Stockage pour HPC dans la production industrielle
Finances
- Offres de facturation Azure et locataires Active Directory pour HPC finance
- Gestion des identités et des accès Azure HPC Finance
- Gestion pour HPC dans le secteur financier
- Topologie et connectivité du réseau pour HPC dans le secteur financier
- Automatisation de la plateforme et DevOps pour HPC dans le secteur financier
- Organisation des ressources pour Azure HPC dans le secteur financier
- Gouvernance pour le HPC financier
- Sécurité pour HPC dans le secteur financier
- Stockage pour HPC dans le secteur financier
Recommandations de conception pour choisir le calcul HPC des charges de travail d’IA
Le choix de la bonne référence SKU de calcul à processeur graphique optimisé pour les charges de travail d’IA est important afin d’optimiser les performances et contrôler les coûts. Microsoft propose de nombreuses références SKU qui sont optimisées pour les charges de travail demandant une plus grande puissance de processeur graphique. Plusieurs points sont à prendre en compte lors du choix de la référence SKU appropriée pour les charges de travail d’IA. Les charges de travail plus petites peuvent tirer parti d’une fraction seulement du processeur, du processeur graphique et de la bande passante des références SKU plus puissantes comme NDv4. Vous pouvez choisir d’autres références SKU de calcul comme NCv4 et NDv2 pour les travaux plus petits. Voici quelques points à prendre en compte lors du choix de la bonne référence SKU de calcul à processeur graphique optimisé pour les charges de travail d’IA :
- Points de contrôle. Tenez compte de facteurs comme l’intervalle de points de contrôle pendant l’exécution de vos modèles Machine Learning. Cela peut impacter les performances du processeur graphique pendant la phase d’entraînement. Trouvez un équilibre entre efficacité du stockage et opérations fluides de processeur graphique. Monitorez l’utilisation de votre processeur graphique.
- Inférence. Les exigences d’inférence diffèrent des exigences d’entraînement, avec une charge de processeur potentiellement plus élevée qui peut plafonner les performances du processeur. Tenez compte des exigences d’inférence de votre modèle quand vous sélectionnez une référence SKU de calcul. Monitorez l’utilisation de votre processeur.
- Entraînement. Tenez compte des exigences de votre modèle pendant l’entraînement, en monitorant à la fois l’utilisation du processeur et du processeur graphique.
- Taille du travail. Quand vous recherchez la référence SKU de calcul adaptée à vos charges de travail d’IA, tenez compte de la taille du travail. Les travaux plus petits, par exemple autour d’OPT 1.3B, peuvent ne pas tirer parti des grandes tailles de référence SKU et avoir une puissance de processeur/processeur graphique inactive selon la phase du travail (inférence, entraînement).
- à la bande passante ; Une bande passante plus grande et avec une latence plus faible peut représenter un coût quand elle n’est pas utilisée. Utilisez InfiniBand seulement pour les plus grands modèles qui nécessitent une bande passante supplémentaire.
Consultez lestailles de machine virtuelle à processeur graphique optimisé Azure.
Exemple : architecture de référence conceptuelle pour l’énergie
L'architecture de référence conceptuelle suivante est un exemple qui montre les domaines de conception et les meilleures pratiques pour les environnements énergétiques.
Exemple : architecture de référence conceptuelle pour la finance
L'architecture de référence conceptuelle suivante est un exemple qui montre les domaines de conception et les meilleures pratiques pour les environnements financiers.
Exemple : architecture de référence conceptuelle pour la fabrication
L'architecture de référence conceptuelle suivante est un exemple qui montre les domaines de conception et les meilleures pratiques pour les environnements de fabrication.
Obtenir l’accélérateur de zone d’atterrissage HPC
L’accélérateur de zone d’atterrissage HPC est disponible sur GitHub : Accélérateur de plateforme Azure HPC OnDemand
Étapes suivantes
Pour obtenir des considérations et des recommandations concernant votre architecture d’accélérateur de zone d’atterrissage HPC, consultez les zones de conception critiques de l’accélérateur de zone d’atterrissage HPC dans Gestion de l’identité et de l’accès Azure.