Partager via


Créer un cluster de calcul haute performance (HPC) Linux avec le script de déploiement du HPC Pack IaaS

Important

Les machines virtuelles classiques seront mises hors service le 1er mars 2023.

Si vous utilisez des ressources IaaS provenant d’ASM, veuillez terminez votre migration avant le 1er mars 2023. Nous vous encourageons à effectuer le basculement plus tôt plus pour tirer parti des nombreuses fonctionnalités améliorées d’Azure Resource Manager.

Pour plus d’informations, consultez Migrez vos ressources IaaS vers Azure Resource Manager avant le 1er mars 2023.

Exécutez le script PowerShell de déploiement du HPC Pack IaaS pour déployer un cluster HPC Pack 2012 R2 complet pour les charges de travail Linux sur les machines virtuelles Azure. Le cluster se compose d’un nœud principal joint à Active Directory, exécutant Windows Server et Microsoft HPC Pack, et de nœuds de calcul qui exécutent l’une des distributions Linux prises en charge par HPC Pack. Si vous souhaitez déployer un cluster HPC Pack dans Azure pour les charges de travail Windows, consultez Créer un cluster HPC Windows avec le script de déploiement du HPC Pack IaaS.

Important

Le script PowerShell décrit dans cet article crée un cluster Microsoft HPC Pack 2012 R2 dans Azure à l’aide du modèle de déploiement classique. Pour la plupart des nouveaux déploiements, Microsoft recommande d’utiliser le modèle Resource Manager. En outre, le script décrit dans cet article ne prend pas en charge HPC Pack 2016. Pour plus d’informations sur les modèles Resource Manager pour HPC Pack 2012 R2 et HPC Pack 2016, consultez les options de déploiement de cluster HPC Pack dans Azure.

Selon votre environnement et vos choix, le script peut créer toute l’infrastructure de cluster, y compris le réseau virtuel Azure, les comptes de stockage, les services cloud, le contrôleur de domaine, les bases de données SQL locales ou distantes, le nœud principal et les nœuds supplémentaires du cluster. Le script peut également utiliser l’infrastructure Azure préexistante et créer uniquement les nœuds de cluster HPC.

Pour des informations générales sur la planification d’un cluster HPC Pack, consultez Évaluation du produit et planification et Mise en route dans la bibliothèque HPC Pack 2012 R2.

Prérequis

  • Abonnement Azure : vous pouvez utiliser un abonnement dans le service Azure Global ou Azure Chine. Vos limites d’abonnement affectent le nombre et le type de nœuds de cluster que vous pouvez déployer. Pour plus d’informations, consultez Abonnement Azure et limites, quotas et contraintes du service.
  • Ordinateur client Windows avec Azure PowerShell 0.8.10 ou ultérieur installé et configuré : pour connaître les instructions d’installation et la procédure de connexion à votre abonnement Azure, consultez Get started with Azure PowerShell (Prise en main d’Azure PowerShell).
  • Script de déploiement IaaS de HPC Pack : téléchargez et décompressez la dernière version du script à partir du Centre de téléchargement Microsoft. Vérifiez la version du script en exécutant New-HPCIaaSCluster.ps1 –Version. Cet article se base sur la version 4.5.2 du script.
  • Fichier de configuration de script : créez un fichier XML qui sera utilisé par le script pour configurer le cluster HPC. Pour plus d’informations et des exemples, consultez les sections suivantes de cet article et le fichier Manual.rtf qui accompagne le script de déploiement.

Syntaxe

New-HPCIaaSCluster.ps1 [-ConfigFile] <String> [-AdminUserName]<String> [[-AdminPassword] <String>] [[-HPCImageName] <String>] [[-LogFile] <String>] [-Force] [-NoCleanOnFailure] [-PSSessionSkipCACheck] [<CommonParameters>]

Remarque

Exécutez le script en tant qu’administrateur.

Paramètres

  • ConfigFile : spécifie le chemin d’accès du fichier de configuration pour décrire le cluster HPC. Découvrez plus d’informations sur le fichier de configuration dans cette rubrique ou dans le fichier Manual.rtf, dans le dossier contenant le script.

  • AdminUserName : spécifie le nom d’utilisateur. Si la forêt de domaines est créée par le script, il s’agit du nom d’utilisateur d’administrateur local pour toutes les machines virtuelles et du nom d’administrateur de domaine. Si la forêt de domaines existe déjà, cela indique l’utilisateur du domaine comme nom d’utilisateur d’administrateur local pour installer HPC Pack.

  • AdminPassword : spécifie le mot de passe de l’administrateur. S’il n’a pas été spécifié dans la ligne de commande, le script vous invite à entrer le mot de passe.

  • HPCImageName (facultatif) : spécifie le nom d’image de la machine virtuelle HPC Pack à utiliser pour le déploiement du cluster HPC. Ce doit être une image HPC Pack fournie par Microsoft à partir d’Azure Marketplace. Si aucune image n’est spécifiée (recommandé en général), le script choisit la dernière image HPC Pack 2012 R2 publiée. La dernière image est basée sur Windows Server 2012 R2 Datacenter avec HPC Pack 2012 R2 Update 3.

    Notes

    Le déploiement échoue si vous ne spécifiez pas d’image HPC Pack valide.

  • LogFile (facultatif) : spécifie le chemin du fichier journal de déploiement. S’il n’a pas été spécifié, le script crée un fichier journal dans le répertoire temp de l’ordinateur qui exécute le script.

  • Force (facultatif) : supprime toutes les invites de confirmation.

  • NoCleanOnFailure (facultatif) : spécifie que les machines virtuelles Azure qui n’ont pas été correctement déployées ne sont pas supprimées. Supprimez manuellement ces machines virtuelles avant de réexécuter le script pour poursuivre le déploiement, faute de quoi le déploiement risque d’échouer.

  • PSSessionSkipCACheck (facultatif) : pour chaque service cloud avec des machines virtuelles déployées par ce script, un certificat auto-signé est automatiquement généré par Azure, et toutes les machines virtuelles du service cloud utilisent ce certificat en tant que certificat Windows Remote Management (WinRM) par défaut. Pour déployer des fonctionnalités HPC dans ces machines virtuelles Azure, le script par défaut installe temporairement ces certificats dans le magasin d’autorités de certification racine approuvée local de l’ordinateur client pour supprimer l’erreur de sécurité « autorité de certification non approuvée » pendant l’exécution du script. Les certificats sont supprimés quand le script se termine. Si ce paramètre est spécifié, les certificats ne sont pas installés sur l’ordinateur client et l’avertissement de sécurité est supprimé.

    Important

    Ce paramètre n’est pas recommandé pour les déploiements de production.

Exemple

L’exemple suivant crée un cluster HPC Pack à l’aide du fichier de configuration MyConfigFile.xml et spécifie les informations d’identification de l’administrateur pour l’installation du cluster.

.\New-HPCIaaSCluster.ps1 –ConfigFile MyConfigFile.xml -AdminUserName <username> –AdminPassword <password>

Considérations supplémentaires

  • Le script peut éventuellement activer la soumission de travaux via le portail web HPC Pack ou l’API REST du HPC Pack.
  • Le script peut éventuellement exécuter des scripts de pré- et post-configuration personnalisés sur le nœud principal si vous souhaitez installer des logiciels supplémentaires ou configurer d’autres paramètres.

Fichier de configuration

Le fichier de configuration pour le script de déploiement est un fichier XML. Le fichier de schéma HPCIaaSClusterConfig.xsd se trouve dans le dossier de script de déploiement du HPC Pack IaaS. IaaSClusterConfig est l’élément racine du fichier de configuration qui contient les éléments enfants décrits en détail dans le fichier Manual.rtf dans le dossier de script de déploiement.

Exemple de fichier de configuration

Le fichier de configuration suivant crée un contrôleur de domaine et une forêt de domaines, et déploie un cluster HPC Pack composé d’un nœud principal avec des bases de données locales et de 10 nœuds de calcul Linux. Tous les services cloud sont créés directement dans l’emplacement Asie Est. Les nœuds de calcul Linux sont créés dans deux services cloud et deux comptes de stockage (c’est-à-dire MyLnxCN-0001 à MyLnxCN-0005 dans MyLnxCNService01 et mylnxstorage01, et MyLnxCN-0006 à MyLnxCN-0010 dans MyLnxCNService02 et mylnxstorage02). Les nœuds de calcul sont créés à partir d’une image Linux OpenLogic CentOS version 7.0.

Utilisez vos propres valeurs pour votre nom d’abonnement et les noms de compte et de service.

<?xml version="1.0" encoding="utf-8" ?>
<IaaSClusterConfig>
  <Subscription>
    <SubscriptionName>Subscription-1</SubscriptionName>
    <StorageAccount>mystorageaccount</StorageAccount>
  </Subscription>
  <Location>East Asia</Location>  
  <VNet>
    <VNetName>MyVNet</VNetName>
    <SubnetName>Subnet-1</SubnetName>
  </VNet>
  <Domain>
    <DCOption>NewDC</DCOption>
    <DomainFQDN>hpc.local</DomainFQDN>
    <DomainController>
      <VMName>MyDCServer</VMName>
      <ServiceName>MyHPCService</ServiceName>
      <VMSize>Large</VMSize>
    </DomainController>
  </Domain>
  <Database>
    <DBOption>LocalDB</DBOption>
  </Database>
  <HeadNode>
    <VMName>MyHeadNode</VMName>
    <ServiceName>MyHPCService</ServiceName>
    <VMSize>ExtraLarge</VMSize>
  </HeadNode>
  <LinuxComputeNodes>
    <VMNamePattern>MyLnxCN-%0001%</VMNamePattern>
    <ServiceNamePattern>MyLnxCNService%01%</ServiceNamePattern>
    <MaxNodeCountPerService>5</MaxNodeCountPerService>
    <StorageAccountNamePattern>mylnxstorage%01%</StorageAccountNamePattern>
    <VMSize>Medium</VMSize>
    <NodeCount>10</NodeCount>
    <ImageName>5112500ae3b842c8b9c604889f8753c3__OpenLogic-CentOS-70-20150325 </ImageName>
  </LinuxComputeNodes>
</IaaSClusterConfig>

Dépannage

  • Erreur « Le réseau virtuel n’existe pas ». Si vous exécutez le script de déploiement HPC Pack IaaS pour déployer plusieurs clusters dans Azure simultanément sous un abonnement, un ou plusieurs déploiements peuvent échouer avec l’erreur VNet_Name « le réseau virtuel n’existe pas ». Si cette erreur se produit, réexécutez le script de déploiement qui a échoué.

  • Problème d’accès à Internet à partir du réseau virtuel Azure. Si vous créez un cluster HPC Pack avec un nouveau contrôleur de domaine en utilisant le script de déploiement, ou si vous promouvez manuellement une machine virtuelle de nœud principal en contrôleur de domaine, vous pouvez rencontrer des problèmes de connexion des machines virtuelles à Internet sur le réseau virtuel Azure. Cela peut se produire si un serveur DNS redirecteur est automatiquement configuré sur le contrôleur de domaine et si ce serveur DNS redirecteur ne se résout pas correctement.

    Pour contourner ce problème, ouvrez une session sur le contrôleur de domaine et supprimez le paramètre de configuration du redirecteur ou configurez un serveur DNS redirecteur valide. pour ce faire, dans Gestionnaire de serveur cliquez sur outils>dns pour ouvrir le gestionnaire dns, puis double-cliquez sur redirecteurs.

Étapes suivantes