Partager via


Présentation des tests de diagnostic

Microsoft HPC Pack fournit un ensemble de tests de diagnostic couramment utilisés. Vous pouvez utiliser ces tests pour vérifier le déploiement, résoudre les défaillances et détecter la dégradation des performances. Cette rubrique décrit les tests de système inclus par défaut lors de l’installation de HPC Pack. Pour plus d’informations sur les tests HPC Services pour Excel, les tests nouvellement disponibles et la création de diagnostics personnalisés, consultez ressources de diagnostic en ligne.

Les tests de diagnostic système sont regroupés conceptuellement par suite. Les sections suivantes de cette rubrique décrivent les tests de chaque suite et, le cas échéant, les paramètres configurables pour les tests :

Validateur d’environnement de déploiement

Les tests de cette suite peuvent vous aider à trouver des problèmes courants qui peuvent affecter le déploiement de nœuds nus. Pour plus d’informations, consultez Valider votre environnement avant de déployer des nœuds.

Note

Pour un nœud principal configuré en tant que cluster de basculement, le validateur de l’environnement de déploiement teste uniquement le nœud principal actif. Pour une vérification supplémentaire, vous souhaiterez peut-être basculer et exécuter les tests sur l’autre nœud principal. En règle générale, les nœuds principaux d’un cluster de basculement ayant des configurations similaires et différents problèmes entre les deux nœuds principaux sont rares, mais il peut être judicieux d’exécuter le test après une récupération (sur le nœud principal nouvellement récupéré/restauré après une défaillance irrécupérable).

Diagnostique Description
Déploiement : test DHCP Vérifie la disponibilité du serveur DHCP pour tous les réseaux.
Déploiement : test DNS Vérifie la disponibilité du serveur DNS pour tous les réseaux et signale les adresses IP du serveur DNS.
Déploiement : test des informations d’identification Vérifie que les informations d’identification d’installation sont celles d’un utilisateur HPC valide. Pour plus d’informations, consultez Fournir des informations d’identification d’installation.
Déploiement : Test de connectivité Active Directory Vérifie la connectivité au contrôleur de domaine et signale le temps de réponse.
Déploiement : test IPsec Vérifie si la sécurité du protocole Internet (IPsec) est activée sur le réseau d’entreprise. Si IPsec est appliqué à votre domaine via une stratégie de groupe, vous pouvez rencontrer des problèmes pendant le déploiement. Par exemple, IPsec peut interdire aux nœuds de calcul de communiquer avec le nœud principal en bloquant les ports.
Déploiement : test des services de déploiement Windows Vérifie que le service de transport de déploiement Windows est activé et que le serveur de déploiement n’est pas installé. Les services de déploiement Windows activent l’installation à distance de Windows sur les ordinateurs compatibles PXE.

HPC Pack utilise uniquement le service de rôle Serveur de transport dans le rôle Services de déploiement Windows. Le service de rôle Serveur de déploiement n’a pas besoin d’être installé.
Déploiement : Image Windows et installation du test de partage Vérifie que l’image d’installation dans chaque modèle de nœud et l’image Windows Preinstallation Environment (Windows PE) utilisée pour le déploiement ne sont pas manquantes, endommagées ou verrouillées par un autre processus et que la taille de l’image Windows PE ne dépasse pas 300 Mo. Vérifie que le dossier partagé utilisé pour l’installation existe et dispose des autorisations appropriées.

Consultez également Présentation des modèles de nœud.

Windows PE est utilisé pour préparer un ordinateur pour l’installation de Windows, copier des images de disque à partir d’un serveur de fichiers réseau, lancer le programme d’installation de Windows et capturer l’image d’un nœud.
Déploiement : test NAT Vérifie que la traduction d’adresses réseau (NAT) est correctement configurée sur le nœud principal, afin que les nœuds de calcul puissent communiquer avec le réseau d’entreprise dans certaines topologies.
Déploiement : test de pare-feu Test ajouté dans HPC Pack 2008 R2 Service Pack 1.

Vérifie que le pare-feu est désactivé pour les cartes réseau dans les réseaux de cluster Privé et Application (autrement dit, que ces cartes réseau sont exclues du Pare-feu Windows). Il vérifie également que les règles de pare-feu entrantes et sortantes requises sur le nœud principal sont correctement configurées.

Pour plus d’informations, consultez la section configuration du Pare-feu Windows dans mise en réseau de cluster HPC.
Déploiement : ports open test test ajouté dans HPC Pack 2008 R2 avec Service Pack 1.

Vérifie que les ports TCP suivants sont ouverts dans le Pare-feu Windows :

- 1856
- 6729
- 6730
- 9094
- 9095
- 9096
- 9794
- 9892
- 9893
- 9894

Pour plus d’informations sur les ports requis par HPC Pack pour la communication entre les services de cluster sur le nœud principal et les autres nœuds du cluster, consultez la section configuration du Pare-feu Windows dans mise en réseau de cluster HPC.
Déploiement : test d’ordre de liaison test ajouté dans HPC Pack 2008 R2 avec Service Pack 1.

Vérifie que le réseau d’entreprise est défini comme premier dans l’ordre de liaison sur les passerelles réseau par défaut. Si le réseau privé est répertorié avant le réseau d’entreprise, cela peut entraîner des problèmes de communication avec le contrôleur de domaine Active Directory sur le réseau d’entreprise.
Déploiement : test des ressources de réseau virtuel haute disponibilité test ajouté dans HPC Pack 2008 R2 avec Service Pack 1.

Si le nœud principal est configuré dans un cluster de basculement pour la haute disponibilité, vérifie que les ressources de réseau virtuel pour le cluster de basculement sont correctement configurées. Une fois le nœud principal configuré dans un cluster de basculement, car le cluster de basculement n’est pas lié à un seul serveur physique, il ne peut pas avoir le nom et l’adresse IP d’un serveur physique. Le cluster de basculement doit avoir un nom de nœud principal virtuel et une adresse IP virtuelle correspondante différente des noms physiques et des adresses IP des deux nœuds principaux du cluster de basculement. Cela permet aux communications sur les réseaux d’entreprise et privés de contacter le nœud principal actuellement actif à tout moment par le nom virtuel et l’adresse IP, ce qui garantit que la communication ne s’interrompt pas si le nœud principal actif échoue et que les fonctionnalités basculent vers le nœud principal passif.

Pour plus d’informations, consultez Configuration de Microsoft HPC Pack pour la haute disponibilité du nœud principal.

Performances MPI

Les tests ping-pong (MPI) de l’interface de transmission de messages mesurent la latence réseau et le débit entre les nœuds du cluster en envoyant à plusieurs reprises des paquets de données entre les nœuds jumelés. La latence est la moyenne de la moitié du temps nécessaire à un paquet pour effectuer un aller-retour entre une paire de nœuds, en microsecondes. Le débit est le taux moyen de transfert de données entre une paire de nœuds, en Mo/seconde. Lorsque vous exécutez les tests ping-pong MPI, vous pouvez spécifier le mode d’exécution et le réseau à utiliser.

Important

Pour obtenir des résultats précis avec les tests ping-pong MPI, exécutez les tests en mode série série (le cas échéant) et assurez-vous que les nœuds n’exécutent pas de travaux. Si les nœuds exécutent des travaux, les tests ne retournent pas de mesures précises de latence et de débit.

Le paramètre en mode en cours d’exécution a les valeurs suivantes :

  • anneau: dans un test en anneau (également appelé test voisin le plus proche), les nœuds envoient des paquets entre eux une paire à la fois dans un modèle d’anneau. Pendant qu’une paire de nœuds exécute le test, tous les autres nœuds restent inactifs. La première paire de nœuds avec son voisin immédiat. Une fois le test effectué sur la première paire, le nœud suivant est associé à un voisin. Ce jumelage et ce test séquentiels continuent jusqu’à ce que le test couvre tous les nœuds du cluster HPC et que chaque nœud a associé deux voisins, un dans chaque direction autour de l’anneau.

    Vous pouvez utiliser mode Ring pour obtenir une indication raisonnable des performances d’un cluster HPC dans un délai minimal. Le test en anneau prend moins de temps qu’un test de type série ou tournoi, car chaque nœud est testé avec seulement deux nœuds voisins au lieu de tous les nœuds du cluster.

  • série: le mode série exécute le test ping-pong MPI sur une paire de nœuds à la fois. Pendant qu’une paire de nœuds exécute le test, tous les autres nœuds restent inactifs. Quand une paire de nœuds termine le test, le test s’exécute pour une autre paire de nœuds, et ce test de paires individuelles continue en série jusqu’à ce que toutes les paires possibles de nœuds soient testées.

    Vous pouvez utiliser mode de série pour tester minutieusement tous les liens réseau individuels entre les nœuds lorsque le cluster HPC a un petit nombre de nœuds. Ce mode fournit la mesure la plus précise de la latence ou du débit. Étant donné que le test série exécute le test ping-pong MPI sur toutes les paires possibles de nœuds à la fois, le test peut prendre beaucoup de temps pour un grand nombre de nœuds.

  • Tournoi: le mode Tournoi exécute le test de ping-pong MPI en plusieurs manches, semblable à un tournoi. Dans chaque tour, tous les nœuds de la paire de cluster HPC sont désactivés. Les deux nœuds de chaque paire envoient des paquets entre eux, avec toutes les paires échangeant des paquets en parallèle. Lorsqu’un tour est terminé, un autre tour commence, à l’aide d’un ensemble différent de paires de nœuds que celui utilisé dans les cycles précédents. Les arrondis continuent jusqu’à ce que toutes les paires de nœuds possibles aient été testées. Les tests de ce mode terminent le plus rapide et les commutateurs réseau sont les plus chargés.

    Vous pouvez utiliser mode Tournoi pour tester l’infrastructure du réseau spécifié et la façon dont elle s’effectue lors du chargement. La latence et le débit mesurés sont ceux d’un cluster chargé et peuvent donc ne pas comparer favorablement avec les spécifications du fabricant pour votre matériel réseau.

Note

Vous pouvez exécuter les tests avec des arguments supplémentaires et obtenir une sortie supplémentaire à l’aide de la commande mpipingpong.

Diagnostique Description
Ping Pong MPI : latence Ce test mesure la bande passante et la latence de la communication entre nœuds. Étant donné qu’il s’agit d’un test de performances, pour obtenir des résultats précis, exécutez ce test sur les nœuds qui sont hors connexion et qui n’exécutent pas d’autres travaux.

Paramètres : Vous pouvez spécifier le réseau à utiliser pour le test et le mode en cours d’exécution.

Par défaut, ce test s’exécute en mode tournoi . Lorsque vous utilisez mode tournoi pour mesurer la latence, le test introduit peu de bruit dans les mesures de latence simultanées de chaque tour, car les paquets sont petits et, par conséquent, les commutateurs réseau fortement sur-abonnés n’empêchent pas les paquets. Pour obtenir des mesures de latence plus précises, si nécessaire, utilisez mode série pour tester toutes les paires en série.
Ping Pong MPI : Débit Mesure le débit réseau entre les nœuds adjacents sur le cluster.

Paramètres : Vous pouvez spécifier le réseau à utiliser pour le test et le mode en cours d’exécution ( série ou tournoi).

Par défaut, ce test s’exécute en mode de série.
Ping Pong MPI : Débit simple Mesure le débit réseau entre les nœuds adjacents sur le cluster.

Paramètres : Vous pouvez spécifier le réseau à utiliser pour le test.

Mesure le débit uniquement entre les paires de nœuds adjacents dans le cluster à l’aide de mode Anneau. Cela fournit une vérification raisonnable de la connectivité sur le réseau spécifié. Pour obtenir des mesures de débit plus précises, exécutez le test Ping Pong MPI : Débit test.

État du réseau

Les tests de cette suite peuvent vous aider à vérifier la configuration de votre réseau de cluster. Il n’existe aucun paramètre que vous pouvez configurer pour ces tests.

Diagnostique Description
Rapport de configuration du pare-feu Signale l’état du pare-feu (activé ou désactivé) pour les nœuds sélectionnés. Ce test signale également les applications ou services autorisés par le biais du pare-feu (exceptions de pare-feu), y compris le numéro de port qu’ils utilisent.

Consultez également Understanding Firewall Configuration for HPC Networks.
Rapport de configuration réseau Signale la configuration des cartes réseau pour chaque nœud sélectionné.

Résolution des problèmes réseau

Les tests de cette suite peuvent vous aider à vérifier la connectivité réseau pour les nœuds de cluster.

Diagnostique Description
DNS Test Vérifie la résolution de noms dns (Domain Name System) entre les nœuds sélectionnés.
Test de connectivité de domaine Vérifie la connectivité entre les nœuds sélectionnés et chaque contrôleur de domaine.
Ping Test Vérifie la connectivité réseau entre les nœuds sélectionnés en effectuant un test ping entre chaque nœud et tous les autres nœuds du groupe sélectionné.

Paramètres : Vous pouvez spécifier le réseau à utiliser pour le test et le nombre de pings par nœud.

Note

Le pack d’outils HPC Pack inclut le rapport de résolution des problèmes réseau, un test de diagnostic supplémentaire qui collecte et analyse les informations réseau dans votre cluster HPC Pack pour vous aider à résoudre les problèmes réseau. Si vous disposez d’un réseau InfiniBand, le rapport inclut également l’état et les fonctionnalités des cartes HCA (Host Channel Adapter) dans ce réseau. Pour plus d’informations, consultez Installer et utiliser le test de diagnostic de rapport de résolution des problèmes réseau.

Services

Les tests et rapports de cette suite peuvent vous aider à vérifier que les services HPC requis s’exécutent sur les nœuds sélectionnés et résolvent les erreurs de service.

Diagnostique Description
Rapport de configuration du service Signale tous les services en cours d’exécution installés sur les nœuds sélectionnés et leur paramètre de configuration de démarrage.
Rapport d’état du service Signale les événements HPC dans le journal des événements pour les nœuds sélectionnés.

Paramètres : Vous pouvez spécifier le nombre d’heures pour indiquer la distance entre 1 et 50 heures dans le journal des événements. Vous pouvez également limiter le nombre d’événements à signaler en définissant le nombre de journaux paramètre (1 à 100).
Services en cours d’exécution de test Vérifie que les services HPC s’exécutent sur les nœuds sélectionnés. Les services attendus sont déterminés par le rôle du nœud cible (nœud principal, nœud de calcul ou nœud broker WCF). Ce test peut signaler l’état des services facultatifs, s’ils sont présents, mais il valide uniquement les services requis.

SOA

Le test de chargement du service SOA vérifie que les DLL du service spécifié peuvent être chargées sur les nœuds spécifiés et que toutes les dépendances détectées pour la DLL sont présentes sur les nœuds. Par défaut, ce test utilise le service intégré CcpEchoSvc pour vérifier la fonctionnalité SOA sur le cluster.

Pour vérifier qu’un service particulier peut être chargé, vous pouvez spécifier le nom du service dans le paramètre de test. Lorsque vous exécutez lede test de chargement de service SOA , dans Configuration, dans Gestion des services SOA dans Microsoft HPC Pack, le service que vous sélectionnez est automatiquement spécifié dans le paramètre du test.

Configuration du système

Les rapports de cette suite fournissent des informations sur la configuration des applications et les mises à jour logicielles sur les nœuds sélectionnés.

Diagnostique Description
Rapport de schéma d’alimentation actif Test ajouté dans HPC Pack 2012.

Signale le schéma d’alimentation actif (plan) et répertorie tous les schémas d’alimentation existants configurés dans le système d’exploitation sur les nœuds sélectionnés.
Rapport de configuration d’application Signale les applications, y compris les numéros de version, installés sur les nœuds sélectionnés. Les résultats incluent un tableau qui répertorie toutes les applications installées et le nombre de nœuds sur lesquels cette application est installée. Vous pouvez également afficher les résultats par nœud.
Mises à jour logicielles disponibles pour le rapport de nœud Signale les mises à jour logicielles disponibles pour les nœuds sélectionnés. Les rapports de test sur les mises à jour identifiées comme critiques par Windows Server Update Services (WSUS) ou Microsoft Update. Le diagnostic communique avec le client Microsoft Update, qui filtre les mises à jour afin que seules celles qui sont pertinentes pour le nœud soient signalées au diagnostic.

Ce test échoue si le proxy winhttp n’est pas défini sur le nœud de calcul. Exécutez la commande netsh winhttp show proxy pour déterminer si les nœuds ont un jeu de serveurs proxy.

Pour plus d’informations sur l’application de mises à jour à l’aide d’un serveur WSUS d’entreprise ou à l’aide d’un modèle de nœud, consultez la rubrique Bonnes pratiques dans la guide pas à pas de mise à jour des nœuds.
Test KSP de carte réversible HPC test ajouté dans HPC Pack 2008 R2 avec Service Pack 2.

Indique si le fournisseur de stockage de clés de carte réversible HPC (KSP) est installé sur les nœuds de cluster sélectionnés. Ce paramètre active l’authentification par carte réversible lors de l’exécution de tâches sur les nœuds.

Le KSP est une installation distincte qui est installée uniquement sur le nœud principal et les nœuds de calcul. Il n’est pas nécessaire d’être installé sur les nœuds clients.

Le composant KSP est utilisé pour effectuer l’ouverture de session de carte à puce pour les tâches qui s’exécutent sur des nœuds de calcul. Le KSP est simplement utilisé sur les machines où les tâches sont exécutées.

Si le test échoue : le KSP de carte réversible HPC n’est pas installé sur cet ordinateur. Pour plus d’informations sur son installation pour activer l’authentification par carte réversible, consultez les notes de publication de Microsoft HPC Pack.

Si le test réussit : le KSP de carte réversible HPC est installé sur cet ordinateur.
Mises à jour logicielles manquantes/requises à partir du rapport de modèle Compare les mises à jour logicielles installées sur les nœuds sélectionnés avec les mises à jour spécifiées dans le Appliquer les mises à jour tâche dans le modèle de nœud. Le rapport indique si des nœuds de calcul n’ont pas pu respecter le niveau de mise à jour requis (Aucun, Critique, Tout) ou ne disposent pas des mises à jour spécifiques, comme défini dans le modèle de nœud.

Si ces diagnostics indiquent que les mises à jour requises sont manquantes, placez les nœuds indiqués hors connexion et exécutez l’action Gérer. Consultez Exécuter des tâches de maintenance sur des nœuds.

Le modèle de nœud doit inclure la tâche Appliquer les mises à jour pour exécuter ce test. Si le modèle de nœud n’inclut pas cette tâche, vous pouvez exécuter la mises à jour logicielles disponibles pour le rapport de nœud pour afficher la liste des mises à jour disponibles, ou ajouter la tâche au modèle de nœud. Pour plus d’informations sur l’ajout de la tâche de mise à jour au modèle de nœud, consultez Ajouter la tâche Appliquer les mises à jour à un modèle de nœud.
Mises à jour logicielles installées sur le rapport des nœuds Signale les mises à jour installées sur les nœuds sélectionnés.

Windows Azure

Suite ajoutée dans HPC Pack 2008 R2 avec Service Pack 2.

Les tests de cette suite peuvent vous aider à vérifier que vous pouvez déployer et exécuter des travaux sur les nœuds Windows Azure de votre cluster.

Diagnostique Description
Test des ports du pare-feu Windows Azure Effectue un test simple pour vérifier la communication du nœud principal vers Windows Azure via tous les pare-feu internes et externes existants. Ce test s’exécute toujours à l’aide des informations d’identification de test de diagnostic par défaut. Vous pouvez exécuter ce test avant de déployer des nœuds Windows Azure pour vous assurer que tout pare-feu existant est configuré pour autoriser le déploiement, le planificateur et la communication broker entre le nœud principal et Windows Azure.

Ce test vérifie la communication sortante sur les ports TCP sélectionnés du nœud principal vers le service hpcazureportcheck.cloudapp.net dans Windows Azure. Le service hpcazureportcheck.cloudapp.net est hébergé par Microsoft pour fournir un point de terminaison de communication pour ce test. Important : hpcazureportcheck.cloudapp.net n’est lié à aucun service hébergé Windows Azure que vous utilisez pour vos déploiements de nœuds Windows Azure. Vous n’avez pas besoin de déployer des nœuds Windows Azure dans votre cluster, car il est utilisé uniquement par les ports de pare-feu Windows Azure Test.

Les ports de pare-feu que les tests vérifient sont ceux requis par la version de HPC Pack installée sur le nœud principal (à compter de HPC Pack 2008 R2 avec SP2). Si vous avez installé HPC Pack 2008 R2 avec SP2, la communication sur les ports TCP suivants est testée :

- 80
- 443
- 3389
- 5901
- 5902
- 7998
- 7999

Si vous avez installé au moins HPC Pack 2008 R2 avec SP3, la communication sur les ports TCP suivants est testée par défaut :

- 443
- 3389 Important :
  • Un échec peut indiquer qu’un port est bloqué par votre pare-feu d’entreprise. Si vous avez déjà débloqué tous les ports répertoriés et que vous constatez toujours un échec, cela peut signifier qu’un serveur proxy ou un client, un pare-feu logiciel ou un autre appareil qui gère le trafic Internet n’est pas configuré pour permettre aux services HPC de communiquer avec Windows Azure.
  • Les résultats des tests réussis ne garantissent pas que le nœud principal peut communiquer correctement avec un service hébergé que vous utilisez pour vos déploiements de nœuds Windows Azure.
  • Si vous choisissez d’activer l’accès pare-feu pour ce test, il est recommandé d’activer l’accès au nom d’hôte hpcazureportcheck.cloudapp.net au lieu de son adresse IP, car ce dernier peut changer.
  • Si vous avez installé hpc Pack 2008 R2 est avec SP3, vous pouvez configurer un paramètre de Registre afin que le nœud principal communique avec Windows Azure à l’aide des ports de pare-feu réseau requis pour HPC Pack 2008 R2 avec SP2 au lieu des ports par défaut requis pour HPC Pack 2008 R2 avec SP3. Si vous procédez ainsi, le test vérifie la communication sur les ports requis pour HPC Pack 2008 R2 avec SP2.


Pour plus d’informations sur les ports de pare-feu pour Windows Azure, consultez Configuration requise pour les nœuds Windows Azure dans Microsoft HPC Pack.
Windows Azure MPI Communication Test Exécute un test ping-pong simple entre des paires de nœuds Windows Azure pour vous assurer que la communication MPI fonctionne correctement. Ce test s’exécute uniquement sur les nœuds Windows Azure et sur les nœuds du même déploiement.
Rapport Windows Azure Signale les noms des instances de rôle pour les nœuds Windows Azure qui ont été déployés. Important : Après l’installation de HPC Pack 2008 R2 SP3, ce test ne fournit plus les noms des instances de rôle pour les nœuds Windows Azure. Pour contourner ce problème, vous pouvez exécuter la commande suivante sur chaque nœud pour lequel vous souhaitez afficher le nom : Set COMPUTERNAME Vous pouvez également utiliser une commande clusrun, ou créer un test de diagnostic, pour exécuter cette commande sur un groupe de nœuds.
Test de connexion aux services Windows Azure Vérifie que les services s’exécutant sur le nœud principal peuvent se connecter à Windows Azure à l’aide des ID d’abonnement et des certificats spécifiés dans les modèles de nœud Windows Azure. Ce test s’exécute toujours à l’aide des informations d’identification de test de diagnostic par défaut.

Paramètre : Vous pouvez spécifier le modèle de nœud à utiliser pour le test. Par défaut, ce test utilise tous les modèles de nœud.
Test de réseau virtuel Windows Azure Test ajouté dans HPC Pack 2012.

Effectue un test pour vérifier que les sites de réseau virtuel Windows Azure configurés dans tous les modèles de nœud Windows Azure sont valides.

Il n’existe aucun paramètre que vous pouvez configurer pour ce test.

Références supplémentaires