Guide de résolution des problèmes d’échec de démarrage du service de cluster
Liste de contrôle pour la résolution des problèmes
Vérifier les ports utilisés par le service de cluster
Assurez-vous que les ports suivants sont ouverts au trafic de cluster sur tous les pare-feu :
Port 135 : Mappeur de point de terminaison d’appel de procédure distante (RPC) ou modèle objet de composant distribué (DCOM).
Port 135 : Mappeur de point de terminaison RPC sur le protocole UDP (User DataGram Protocol).
Port 3343 : pilote réseau de cluster.
Port 445 : Bloc de messages serveur (SMB).
Port 139 : service de session NetBIOS.
Ports de la plage de 5000 à 5099 : si l’ID d’événement 1721 est enregistré lorsque vous vous connectez à un cluster en tant qu’administrateur de cluster, essayez d’ouvrir les ports de cette plage (ou d’autres ports) au trafic RPC. Les ports prennent en charge la communication via RPC, sauf si vous tapez simplement un caractère de point (.).
Ce problème peut se produire, car le service de cluster utilise au moins 100 ports pour la communication RPC. Le nombre de ports disponibles pour le service de cluster peut devenir trop petit lorsque d’autres services utilisent certains des ports nécessaires. Ces services peuvent inclure le service DNS Windows, le service WINS (Windows Internet Name) ou le service Microsoft SQL Server.
Ports de la plage de 8011 à 8031 : si les pare-feu séparent les nœuds du cluster, les ports de la plage de 8011 à 8031 doivent être ouverts au trafic RPC entre nœuds. Dans le cas contraire, les erreurs dans le journal du cluster indiquent qu’un nœud de sponsor n’est pas disponible. Ces erreurs se produisent parce qu’il n’existe pas suffisamment de ports disponibles pour la communication RPC entre un nœud qui tente de joindre le cluster et un nœud pouvant parrainer ce nœud.
Pour plus d’informations sur la configuration d’un réseau et de ports réseau pour un cluster, consultez les articles suivants :
Après avoir modifié les paramètres de port, essayez de remettre le nœud en ligne avant de continuer.
Exécuter l’outil de validation du cluster
Ouvrez le composant logiciel enfichable Gestionnaire de cluster de basculement (CluAdmin.msc).
Sélectionnez Gestionnaire du cluster de basculement dans la colonne supérieure gauche.
Sélectionnez Valider la configuration.
Tapez le nom de chaque nœud du cluster, puis sélectionnez Ajouter après chacun d’eux.
Lorsque tous les nœuds ont été ajoutés aux serveurs sélectionnés : liste, sélectionnez Suivant.
Sélectionnez Exécuter tous les tests (recommandé)>Suivant.>
Autoriser le test à terminer. Une fois terminé, sélectionnez Afficher le rapport.
Passez en revue les résultats des tests étiquetés en tant qu’échec ou avertissement. Ces informations peuvent vous aider à fournir des étapes exploitables pour résoudre le problème.
Pour obtenir un fichier téléchargeable, accédez au dossier C :\Windows\Cluster\Reports et ouvrez le rapport de validation (. Fichier MHT).
Note
Dans Windows Server 2016 et versions ultérieures, il s’agit d’un fichier .HTM .
Vérifier les stratégies de sécurité susceptibles d’affecter le nœud de cluster
Dans l’Éditeur d’objets de stratégie de groupe, ces objets de stratégie se trouvent dans Configuration ordinateur\Paramètres Windows\Paramètres de sécurité\Stratégies locales\Affectation des droits utilisateur.
Note
Pour accéder aux paramètres de stratégie de sécurité locale, sélectionnez Démarrer, tapez stratégie de sécurité locale, puis sélectionnez Stratégie de sécurité locale.
Assurez-vous que la liste des comptes inclut les comptes chargés de l’exécution du nœud de cluster. Pour plus d’informations, consultez Comment accéder à cet ordinateur à partir du réseau et autoriser la connexion au paramètre de stratégie de sécurité locale.
Vérifiez que la liste des comptes n’inclut pas les comptes locaux. Pour plus d’informations, consultez Comment refuser l’accès à cet ordinateur à partir du réseau.
Vérifiez que la liste des comptes et des groupes n’inclut pas le groupe « Tout le monde ». Pour plus d’informations, consultez Refuser le journal sur le paramètre de stratégie de sécurité locale.
Après avoir modifié les paramètres de stratégie, essayez de remettre le nœud en ligne avant de continuer.
Désactiver temporairement les pare-feu
Désactivez le pare-feu entre le nœud et le reste du cluster, puis essayez de remettre le nœud en ligne. Si le nœud n’est toujours pas en ligne, le pare-feu peut être la cause.
Important
Ne laissez pas cette modification en place une fois que vous avez terminé la résolution des problèmes. Après avoir utilisé cette modification pour les tests, retournez ces paramètres à la configuration d’origine.
Rechercher les problèmes liés au matériel et aux logiciels réseau
Vérifiez le journal des événements système pour connaître les erreurs matérielles ou logicielles liées aux cartes réseau sur ce nœud.
Vérifiez la carte réseau, les câbles et la configuration des réseaux qui relient les nœuds.
Si vous associez les cartes réseau, vérifiez que la configuration d’association est correcte.
Vérifiez les hubs, les commutateurs ou les ponts des réseaux qui relient les nœuds.
Examiner les fichiers journaux
Pour identifier la source du problème, passez en revue les informations de journal provenant de plusieurs sources. Par exemple :
Dans l’Observateur d’événements, accédez aux journaux des applications et des services\Microsoft\Windows\FailoverClustering-Client\Diagnostic, puis passez en revue les journaux de suivi de l’API de cluster.
Générez un nouveau journal de cluster pour le nœud. Sur le serveur qui exécute le nœud affecté, ouvrez une invite PowerShell avec élévation de privilèges et exécutez l’applet de commande suivante :
Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime
Pour générer une trace plus détaillée, procédez comme suit :
À une invite PowerShell avec élévation de privilèges, exécutez l’applet de commande suivante pour démarrer la trace :
logman create trace "base_cluster" -ow -o c:\base_cluster.etl -p "Microsoft-Windows-FailoverClustering-Client" 0xffffffffffffffff 0xff -nb 16 16 -bs 1024 -mode Circular -f bincirc -max 4096 -ets
Reproduisez le problème.
Pour arrêter la trace, exécutez l’applet de commande suivante :
Logman stop base_cluster.etl -ets
Pour convertir la trace, exécutez l’applet de commande suivante :
Netsh trace convert base_cluster.etl
Pour générer un journal de cluster à partir des données, exécutez l’applet de commande suivante :
Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime
Pour plus d’informations sur le suivi et d’autres problèmes à rechercher, consultez Comment résoudre les problèmes liés à la création d’un cluster.