Bonjour, j'ai un problème de crash serveur sur mon cluster Hyper-V depuis un moment, merci de m'aider à trouver la raison.

Anonyme
2024-10-24T14:19:43+00:00

Les event lors du crash:

Nom du journal :System

Source : Microsoft-Windows-FailoverClustering

Date : 23/10/2024 15:39:52

ID de l’événement :1230

Catégorie de la tâche :Resource Control Manager

Niveau : Erreur

Mots clés :

Utilisateur :

Système Ordinateur : SV02H.donald.org

Description : Un composant sur le serveur n'a pas répondu en temps voulu. La ressource de cluster « Disque Quorum » (type de ressource « Physical Disk », DLL « clusres.dll ») a dépassé le seuil de délai d'attente lors du traitement du code de contrôle « STORAGE_GET_DISK_INFO_EX ». Dans le cadre de la détection d'intégrité de cluster, des actions de récupération vont être tentées. Le cluster va tenter une récupération automatique en arrêtant et en redémarrant le processus du sous-système d'hébergement de ressources (RHS) exécutant la ressource. Vérifiez que l'infrastructure sous-jacente (stockage, réseau ou services) associée à la ressource fonctionne correctement. XML de l’événement : http://schemas.microsoft.com/win/2004/08/events/event"> 1230 1 2 3 0 0x8000000000000000 274690 System SV02H.donald.org Disque Quorum Physical Disk clusres.dll STORAGE_GET_DISK_INFO_EX

et 20 minute après:

Nom du journal :System

Source : Microsoft-Windows-FailoverClustering

Date : 23/10/2024 15:59:52

ID de l’événement :4874

Catégorie de la tâche :Cluster Virtual Adapter

Niveau : Erreur

Mots clés :

Utilisateur : N/A

Ordinateur : SV02H.donald.org Description : Le contrôle d’intégrité du mode utilisateur a détecté que le système ne répondait pas. La carte virtuelle du cluster de basculement a perdu contact avec un processus. Une action de récupération va être effectuée. Processus : C:\Windows\Cluster\rhs.exe ID du processus : 0x3514 Secondes : 1200 XML de l’événement : http://schemas.microsoft.com/win/2004/08/events/event"> 4874 0 2 39 0 0x8000000000000000 274715 System SV02H.donald.org C:\Windows\Cluster\rhs.exe 0x3514 1200

et voici un extrait au moment du crash ce que j'ai trouver dans le dump du cluster Hyper-V:

0003550.00004700::2024/10/23-15:39:50.659 INFO [RES] Network Name: Agent: InitializeModule, Trying to initialize Module(266bbd3c-1459-4ab1-bf5e-b40df0e6f5da,AdminShare) when there is one already in Initialized/Idle state

00003514.000037f4::2024/10/23-15:39:52.830 INFO [RHS-LiveDump] About to capture live dump ReportType ClusResCR, BugCheckCode 0x166, Parameter1 0x3514, Parameter2 0x32e0, Parameter3 0x8, Parameter4 0x10001f1, SecondaryDataSize 318

00003514.000037f4::2024/10/23-15:39:52.831 WARN [RHS-LiveDump] Capture live dump failed 0xd0000022

00003514.000037f4::2024/10/23-15:39:52.831 WARN [RHS - Timeout] Resource 'Disque Quorum' has not responded to the call RESOURCECONTROL:16777713. The timeout to respond has been exceeded by 16 milliseconds, taking recovery actions.

00003514.000037f4::2024/10/23-15:39:52.831 INFO [RHS] Enabling a watchdog to ensure RHS termination completes successfully with timeout 1200000 and recovery action 6 from source 101.

00003514.000037f4::2024/10/23-15:39:52.831 WARN [RHS - Timeout] Health Monitoring Failure : Resource Disque Quorum is not functioning as expected.

Cancelling current operation and terminating the hosting RHS process to reload and recover the resource.

00002160.0000373c::2024/10/23-15:39:52.832 WARN [RCM] HandleMonitorReply: FAILURENOTIFICATION for 'Disque Quorum', gen(0) result 4/0.

00003514.000037f4::2024/10/23-15:39:52.832 INFO [RHS-WER] About to send WER HANG report. Dump policy 0x137701111; ReportId 3cb5e5fd-4d28-4ae9-80bd-c33500f44459

Ce problème se produit de manière aléatoire.

Avez-vous une idée ?

Windows Server – Haute disponibilité – Clustering et haute disponibilité

Question verrouillée. Cette question a été migrée à partir de la Communauté Support Microsoft. Vous pouvez voter pour indiquer si elle est utile, mais vous ne pouvez pas ajouter de commentaires ou de réponses ni suivre la question. Pour protéger la confidentialité, les profils utilisateur des questions migrées sont anonymisés.

0 commentaires Aucun commentaire
{count} votes

1 réponse

Trier par : Le plus utile
  1. Anonyme
    2024-10-25T05:29:42+00:00

    Cette réponse a été automatiquement traduite. Par conséquent, il peut y avoir des erreurs grammaticales ou des formulations étranges.

    Salut

    Vérifiez la connectivité réseau au disque témoin. Voyez s’il y a des charges de travail lourdes comme la sauvegarde ou la migration sur le réseau lorsque le problème se produit. Si vous avez un antivirus/pare-feu en cours d’exécution sur votre machine, vous pouvez le désactiver temporairement. L’exécution de l’assistant « Valider une configuration » pour vérifier la configuration de votre réseau peut vous aider à identifier tout problème.

    Vous pouvez également essayer de modifier temporairement le quorum en témoin de partage de fichiers et en majorité de nœud, puis de le remplacer par la majorité de disque et de nœud.

    0 commentaires Aucun commentaire