Les event lors du crash:
Nom du journal :System
Source : Microsoft-Windows-FailoverClustering
Date : 23/10/2024 15:39:52
ID de l’événement :1230
Catégorie de la tâche :Resource Control Manager
Niveau : Erreur
Mots clés :
Utilisateur :
Système Ordinateur : SV02H.donald.org
Description : Un composant sur le serveur n'a pas répondu en temps voulu. La ressource de cluster « Disque Quorum » (type de ressource « Physical Disk », DLL « clusres.dll ») a dépassé le seuil de délai d'attente lors du traitement du code de contrôle « STORAGE_GET_DISK_INFO_EX ». Dans le cadre de la détection d'intégrité de cluster, des actions de récupération vont être tentées. Le cluster va tenter une récupération automatique en arrêtant et en redémarrant le processus du sous-système d'hébergement de ressources (RHS) exécutant la ressource. Vérifiez que l'infrastructure sous-jacente (stockage, réseau ou services) associée à la ressource fonctionne correctement. XML de l’événement : http://schemas.microsoft.com/win/2004/08/events/event"> 1230 1 2 3 0 0x8000000000000000 274690 System SV02H.donald.org Disque Quorum Physical Disk clusres.dll STORAGE_GET_DISK_INFO_EX
et 20 minute après:
Nom du journal :System
Source : Microsoft-Windows-FailoverClustering
Date : 23/10/2024 15:59:52
ID de l’événement :4874
Catégorie de la tâche :Cluster Virtual Adapter
Niveau : Erreur
Mots clés :
Utilisateur : N/A
Ordinateur : SV02H.donald.org Description : Le contrôle d’intégrité du mode utilisateur a détecté que le système ne répondait pas. La carte virtuelle du cluster de basculement a perdu contact avec un processus. Une action de récupération va être effectuée. Processus : C:\Windows\Cluster\rhs.exe ID du processus : 0x3514 Secondes : 1200 XML de l’événement : http://schemas.microsoft.com/win/2004/08/events/event"> 4874 0 2 39 0 0x8000000000000000 274715 System SV02H.donald.org C:\Windows\Cluster\rhs.exe 0x3514 1200
et voici un extrait au moment du crash ce que j'ai trouver dans le dump du cluster Hyper-V:
0003550.00004700::2024/10/23-15:39:50.659 INFO [RES] Network Name: Agent: InitializeModule, Trying to initialize Module(266bbd3c-1459-4ab1-bf5e-b40df0e6f5da,AdminShare) when there is one already in Initialized/Idle state
00003514.000037f4::2024/10/23-15:39:52.830 INFO [RHS-LiveDump] About to capture live dump ReportType ClusResCR, BugCheckCode 0x166, Parameter1 0x3514, Parameter2 0x32e0, Parameter3 0x8, Parameter4 0x10001f1, SecondaryDataSize 318
00003514.000037f4::2024/10/23-15:39:52.831 WARN [RHS-LiveDump] Capture live dump failed 0xd0000022
00003514.000037f4::2024/10/23-15:39:52.831 WARN [RHS - Timeout] Resource 'Disque Quorum' has not responded to the call RESOURCECONTROL:16777713. The timeout to respond has been exceeded by 16 milliseconds, taking recovery actions.
00003514.000037f4::2024/10/23-15:39:52.831 INFO [RHS] Enabling a watchdog to ensure RHS termination completes successfully with timeout 1200000 and recovery action 6 from source 101.
00003514.000037f4::2024/10/23-15:39:52.831 WARN [RHS - Timeout] Health Monitoring Failure : Resource Disque Quorum is not functioning as expected.
Cancelling current operation and terminating the hosting RHS process to reload and recover the resource.
00002160.0000373c::2024/10/23-15:39:52.832 WARN [RCM] HandleMonitorReply: FAILURENOTIFICATION for 'Disque Quorum', gen(0) result 4/0.
00003514.000037f4::2024/10/23-15:39:52.832 INFO [RHS-WER] About to send WER HANG report. Dump policy 0x137701111; ReportId 3cb5e5fd-4d28-4ae9-80bd-c33500f44459
Ce problème se produit de manière aléatoire.
Avez-vous une idée ?