Clusterprobleem oplossen met gebeurtenis-id 1135
Dit artikel helpt u bij het vaststellen en oplossen van gebeurtenis-id 1135, die mogelijk wordt geregistreerd tijdens het opstarten van de clusterservice in de failoverclusteromgeving.
Van toepassing op: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, versies 21H2 en 20H2
Probeer onze virtuele agent : hiermee kunt u snel veelvoorkomende problemen met Active Directory-replicatie identificeren en oplossen.
Startpagina
Gebeurtenis-id 1135 geeft aan dat een of meer clusterknooppunten zijn verwijderd uit het actieve failoverclusterlidmaatschap. Het kan vergezeld gaan van de volgende symptomen:
Clusterfailover\knooppunten die worden verwijderd uit het actieve failoverclusterlidmaatschap:
Er is een probleem met knooppunten die worden verwijderd uit het actieve failoverclusterlidmaatschap
Gebeurtenis-id 1069:
Gebeurtenis-id 1069 - Beschikbaarheid van geclusterde service of toepassing
Gebeurtenis-id 1177 voor quorumverlies:
Gebeurtenis-id 1177 - Quorum en connectiviteit vereist voor quorum
Gebeurtenis-id 1006 voor clusterservice gestopt:
Een validatie en de netwerktests worden aanbevolen als een van de eerste stappen voor probleemoplossing om ervoor te zorgen dat er geen configuratieproblemen zijn die een oorzaak kunnen zijn van problemen.
Controleer of de aanbevolen hot fixes zijn geïnstalleerd
De Cluster-service is het essentiële softwareonderdeel dat alle aspecten van failoverclusterbewerking beheert en de clusterconfiguratiedatabase beheert. Als u de gebeurtenis-id 1135 ziet, raden we u aan de oplossingen te installeren die worden vermeld in de volgende artikelen en alle knooppunten van het cluster opnieuw op te starten. Kijk vervolgens of het probleem zich opnieuw voordoet.
- Aanbevolen hotfixes en updates voor failoverclusters op basis van Windows Server 2012 R2
- Aanbevolen hotfixes en updates voor failoverclusters op basis van Windows Server 2012
- Aanbevolen hotfixes en updates voor Windows Server 2008 R2 SP1-failoverclusters
Controleer of de clusterservice wordt uitgevoerd op alle knooppunten
Volg de volgende opdracht volgens uw Windows-besturingssysteem om te controleren of de clusterservice continu wordt uitgevoerd en beschikbaar is.
Voor Windows Server 2008 R2-cluster
Voer de opdracht uit cluster.exe node /stat
vanaf een opdrachtprompt met verhoogde bevoegdheid.
Voor Windows Server 2012- en Windows Server 2012 R2-cluster
Voer de volgende PowerShell-cmdlet uit: Get-ClusterResource
Wordt de clusterservice continu uitgevoerd en beschikbaar op alle knooppunten?
Verschillende scenario's van gebeurtenis-id 1135
We willen dat u de logboeken van systeemevenementen op alle knooppunten van uw cluster nader bekijkt. Controleer de gebeurtenis-id 1135 die u op de knooppunten ziet en kopieer alle exemplaren van deze gebeurtenis. Dit maakt het handig voor u om ze te bekijken en te beoordelen.
Event ID 1135
Cluster node ' **NODE A** ' was removed from the active failover cluster membership. The Cluster service on this node may have stopped.
This could also be due to the node having lost communication with other active nodes in the failover cluster.
Run the Validate a Configuration wizard to check your network configuration.
If the condition persists, check for hardware or software errors related to the network adapters on this node.
Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.
Er zijn drie typische scenario's:
Scenario A
U bekijkt alle gebeurtenissen en alle knooppunten in het cluster die aangeven dat KNOOPPUNT A de communicatie heeft verbroken.
Het kan zijn dat wanneer u de systeemlogboeken op NODE A ziet, er gebeurtenissen zijn voor alle resterende knooppunten in het cluster.
Oplossing
Dit duidt erop dat op het moment van het probleem, hetzij vanwege netwerkcongestie of anders de communicatie met het KNOOPPUNT A verloren is gegaan.
Controleer en valideer de problemen met de netwerkconfiguratie en communicatie. Vergeet niet om te zoeken naar problemen met betrekking tot Node A.
Scenario B
U bekijkt de gebeurtenissen op de knooppunten en laat ons zeggen dat uw cluster verspreid is over twee sites. NODE A, NODE B en NODE C op site 1 en NODE D & NODE E op site 2.
Op knooppunten A, B en C ziet u dat de gebeurtenissen die zijn geregistreerd voor connectiviteit met knooppunten D &E. Als u de gebeurtenissen op knooppunten D &E ziet, raden de gebeurtenissen aan dat we de communicatie met A, B en C verloren hebben.
Oplossing
Als u vergelijkbare activiteit ziet, is het indicatie dat er een communicatiefout is opgetreden via de koppeling die deze sites verbindt. We raden u aan om de verbinding tussen de sites te controleren, als dit via een WAN-verbinding is, raden we u aan om te controleren met uw internetprovider over de connectiviteit.
Scenario C
U bekijkt de gebeurtenissen op de knooppunten en u ziet dat de namen van de knooppunten niet met een bepaald patroon worden opgeteld. Stel dat uw cluster verspreid is over twee sites. NODE A, NODE B en NODE C op site 1 en NODE D & NODE E op site 2.
- Op knooppunt A: u ziet gebeurtenissen voor knooppunt B, D, E.
- Op knooppunt B: u ziet gebeurtenissen voor knooppunten C, D, E.
- Op knooppunt C: u ziet gebeurtenissen voor knooppunt A, B, E.
- Op knooppunt D: u ziet gebeurtenissen voor knooppunt A, C, E.
- Op knooppunt E: u ziet gebeurtenissen voor knooppunt B, C, D.
- Of andere combinaties.
Oplossing
Dergelijke gebeurtenissen zijn mogelijk wanneer de netwerkkanalen tussen de knooppunten worden verstikt en de clustercommunicatieberichten niet tijdig worden bereikt, waardoor het cluster het gevoel krijgt dat de communicatie tussen de knooppunten verloren gaat, wat leidt tot het verwijderen van knooppunten uit het clusterlidmaatschap.
Clusternetwerken controleren
We raden u aan uw clusternetwerken te controleren door de volgende drie opties één voor één te controleren om door te gaan met deze gids voor probleemoplossing.
Controleren op antivirusuitsluiting
Sluit de volgende bestandssysteemlocaties uit van virusscans op een server waarop Cluster Services wordt uitgevoerd:
- Het pad van de Bestandssharewitness
- De map %Systemroot%\Cluster
Configureer het realtime scanonderdeel in uw antivirussoftware om de volgende mappen en bestanden uit te sluiten:
Standaardmap voor configuratie van virtuele machines (C:\ProgramData\Microsoft\Windows\Hyper-V)
Aangepaste configuratiemappen voor virtuele machines
Standaardmap voor virtuele harde schijven (C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks)
Aangepaste mappen voor virtuele harde schijven
Aangepaste directory's voor replicatiegegevens als u Hyper-V Replica gebruikt
Momentopnamemappen
mms.exe
Notitie
Dit bestand moet mogelijk worden geconfigureerd als een procesuitsluiting in de antivirussoftware.
Vmwp.exe
Notitie
Dit bestand moet mogelijk worden geconfigureerd als een procesuitsluiting in de antivirussoftware.
Wanneer u livemigratie samen met gedeelde clustervolumes gebruikt, sluit u bovendien het CSV-pad C:\Clusterstorage en alle bijbehorende submappen uit. Als u failoverproblemen of algemene problemen met clusterservices en antivirussoftware wilt oplossen, verwijdert u de antivirussoftware tijdelijk of neemt u contact op met de fabrikant van de software om te bepalen of de antivirussoftware werkt met Cluster-services. Het uitschakelen van de antivirussoftware is in de meeste gevallen onvoldoende. Zelfs als u de antivirussoftware uitschakelt, wordt het filterstuurprogramma nog steeds geladen wanneer u de computer opnieuw opstart.
Controleren op netwerkpoortconfiguratie in firewall
De Clusterservice verwerkt serverclusterbewerkingen en beheert de clusterdatabase. Een cluster is een verzameling van onafhankelijke computers die handelen als enkele computer. Beheerders, programmeurs en gebruikers zien de cluster als een enkel systeem. De software verdeelt gegevens onder de knooppunten van de cluster. Bij een knooppuntfout leveren andere knooppunten de services en gegevens die voorheen werden geleverd door het ontbrekende knooppunt. Als een knooppunt wordt toegevoegd of hersteld, migreert de clustersoftware een deel van de gegevens naar dat knooppunt.
Naam systeemservice: ClusSvc
Toepassing | Protocol | Poorten |
---|---|---|
Clusterservice | UDP | 3343 |
Clusterservice | TCP | 3343 (Deze poort is vereist tijdens een JOIN-bewerking van een knooppunt.) |
RPC | TCP | 135 |
Clusterbeheerder | UDP | 137 |
Kerberos | UDP/TCP | 464* |
MKB | TCP | 445 |
Willekeurig toegewezen hoge UDP-poorten** | UDP | Willekeurig poortnummer tussen 1024 en 65535 Willekeurig poortnummer tussen 49152 en 65535*** |
Notitie
Voor een geslaagde validatie op Windows-failoverclusters in Windows Server 2008 en hoger kunt u binnenkomend en uitgaand verkeer toestaan voor ICMP4, ICMP6.
- Zie Een Windows Server 2012-failovercluster maken met fout 0xc000005e voor meer informatie.
- Zie de sectie Verwijzingen in serviceoverzicht en netwerkpoortvereisten voor Windows voor meer informatie over het aanpassen van deze poorten.
Dit is het bereik in Windows Server 2012, Windows 8, Windows Server 2008 R2, Windows 7, Windows Server 2008 en Windows Vista.
Voer bovendien de volgende opdracht uit om te controleren op de configuratie van de netwerkpoort in de firewall. Bijvoorbeeld: Met deze opdracht kunt u bepalen welke poort 3343 beschikbaar\open is gebruikt voor failovercluster:
netsh advfirewall firewall show rule name="Failover Clusters (UDP-In)" verbose
Het clustervalidatierapport uitvoeren voor eventuele fouten of waarschuwingen
Het hulpprogramma voor clustervalidatie voert een reeks tests uit om te controleren of uw hardware en instellingen compatibel zijn met failoverclustering.
Volg deze instructies:
Voer het clustervalidatierapport uit voor eventuele fouten of waarschuwingen. Zie Clustervalidatietests begrijpen voor meer informatie : Netwerk
Controleer op waarschuwingen en fouten voor netwerken. Zie Clustervalidatietests: Netwerk voor meer informatie.
Controleer de bindingsvolgorde van het lijstnetwerk
Deze test bevat de volgorde waarin netwerken zijn gebonden aan de adapters op elk knooppunt.
Op het tabblad Adapters en bindingen worden de verbindingen weergegeven in de volgorde waarin de verbindingen worden geopend door netwerkservices. De volgorde van deze verbindingen weerspiegelt de volgorde waarin algemene TCP/IP-aanroepen/pakketten naar de kabel worden verzonden.
Volg de onderstaande stappen om de bindingsvolgorde van netwerkadapters te wijzigen:
- Selecteer Start, selecteer Uitvoeren, typ ncpa.cpl en selecteer vervolgens OK. U kunt de beschikbare verbindingen zien in de sectie LAN en High-Speed Internet van het venster Netwerkverbindingen .
- Selecteer geavanceerde instellingen in het menu Geavanceerd en selecteer vervolgens het tabblad Adapters en bindingen.
- Selecteer in het gebied Verbindingen de verbinding die u hoger in de lijst wilt verplaatsen. Gebruik de pijlknoppen om de verbinding te verplaatsen. In de regel moet de kaart die met het netwerk praat (domeinconnectiviteit, routering naar andere netwerken, enzovoort) de eerste gebonden kaart (boven aan de lijst) zijn.
Clusterknooppunten zijn systemen met meerdere locaties. De netwerkprioriteit is van invloed op de DNS-client voor uitgaande netwerkconnectiviteit. Netwerkadapters die worden gebruikt voor clientcommunicatie, moeten bovenaan in de bindingsvolgorde staan. Niet-gerouteerde netwerken kunnen met een lagere prioriteit worden geplaatst. In Windows Server 2012 en Windows Server 2012 R2 wordt de adapter voor het clusternetwerkstuurprogramma (NETFT.SYS) automatisch onderaan in de lijst met bindingsorders geplaatst.
Controleer de netwerkcommunicatie valideren
Latentie op uw netwerk kan er ook toe leiden dat dit gebeurt. De pakketten gaan mogelijk niet verloren tussen de knooppunten, maar ze komen mogelijk niet snel genoeg bij de knooppunten voordat de time-outperiode verloopt.
Met deze test wordt gevalideerd dat geteste servers kunnen communiceren met acceptabele latentie op alle netwerken.
Bijvoorbeeld: Onder Netwerkcommunicatie valideren ziet u mogelijk de volgende berichten voor netwerklatentieproblemen:
Succeeded in pinging network interface node003.contoso.com IP Address 192.168.0.2 from network interface node004.contoso.com IP Address 192.168.0.3 with maximum delay 500 after 1 attempt(s).
Either address 10.0.0.96 is not reachable from 192.168.0.2 or **the ping latency is greater than the maximum allowed 2000 ms**
This may be expected, since network interfaces node003.contoso.com - Heartbeat Network and node004.contoso.com - Production Network are on different cluster networks
Either address 192.168.0.2 is not reachable from 10.0.0.96 or **the ping latency is greater than the maximum allowed 2000 ms**
This may be expected, since network interfaces node004.contoso.com - Production Network and node003.contoso.com - Heartbeat Network for MSCS are on different cluster networks
Voor een cluster met meerdere sites kunt u de time-outwaarden verhogen. Zie Heartbeat- en DNS-instellingen configureren in een failovercluster met meerdere sites voor meer informatie.
Neem contact op met internetprovider voor eventuele WAN-connectiviteitsproblemen.
Controleer of u een van de volgende problemen ondervindt.
Netwerkpakketten verloren tussen knooppunten
Pakketverlies controleren met behulp van prestaties
Als het pakket ergens tussen de knooppunten verloren gaat op de kabel, mislukken de heartbeats. We kunnen eenvoudig achterhalen of dit een probleem is met behulp van Performance Monitor om te kijken naar de teller 'Network Interface\Packets Received Discarded'. Zodra u deze teller hebt toegevoegd, bekijkt u de getallen Gemiddelde, Minimum en Maximum en als deze waarden hoger zijn dan nul, moet de ontvangstbuffer worden aangepast voor de adapter.
Als u netwerkpakket kwijtraakt op het VMware-virtualisatieplatform, raadpleegt u de sectie Cluster geïnstalleerd in het VMware-virtualisatieplatform.
De NIC-stuurprogramma's upgraden
Dit probleem kan optreden vanwege verouderde NIC-stuurprogramma's\Integration Components (IC)\VmTools of defecte NIC-adapters. Als er netwerkpakketten verloren gaan tussen knooppunten op fysieke machines, moet u de stuurprogramma-updates van uw netwerkadapter hebben. Oude of verouderde netwerkkaartstuurprogramma's en/of firmware. Soms kan een eenvoudige onjuiste configuratie van de netwerkkaart of switch ook leiden tot verlies van heartbeats.
Cluster geïnstalleerd in het VMware-virtualisatieplatform
Controleer problemen met de VMware-adapter in het geval van een VMware-omgeving.
Dit probleem kan optreden als de pakketten worden verwijderd tijdens pieken in het verkeer. Zorg ervoor dat er geen verkeersfilters plaatsvinden (bijvoorbeeld met een e-mailfilter). Nadat u deze mogelijkheid hebt geëlimineerd, verhoogt u geleidelijk het aantal buffers in het gastbesturingssysteem en controleert u deze.
Voer de volgende stappen uit om piekverkeer te verminderen:
- Selecteer Start, selecteer Uitvoeren, typ
devmgmt.msc
en druk op Enter. - Vouw netwerkadapters uit, klik met de rechtermuisknop op vmxnet3 en selecteer Eigenschappen.
- Klik op het tabblad Geavanceerd.
- Selecteer Small Rx Buffers en verhoog de waarde. De standaardwaarde is 512 en het maximum is 8192.
- Selecteer Rx Ring #1 Grootte en verhoog de waarde. De standaardwaarde is 1024 en het maximum is 4096.
Raadpleeg de volgende artikelen om problemen met de VMware-adapter te controleren in het geval van een VMware-omgeving:
- Knooppunten die worden verwijderd uit het lidmaatschap van een failovercluster op VMware ESX?.
- Groot pakketverlies op gastbesturingssysteemniveau op de VMXNET3 vNIC in ESXi
Let op een netwerkcongestie
Netwerkcongestie kan ook netwerkverbindingsproblemen veroorzaken.
Controleer of uw netwerk is geconfigureerd volgens de aanbevelingen van MS en leveranciers. Zie Windows Failover Cluster Networks configureren.
De netwerkconfiguratie controleren
Als het nog steeds niet werkt, controleert u of u een gepartitioneerd netwerk in de cluster-GUI hebt gezien of dat NIC-koppeling is ingeschakeld op de heartbeat-NIC.
Als u een gepartitioneerd netwerk in de cluster-GUI ziet, raadpleegt u Gepartitioneerde clusternetwerken om het probleem op te lossen.
Als NIC-koppeling is ingeschakeld op de heartbeat-NIC, controleert u de functionaliteit van de teamsoftware volgens de aanbeveling van de leverancier van een team.
De NIC-stuurprogramma's upgraden
Dit probleem kan optreden vanwege verouderde NIC-stuurprogramma's of defecte NIC-adapters.
Als er netwerkpakketten verloren gaan tussen knooppunten op fysieke machines, moet u updates voor het stuurprogramma van uw netwerkadapter hebben. Oude of verouderde netwerkkaartstuurprogramma's en/of firmware.
Soms kan een eenvoudige onjuiste configuratie van de netwerkkaart of switch ook leiden tot verlies van heartbeats.
De netwerkconfiguratie controleren
Als dit nog steeds niet werkt, controleert u of u een gepartitioneerd netwerk in de cluster-GUI hebt gezien of dat NIC-koppeling is ingeschakeld op de heartbeat-NIC.