Dela via


Felsöka klusterproblem med händelse-ID 1135

Den här artikeln hjälper dig att diagnostisera och lösa händelse-ID 1135, som kan loggas när klustertjänsten startas i redundansklustringsmiljön.

Gäller för: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, version 21H2 och 20H2

Prova vår virtuella agent – Det kan hjälpa dig att snabbt identifiera och åtgärda vanliga Active Directory-replikeringsproblem.

Startsida

Händelse-ID 1135 anger att en eller flera klusternoder har tagits bort från det aktiva redundansklustermedlemskapet. Det kan åtföljas av följande symtom:

En validering och nätverkstesterna rekommenderas som ett av de första felsökningsstegen för att säkerställa att det inte finns några konfigurationsproblem som kan orsaka problem.

Klustertjänsten är den viktigaste programvarukomponenten som styr alla aspekter av redundansklusteråtgärden och hanterar klusterkonfigurationsdatabasen. Om du ser händelse-ID 1135 rekommenderar vi att du installerar korrigeringarna som nämns i följande artiklar och startar om alla noder i klustret och sedan observerar om problemet återkommer.

Kontrollera om klustertjänsten körs på alla noder

Följ följande kommando enligt windows-åtgärdssystemet för att verifiera att klustertjänsten körs kontinuerligt och är tillgänglig.

För Windows Server 2008 R2-kluster

Kör från en upphöjd kommandotolk cluster.exe node /stat.

För Windows Server 2012- och Windows Server 2012 R2-kluster

Kör följande PowerShell-cmdlet: Get-ClusterResource

Körs klustertjänsten kontinuerligt och är tillgänglig på alla noder?

Flera scenarier med händelse-ID 1135

Vi vill att du tittar närmare på systemhändelseloggarna på alla noder i klustret. Granska händelse-ID 1135 som du ser på noderna och kopiera alla instanser av den här händelsen. Detta gör det bekvämt för dig att titta på dem och granska.

Event ID 1135
Cluster node ' **NODE A** ' was removed from the active failover cluster membership. The Cluster service on this node may have stopped. 
This could also be due to the node having lost communication with other active nodes in the failover cluster. 
Run the Validate a Configuration wizard to check your network configuration. 
If the condition persists, check for hardware or software errors related to the network adapters on this node. 
Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.

Det finns tre vanliga scenarier:

Scenario A

Du tittar på alla händelser och alla noder i klustret anger att NOD A hade förlorat kommunikationen.

Diagram som visar hur Nod A, Nod B och Nod C kommunicerar korrekt.

Diagram som visar att Nod A har förlorat kommunikationen med Nod B och Nod C.

Det kan vara möjligt att när du ser systemloggarna på NOD A har den händelser för alla återstående noder i klustret.

Lösning

Detta tyder helt på att vid tidpunkten för problemet, antingen på grund av nätverksbelastning eller på annat sätt kommunikationen till NOD A gick förlorad.

Du bör granska och verifiera problem med nätverkskonfiguration och kommunikation. Kom ihåg att leta efter problem som rör Nod A.

Scenario B

Du tittar på händelserna på noderna och låter oss säga att klustret är utspridt på två platser. NOD A, NOD B och NOD C på plats 1 och NOD D och NOD E på plats 2.

Diagram som visar att Site 1 kommunicerar med plats 2 via en WAN-länk.

På noderna A, B och C ser du att de händelser som loggas är för anslutning till Noder D & E. På samma sätt, när du ser händelserna på Nodes D & E, tyder händelserna på att vi förlorade kommunikationen med A, B och C.

Diagram som visar att Plats 1 har förlorat WAN Link-anslutningen till Plats 2.

Lösning

Om du ser liknande aktivitet är det ett tecken på att det uppstod ett kommunikationsfel via länken som ansluter dessa platser. Vi rekommenderar att du granskar anslutningen mellan platserna, om det är via en WAN-anslutning rekommenderar vi att du verifierar anslutningen med internetleverantören.

Scenario C

Du tittar på händelserna på noderna och du ser att namnen på noderna inte stämmer överens med något visst mönster. Låt oss säga att klustret är utspridt på två platser. NOD A, NOD B och NOD C på plats 1 och NOD D och NOD E på plats 2.

  • På nod A: Du ser händelser för noder B, D, E.
  • På Nod B: Du ser händelser för Noder C, D, E.
  • På Nod C: Du ser händelser för Noder A, B, E.
  • På Nod D: Du ser händelser för Noder A, C, E.
  • På Nod E: Du ser händelser för Noder B, C, D.
  • Eller andra kombinationer.

Diagram över scenario C som visar att klustret är utspridt på två platser.

Lösning

Sådana händelser är möjliga när nätverkskanalerna mellan noderna kvävs och klusterkommunikationsmeddelandena inte når i tid, vilket gör att klustret känner att kommunikationen mellan noderna går förlorad, vilket resulterar i att noderna tas bort från klustermedlemskapet.

Granska klusternätverk

Vi rekommenderar att du granskar dina klusternätverk genom att kontrollera följande tre alternativ en i taget för att fortsätta med den här felsökningsguiden.

Sök efter antivirusundantag

Undanta följande filsystemplatser från virusgenomsökning på en server som kör Klustertjänster:

  • Sökvägen till FileShare-vittnet
  • Mappen %Systemroot%\Cluster

Konfigurera komponenten för realtidsgenomsökning i antivirusprogrammet så att följande kataloger och filer undantas:

  • Standardkonfigurationskatalog för virtuella datorer (C:\ProgramData\Microsoft\Windows\Hyper-V)

  • Konfigurationskataloger för anpassade virtuella datorer

  • Standardkatalog för virtuell hårddiskenhet (C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks)

  • Anpassade kataloger för virtuella hårddiskenheter

  • Anpassade replikeringsdatakataloger om du använder Hyper-V-replikering

  • Kataloger för ögonblicksbilder

  • mms.exe

    Kommentar

    Den här filen kan behöva konfigureras som ett processundantag i antivirusprogrammet.

  • Vmwp.exe

    Kommentar

    Den här filen kan behöva konfigureras som ett processundantag i antivirusprogrammet.

När du använder direktmigrering tillsammans med klusterdelade volymer undantar du dessutom CSV-sökvägen C:\Clusterstorage och alla dess underkataloger. Om du felsöker redundansproblem eller allmänna problem med klustertjänster och antivirusprogram installeras, avinstallerar du antivirusprogrammet tillfälligt eller kontrollerar med tillverkaren av programvaran om antivirusprogrammet fungerar med klustertjänster. Att bara inaktivera antivirusprogrammet är i de flesta fall otillräckligt. Även om du inaktiverar antivirusprogrammet läses filterdrivrutinen fortfarande in när du startar om datorn.

Sök efter nätverksportkonfiguration i brandväggen

Klustertjänsten styr serverklusteråtgärder och hanterar klusterdatabasen. Ett kluster är en samling oberoende datorer som fungerar som en enda dator. Chefer, programmerare och användare ser klustret som ett enda system. Programvaran distribuerar data mellan noder i klustret. Om en nod misslyckas tillhandahåller andra noder de tjänster och data som tidigare tillhandahållits av noden som saknas. När en nod läggs till eller repareras migrerar klusterprogramvaran vissa data till den noden.

Systemtjänstnamn: ClusSvc

Program Protokoll Hamnar
Klustertjänst UDP 3343
Klustertjänst TCP 3343 (Den här porten krävs under en nodkopplingsåtgärd.)
RPC TCP 135
Klusteradministratör UDP 137
Kerberos UDP/TCP 464*
SMB TCP 445
Slumpmässigt allokerade höga UDP-portar** UDP Slumpmässigt portnummer mellan 1024 och 65535
Slumpmässigt portnummer mellan 49152 och 65535***

Kommentar

För lyckad validering i Windows-redundanskluster på Windows Server 2008 och senare kan du dessutom tillåta inkommande och utgående trafik för ICMP4, ICMP6.

Det här är intervallet i Windows Server 2012, Windows 8, Windows Server 2008 R2, Windows 7, Windows Server 2008 och Windows Vista.

Kör dessutom följande kommando för att söka efter nätverksportkonfiguration i brandväggen. Exempel: Det här kommandot hjälper dig att fastställa port 3343 tillgänglig\öppna som används för redundanskluster:

netsh advfirewall firewall show rule name="Failover Clusters (UDP-In)" verbose

Kör klusterverifieringsrapporten för eventuella fel eller varningar

Klusterverifieringsverktyget kör en uppsättning tester för att kontrollera att maskinvaran och inställningarna är kompatibla med redundanskluster.

Följ dessa anvisningar:

  1. Kör klusterverifieringsrapporten för eventuella fel eller varningar. Mer information finns i Förstå klusterverifieringstester: Nätverk

    Skärmbild av resultatet när du har kört klusterverifieringsrapporten för eventuella fel eller varningar.

  2. Kontrollera om det finns varningar och fel för nätverk. Mer information finns i Förstå klusterverifieringstester: Nätverk.

    Skärmbild av resultat efter kategori.

    Skärmbild av Verifiera Windows-brandväggskonfiguration under Nätverk.

Kontrollera listan nätverksbindningsordning

Det här testet visar i vilken ordning nätverken är bundna till korten på varje nod.

Fliken Kort och bindningar visar anslutningarna i den ordning anslutningarna nås av nätverkstjänster. Ordningen på dessa anslutningar återspeglar i vilken ordning allmänna TCP/IP-anrop/paket skickas vidare till kabeln.

Följ stegen nedan för att ändra bindningsordningen för nätverkskort:

  1. Välj Start, välj Kör, skriv ncpa.cpl och välj sedan OK. Du kan se tillgängliga anslutningar i avsnittet LAN och Höghastighetsinternet i fönstret Nätverksanslutningar .
  2. På menyn Avancerat väljer du Avancerade inställningar och sedan fliken Kort och bindningar .
  3. I området Anslutningar väljer du den anslutning som du vill flytta högre upp i listan. Använd pilknapparna för att flytta anslutningen. Som en allmän regel bör kortet som pratar med nätverket (domänanslutning, routning till andra nätverk osv. vara det första kortet som är bundet (överst i listan).

Klusternoder är system med flera hem. Nätverksprioritet påverkar DNS-klienten för utgående nätverksanslutning. Nätverkskort som används för klientkommunikation bör vara högst upp i bindningsordningen. Icke-dirigerade nätverk kan placeras med lägre prioritet. I Windows Server 2012 och Windows Server 2012 R2 placeras nätverkskortet klusternätverksdrivrutin (NETFT.SYS) automatiskt längst ned i listan över bindningsordningar.

Kontrollera verifiera nätverkskommunikation

Svarstid i nätverket kan också orsaka detta. Paketen kanske inte går förlorade mellan noderna, men de kanske inte kommer till noderna tillräckligt snabbt innan tidsgränsen går ut.

Det här testet verifierar att testade servrar kan kommunicera med acceptabel svarstid i alla nätverk.

Till exempel: Under Verifiera nätverkskommunikation kan du se följande meddelanden för problem med nätverksfördröjning:

Succeeded in pinging network interface node003.contoso.com IP Address 192.168.0.2 from network interface node004.contoso.com IP Address 192.168.0.3 with maximum delay 500 after 1 attempt(s).
Either address 10.0.0.96 is not reachable from 192.168.0.2 or **the ping latency is greater than the maximum allowed 2000 ms** 
This may be expected, since network interfaces node003.contoso.com - Heartbeat Network and node004.contoso.com - Production Network are on different cluster networks
Either address 192.168.0.2 is not reachable from 10.0.0.96 or **the ping latency is greater than the maximum allowed 2000 ms** 
This may be expected, since network interfaces node004.contoso.com - Production Network and node003.contoso.com - Heartbeat Network for MSCS are on different cluster networks

För kluster med flera platser kan du öka tidsgränsvärdena. Mer information finns i Konfigurera pulsslag och DNS-inställningar i ett redundanskluster för flera platser.

Kontakta Internetleverantören om det finns wan-anslutningsproblem.

Kontrollera om du stöter på något av följande problem.

Förlorade nätverkspaket mellan noder
  1. Kontrollera paketförlust med prestanda

    Om paketet går förlorat på tråden någonstans mellan noderna misslyckas pulsslagen. Vi kan enkelt ta reda på om det här är ett problem genom att använda Prestandaövervakaren för att titta på räknaren "Nätverksgränssnitt\Mottagna paket". När du har lagt till den här räknaren tittar du på talen Genomsnitt, Minimum och Maximum och om de är något värde som är högre än noll måste mottagarbufferten justeras för adaptern.

    Skärmbild av fönstret Lägg till räknare.

    Om du har förlorat nätverkspaket på VMware virtualiseringsplattform kan du läsa avsnittet "Kluster installerat i VMware virtualiseringsplattform".

  2. Uppgradera NIC-drivrutinerna

    Det här problemet kan inträffa på grund av inaktuella NIC-drivrutiner\Integreringskomponenter (IC)\VmTools eller felaktiga nätverkskort. Om det går förlorade nätverkspaket mellan noder på fysiska datorer ska du ha uppdateringar av nätverkskortets drivrutin. Gamla eller inaktuella drivrutiner för nätverkskort och/eller inbyggd programvara. Ibland kan en enkel felkonfiguration av nätverkskortet eller växeln också orsaka förlust av pulsslag.

Kluster installerat på VMware-virtualiseringsplattformen

Kontrollera problem med VMware-adaptern i händelse av VMware-miljö.

Det här problemet kan inträffa om paketen tas bort vid höga trafiktoppar. Kontrollera att det inte sker någon trafikfiltrering (till exempel med ett e-postfilter). När du har eliminerat den här möjligheten ökar du gradvis antalet buffertar i gästoperativsystemet och verifierar.

Följ dessa steg för att minska antalet trafiktoppar:

  1. Välj Start, välj Kör, skriv devmgmt.msc och tryck på Retur.
  2. Expandera Nätverkskort, högerklicka på vmxnet3 och välj Egenskaper.
  3. Välj fliken Avancerat.
  4. Välj Små Rx-buffertar och öka värdet. Standardvärdet är 512 och maxvärdet är 8192.
  5. Välj Rx Ring #1 Storlek och öka värdet. Standardvärdet är 1024 och maxvärdet är 4 096.

Kontrollera följande artiklar för att kontrollera problem med VMware-adaptern i händelse av VMware-miljö:

Observera eventuella nätverksbelastningar

Nätverksbelastning kan också orsaka problem med nätverksanslutningen.

Kontrollera att nätverket har konfigurerats enligt ms- och leverantörsrekommendationerna. Se Konfigurera klusternätverk för Windows-redundanskluster.

Kontrollera nätverkskonfigurationen

Om det fortfarande inte fungerar kontrollerar du om du har sett partitionerat nätverk i klustrets GUI eller om NIC-teamindelning är aktiverat på pulsslagskortet.

Om du ser partitionerat nätverk i klustrets GUI kan du läsa "Partitionerade" klusternätverk för att felsöka problemet.

Om du har aktiverat NIC-teamindelning på pulsslagskortet kontrollerar du teamindelningens programvarufunktioner enligt rekommendationen från teamleverantören.

Uppgradera NIC-drivrutinerna

Det här problemet kan inträffa på grund av inaktuella NIC-drivrutiner eller felaktiga nätverkskort.

Om det går förlorade nätverkspaket mellan noder på fysiska datorer ska du ha uppdateringar av nätverkskortets drivrutin. Gamla eller inaktuella drivrutiner för nätverkskort och/eller inbyggd programvara.

Ibland kan en enkel felkonfiguration av nätverkskortet eller växeln också orsaka förlust av pulsslag.

Kontrollera nätverkskonfigurationen

Om det fortfarande inte fungerar kontrollerar du om du har sett partitionerat nätverk i klustrets GUI eller om NIC-teamindelning är aktiverat på pulsslagskortet.