Felsöka klusterproblem med händelse-ID 1135
Den här artikeln hjälper dig att diagnostisera och lösa händelse-ID 1135, som kan loggas när klustertjänsten startas i redundansklustringsmiljön.
Gäller för: Windows Server 2022, Windows Server 2019, Windows Server 2016, Azure Stack HCI, version 21H2 och 20H2
Prova vår virtuella agent – Det kan hjälpa dig att snabbt identifiera och åtgärda vanliga Active Directory-replikeringsproblem.
Startsida
Händelse-ID 1135 anger att en eller flera klusternoder har tagits bort från det aktiva redundansklustermedlemskapet. Det kan åtföljas av följande symtom:
Klusterredundans\noder som tas bort från aktivt redundansklustermedlemskap:
Problem med att noder tas bort från aktivt redundansklustermedlemskap
Händelse-ID 1069:
Händelse-ID 1069 – Klusterbaserad tjänst eller programtillgänglighet
Händelse-ID 1177 för kvorumförlust:
Händelse-ID 1006 för klustertjänsten har stoppats:
En validering och nätverkstesterna rekommenderas som ett av de första felsökningsstegen för att säkerställa att det inte finns några konfigurationsproblem som kan orsaka problem.
Kontrollera om de rekommenderade snabbkorrigeringarna har installerats
Klustertjänsten är den viktigaste programvarukomponenten som styr alla aspekter av redundansklusteråtgärden och hanterar klusterkonfigurationsdatabasen. Om du ser händelse-ID 1135 rekommenderar vi att du installerar korrigeringarna som nämns i följande artiklar och startar om alla noder i klustret och sedan observerar om problemet återkommer.
- Rekommenderade snabbkorrigeringar och uppdateringar för Windows Server 2012 R2-baserade redundanskluster
- Rekommenderade snabbkorrigeringar och uppdateringar för Windows Server 2012-baserade redundanskluster
- Rekommenderade snabbkorrigeringar och uppdateringar för Windows Server 2008 R2 SP1-redundanskluster
Kontrollera om klustertjänsten körs på alla noder
Följ följande kommando enligt windows-åtgärdssystemet för att verifiera att klustertjänsten körs kontinuerligt och är tillgänglig.
För Windows Server 2008 R2-kluster
Kör från en upphöjd kommandotolk cluster.exe node /stat
.
För Windows Server 2012- och Windows Server 2012 R2-kluster
Kör följande PowerShell-cmdlet: Get-ClusterResource
Körs klustertjänsten kontinuerligt och är tillgänglig på alla noder?
Flera scenarier med händelse-ID 1135
Vi vill att du tittar närmare på systemhändelseloggarna på alla noder i klustret. Granska händelse-ID 1135 som du ser på noderna och kopiera alla instanser av den här händelsen. Detta gör det bekvämt för dig att titta på dem och granska.
Event ID 1135
Cluster node ' **NODE A** ' was removed from the active failover cluster membership. The Cluster service on this node may have stopped.
This could also be due to the node having lost communication with other active nodes in the failover cluster.
Run the Validate a Configuration wizard to check your network configuration.
If the condition persists, check for hardware or software errors related to the network adapters on this node.
Also check for failures in any other network components to which the node is connected such as hubs, switches, or bridges.
Det finns tre vanliga scenarier:
Scenario A
Du tittar på alla händelser och alla noder i klustret anger att NOD A hade förlorat kommunikationen.
Det kan vara möjligt att när du ser systemloggarna på NOD A har den händelser för alla återstående noder i klustret.
Lösning
Detta tyder helt på att vid tidpunkten för problemet, antingen på grund av nätverksbelastning eller på annat sätt kommunikationen till NOD A gick förlorad.
Du bör granska och verifiera problem med nätverkskonfiguration och kommunikation. Kom ihåg att leta efter problem som rör Nod A.
Scenario B
Du tittar på händelserna på noderna och låter oss säga att klustret är utspridt på två platser. NOD A, NOD B och NOD C på plats 1 och NOD D och NOD E på plats 2.
På noderna A, B och C ser du att de händelser som loggas är för anslutning till Noder D & E. På samma sätt, när du ser händelserna på Nodes D & E, tyder händelserna på att vi förlorade kommunikationen med A, B och C.
Lösning
Om du ser liknande aktivitet är det ett tecken på att det uppstod ett kommunikationsfel via länken som ansluter dessa platser. Vi rekommenderar att du granskar anslutningen mellan platserna, om det är via en WAN-anslutning rekommenderar vi att du verifierar anslutningen med internetleverantören.
Scenario C
Du tittar på händelserna på noderna och du ser att namnen på noderna inte stämmer överens med något visst mönster. Låt oss säga att klustret är utspridt på två platser. NOD A, NOD B och NOD C på plats 1 och NOD D och NOD E på plats 2.
- På nod A: Du ser händelser för noder B, D, E.
- På Nod B: Du ser händelser för Noder C, D, E.
- På Nod C: Du ser händelser för Noder A, B, E.
- På Nod D: Du ser händelser för Noder A, C, E.
- På Nod E: Du ser händelser för Noder B, C, D.
- Eller andra kombinationer.
Lösning
Sådana händelser är möjliga när nätverkskanalerna mellan noderna kvävs och klusterkommunikationsmeddelandena inte når i tid, vilket gör att klustret känner att kommunikationen mellan noderna går förlorad, vilket resulterar i att noderna tas bort från klustermedlemskapet.
Granska klusternätverk
Vi rekommenderar att du granskar dina klusternätverk genom att kontrollera följande tre alternativ en i taget för att fortsätta med den här felsökningsguiden.
Sök efter antivirusundantag
Undanta följande filsystemplatser från virusgenomsökning på en server som kör Klustertjänster:
- Sökvägen till FileShare-vittnet
- Mappen %Systemroot%\Cluster
Konfigurera komponenten för realtidsgenomsökning i antivirusprogrammet så att följande kataloger och filer undantas:
Standardkonfigurationskatalog för virtuella datorer (C:\ProgramData\Microsoft\Windows\Hyper-V)
Konfigurationskataloger för anpassade virtuella datorer
Standardkatalog för virtuell hårddiskenhet (C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks)
Anpassade kataloger för virtuella hårddiskenheter
Anpassade replikeringsdatakataloger om du använder Hyper-V-replikering
Kataloger för ögonblicksbilder
mms.exe
Kommentar
Den här filen kan behöva konfigureras som ett processundantag i antivirusprogrammet.
Vmwp.exe
Kommentar
Den här filen kan behöva konfigureras som ett processundantag i antivirusprogrammet.
När du använder direktmigrering tillsammans med klusterdelade volymer undantar du dessutom CSV-sökvägen C:\Clusterstorage och alla dess underkataloger. Om du felsöker redundansproblem eller allmänna problem med klustertjänster och antivirusprogram installeras, avinstallerar du antivirusprogrammet tillfälligt eller kontrollerar med tillverkaren av programvaran om antivirusprogrammet fungerar med klustertjänster. Att bara inaktivera antivirusprogrammet är i de flesta fall otillräckligt. Även om du inaktiverar antivirusprogrammet läses filterdrivrutinen fortfarande in när du startar om datorn.
Sök efter nätverksportkonfiguration i brandväggen
Klustertjänsten styr serverklusteråtgärder och hanterar klusterdatabasen. Ett kluster är en samling oberoende datorer som fungerar som en enda dator. Chefer, programmerare och användare ser klustret som ett enda system. Programvaran distribuerar data mellan noder i klustret. Om en nod misslyckas tillhandahåller andra noder de tjänster och data som tidigare tillhandahållits av noden som saknas. När en nod läggs till eller repareras migrerar klusterprogramvaran vissa data till den noden.
Systemtjänstnamn: ClusSvc
Program | Protokoll | Hamnar |
---|---|---|
Klustertjänst | UDP | 3343 |
Klustertjänst | TCP | 3343 (Den här porten krävs under en nodkopplingsåtgärd.) |
RPC | TCP | 135 |
Klusteradministratör | UDP | 137 |
Kerberos | UDP/TCP | 464* |
SMB | TCP | 445 |
Slumpmässigt allokerade höga UDP-portar** | UDP | Slumpmässigt portnummer mellan 1024 och 65535 Slumpmässigt portnummer mellan 49152 och 65535*** |
Kommentar
För lyckad validering i Windows-redundanskluster på Windows Server 2008 och senare kan du dessutom tillåta inkommande och utgående trafik för ICMP4, ICMP6.
- Mer information finns i Skapa ett Windows Server 2012-redundanskluster misslyckas med fel 0xc000005e.
- Mer information om hur du anpassar dessa portar finns i avsnittet "Referenser" i Tjänstöversikt och nätverksportkrav för Windows.
Det här är intervallet i Windows Server 2012, Windows 8, Windows Server 2008 R2, Windows 7, Windows Server 2008 och Windows Vista.
Kör dessutom följande kommando för att söka efter nätverksportkonfiguration i brandväggen. Exempel: Det här kommandot hjälper dig att fastställa port 3343 tillgänglig\öppna som används för redundanskluster:
netsh advfirewall firewall show rule name="Failover Clusters (UDP-In)" verbose
Kör klusterverifieringsrapporten för eventuella fel eller varningar
Klusterverifieringsverktyget kör en uppsättning tester för att kontrollera att maskinvaran och inställningarna är kompatibla med redundanskluster.
Följ dessa anvisningar:
Kör klusterverifieringsrapporten för eventuella fel eller varningar. Mer information finns i Förstå klusterverifieringstester: Nätverk
Kontrollera om det finns varningar och fel för nätverk. Mer information finns i Förstå klusterverifieringstester: Nätverk.
Kontrollera listan nätverksbindningsordning
Det här testet visar i vilken ordning nätverken är bundna till korten på varje nod.
Fliken Kort och bindningar visar anslutningarna i den ordning anslutningarna nås av nätverkstjänster. Ordningen på dessa anslutningar återspeglar i vilken ordning allmänna TCP/IP-anrop/paket skickas vidare till kabeln.
Följ stegen nedan för att ändra bindningsordningen för nätverkskort:
- Välj Start, välj Kör, skriv ncpa.cpl och välj sedan OK. Du kan se tillgängliga anslutningar i avsnittet LAN och Höghastighetsinternet i fönstret Nätverksanslutningar .
- På menyn Avancerat väljer du Avancerade inställningar och sedan fliken Kort och bindningar .
- I området Anslutningar väljer du den anslutning som du vill flytta högre upp i listan. Använd pilknapparna för att flytta anslutningen. Som en allmän regel bör kortet som pratar med nätverket (domänanslutning, routning till andra nätverk osv. vara det första kortet som är bundet (överst i listan).
Klusternoder är system med flera hem. Nätverksprioritet påverkar DNS-klienten för utgående nätverksanslutning. Nätverkskort som används för klientkommunikation bör vara högst upp i bindningsordningen. Icke-dirigerade nätverk kan placeras med lägre prioritet. I Windows Server 2012 och Windows Server 2012 R2 placeras nätverkskortet klusternätverksdrivrutin (NETFT.SYS) automatiskt längst ned i listan över bindningsordningar.
Kontrollera verifiera nätverkskommunikation
Svarstid i nätverket kan också orsaka detta. Paketen kanske inte går förlorade mellan noderna, men de kanske inte kommer till noderna tillräckligt snabbt innan tidsgränsen går ut.
Det här testet verifierar att testade servrar kan kommunicera med acceptabel svarstid i alla nätverk.
Till exempel: Under Verifiera nätverkskommunikation kan du se följande meddelanden för problem med nätverksfördröjning:
Succeeded in pinging network interface node003.contoso.com IP Address 192.168.0.2 from network interface node004.contoso.com IP Address 192.168.0.3 with maximum delay 500 after 1 attempt(s).
Either address 10.0.0.96 is not reachable from 192.168.0.2 or **the ping latency is greater than the maximum allowed 2000 ms**
This may be expected, since network interfaces node003.contoso.com - Heartbeat Network and node004.contoso.com - Production Network are on different cluster networks
Either address 192.168.0.2 is not reachable from 10.0.0.96 or **the ping latency is greater than the maximum allowed 2000 ms**
This may be expected, since network interfaces node004.contoso.com - Production Network and node003.contoso.com - Heartbeat Network for MSCS are on different cluster networks
För kluster med flera platser kan du öka tidsgränsvärdena. Mer information finns i Konfigurera pulsslag och DNS-inställningar i ett redundanskluster för flera platser.
Kontakta Internetleverantören om det finns wan-anslutningsproblem.
Kontrollera om du stöter på något av följande problem.
Förlorade nätverkspaket mellan noder
Kontrollera paketförlust med prestanda
Om paketet går förlorat på tråden någonstans mellan noderna misslyckas pulsslagen. Vi kan enkelt ta reda på om det här är ett problem genom att använda Prestandaövervakaren för att titta på räknaren "Nätverksgränssnitt\Mottagna paket". När du har lagt till den här räknaren tittar du på talen Genomsnitt, Minimum och Maximum och om de är något värde som är högre än noll måste mottagarbufferten justeras för adaptern.
Om du har förlorat nätverkspaket på VMware virtualiseringsplattform kan du läsa avsnittet "Kluster installerat i VMware virtualiseringsplattform".
Uppgradera NIC-drivrutinerna
Det här problemet kan inträffa på grund av inaktuella NIC-drivrutiner\Integreringskomponenter (IC)\VmTools eller felaktiga nätverkskort. Om det går förlorade nätverkspaket mellan noder på fysiska datorer ska du ha uppdateringar av nätverkskortets drivrutin. Gamla eller inaktuella drivrutiner för nätverkskort och/eller inbyggd programvara. Ibland kan en enkel felkonfiguration av nätverkskortet eller växeln också orsaka förlust av pulsslag.
Kluster installerat på VMware-virtualiseringsplattformen
Kontrollera problem med VMware-adaptern i händelse av VMware-miljö.
Det här problemet kan inträffa om paketen tas bort vid höga trafiktoppar. Kontrollera att det inte sker någon trafikfiltrering (till exempel med ett e-postfilter). När du har eliminerat den här möjligheten ökar du gradvis antalet buffertar i gästoperativsystemet och verifierar.
Följ dessa steg för att minska antalet trafiktoppar:
- Välj Start, välj Kör, skriv
devmgmt.msc
och tryck på Retur. - Expandera Nätverkskort, högerklicka på vmxnet3 och välj Egenskaper.
- Välj fliken Avancerat.
- Välj Små Rx-buffertar och öka värdet. Standardvärdet är 512 och maxvärdet är 8192.
- Välj Rx Ring #1 Storlek och öka värdet. Standardvärdet är 1024 och maxvärdet är 4 096.
Kontrollera följande artiklar för att kontrollera problem med VMware-adaptern i händelse av VMware-miljö:
- Noder som tas bort från redundansklustermedlemskap i VMware ESX?.
- Stor paketförlust på gästoperativsystemnivå på VMXNET3 vNIC i ESXi
Observera eventuella nätverksbelastningar
Nätverksbelastning kan också orsaka problem med nätverksanslutningen.
Kontrollera att nätverket har konfigurerats enligt ms- och leverantörsrekommendationerna. Se Konfigurera klusternätverk för Windows-redundanskluster.
Kontrollera nätverkskonfigurationen
Om det fortfarande inte fungerar kontrollerar du om du har sett partitionerat nätverk i klustrets GUI eller om NIC-teamindelning är aktiverat på pulsslagskortet.
Om du ser partitionerat nätverk i klustrets GUI kan du läsa "Partitionerade" klusternätverk för att felsöka problemet.
Om du har aktiverat NIC-teamindelning på pulsslagskortet kontrollerar du teamindelningens programvarufunktioner enligt rekommendationen från teamleverantören.
Uppgradera NIC-drivrutinerna
Det här problemet kan inträffa på grund av inaktuella NIC-drivrutiner eller felaktiga nätverkskort.
Om det går förlorade nätverkspaket mellan noder på fysiska datorer ska du ha uppdateringar av nätverkskortets drivrutin. Gamla eller inaktuella drivrutiner för nätverkskort och/eller inbyggd programvara.
Ibland kan en enkel felkonfiguration av nätverkskortet eller växeln också orsaka förlust av pulsslag.
Kontrollera nätverkskonfigurationen
Om det fortfarande inte fungerar kontrollerar du om du har sett partitionerat nätverk i klustrets GUI eller om NIC-teamindelning är aktiverat på pulsslagskortet.