Dela via


Visa fel i hälsotjänsten

Gäller för: Azure Local 2311.2 och senare; Windows Server 2022, Windows Server 2019

Hälsotjänsten övervakar ständigt ditt Storage Spaces Direct-kluster för att identifiera problem och generera "fel". En cmdlet visar aktuella fel, så att du enkelt kan verifiera distributionens hälsa utan att titta på varje entitet eller funktion i tur och ordning. Fel är utformade till att vara exakta, lätta att förstå och kunna åtgärdas.

Varje fel innehåller fem viktiga fält:

  • Allvarlighet
  • Beskrivning av problemet
  • Rekommenderade nästa steg för att lösa problemet
  • Identifieringsinformation för felaktig entitet
  • Dess fysiska plats (om tillämpligt)

Här är till exempel ett vanligt fel:

Severity: MINOR
Reason: Connectivity has been lost to the physical disk.
Recommendation: Check that the physical disk is working and properly connected.
Part: Manufacturer Contoso, Model XYZ9000, Serial 123456789
Location: Seattle DC, Rack B07, Node 4, Slot 11

Anteckning

Den fysiska platsen härleds från konfigurationen för feldomänen. Mer information om feldomäner finns i Feldomänmedvetenhet. Om du inte anger den här informationen är platsfältet mindre användbart. Den kanske till exempel bara visar facknumret.

Orsaksanalys

Hälsotjänst kan utvärdera det potentiella orsakssambandet mellan felande entiteter för att identifiera och kombinera fel som är följder av samma underliggande problem. Genom att känna igen kedjor av effekter, blir rapporteringen mindre pratig. Om en server till exempel är nere förväntas alla enheter på servern också vara utan anslutning. Därför genereras bara ett fel för rotorsaken – i det här fallet servern.

Användning i PowerShell

Kör följande cmdlet för att se eventuella aktuella fel i PowerShell:

Get-HealthFault

Detta returnerar eventuella fel som påverkar det övergripande Lagringsutrymmen Direct-klustret. De här felen gäller oftast maskinvara eller konfiguration. Om det inte finns några fel returnerar cmdleten ingenting.

Kommentar

I en icke-produktionsmiljö och på egen risk kan du experimentera med den här funktionen genom att utlösa fel själv. Du kan till exempel göra detta genom att ta bort en fysisk disk eller stänga av en nod. När felet visas sätter du in den fysiska disken igen eller startar om noden så att felet försvinner.

Användning i .NET och C#

Det här avsnittet visar hur du ansluter till Hälsotjänst, använder identifieringsobjekt och kör felfrågor.

Anslut

För att göra förfrågningar mot Hälsotjänsten upprättar du en CimSession med klustret. För att göra det behöver du vissa saker som bara är tillgängliga i fullständig Microsoft .NET, vilket innebär att du inte enkelt kan göra detta direkt från en webb- eller mobilapp. Kodexemplen i det här avsnittet använder C#, det enklaste valet för det här dataåtkomstskiktet.

using System.Security;
using Microsoft.Management.Infrastructure;

public CimSession Connect(string Domain = "...", string Computer = "...", string Username = "...", string Password = "...")
{
    SecureString PasswordSecureString = new SecureString();
    foreach (char c in Password)
    {
        PasswordSecureString.AppendChar(c);
    }

    CimCredential Credentials = new CimCredential(
        PasswordAuthenticationMechanism.Default, Domain, Username, PasswordSecureString);
    WSManSessionOptions SessionOptions = new WSManSessionOptions();
    SessionOptions.AddDestinationCredentials(Credentials);
    Session = CimSession.Create(Computer, SessionOptions);
    return Session;
}

Det angivna användarnamnet ska vara en lokal administratör för måldatorn.

Vi rekommenderar att du skapar Lösenordet SecureString direkt från användarens indata i realtid, så att lösenordet aldrig lagras i minnet i klartext. Detta hjälper till att minska en mängd olika säkerhetsproblem. Men i praktiken är det vanligt att konstruera det som ovan i prototypsyfte.

Identifiera objekt

När CimSession har upprättats kan du köra frågor mot Windows Management Instrumentation (WMI) på klustret.

Innan du kan hämta fel eller mätvärden måste du hämta instanser av flera relevanta objekt. Hämta först MSFT_StorageSubSystem som representerar Storage Spaces Direct i klustret. Med det kan du få varje MSFT_StorageNode i klustret och varje MSFT_Volume av datavolymerna. Slutligen måste du hämta MSCluster_ClusterHealthService, hälsotjänsten själv.

CimInstance Cluster;
List<CimInstance> Nodes;
List<CimInstance> Volumes;
CimInstance HealthService;

public void DiscoverObjects(CimSession Session)
{
    // Get MSFT_StorageSubSystem for Storage Spaces Direct
    Cluster = Session.QueryInstances(@"root\microsoft\windows\storage", "WQL", "SELECT * FROM MSFT_StorageSubSystem")
        .First(Instance => (Instance.CimInstanceProperties["FriendlyName"].Value.ToString()).Contains("Cluster"));

    // Get MSFT_StorageNode for each cluster node
    Nodes = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToStorageNode", null, "StorageSubSystem", "StorageNode").ToList();

    // Get MSFT_Volumes for each data volume
    Volumes = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToVolume", null, "StorageSubSystem", "Volume").ToList();

    // Get MSFT_StorageHealth itself
    HealthService = Session.EnumerateAssociatedInstances(Cluster.CimSystemProperties.Namespace,
        Cluster, "MSFT_StorageSubSystemToStorageHealth", null, "StorageSubSystem", "StorageHealth").First();
}

Det här är samma objekt som du får i PowerShell med hjälp av cmdletar som Get-StorageSubSystem, Get-StorageNode och Get-Volume.

Du kan komma åt samma egenskaper som dokumenteras i API-klasser för lagringshantering.

using System.Diagnostics;

foreach (CimInstance Node in Nodes)
{
    // For illustration, write each node's Name to the console. You could also write State (up/down), or anything else!
    Debug.WriteLine("Discovered Node " + Node.CimInstanceProperties["Name"].Value.ToString());
}

Frågefel

Anropa Diagnose för att hämta eventuella aktuella fel som är kopplade till målet CimInstance, som kan vara antingen klustret eller valfri volym.

Den fullständiga listan över fel som är tillgängliga i varje omfång i Windows Server 2019 dokumenteras senare i avsnittet Täckning .

public void GetFaults(CimSession Session, CimInstance Target)
{
    // Set Parameters (None)
    CimMethodParametersCollection FaultsParams = new CimMethodParametersCollection();
    // Invoke API
    CimMethodResult Result = Session.InvokeMethod(Target, "Diagnose", FaultsParams);
    IEnumerable<CimInstance> DiagnoseResults = (IEnumerable<CimInstance>)Result.OutParameters["DiagnoseResults"].Value;
    // Unpack
    if (DiagnoseResults != null)
    {
        foreach (CimInstance DiagnoseResult in DiagnoseResults)
        {
            // TODO: Whatever you want!
        }
    }
}

Valfritt: MyFault-klass

Det kan vara meningsfullt att konstruera och bevara din egen representation av fel. Klassen MyFault lagrar till exempel flera viktiga egenskaper för fel, inklusive FaultId, som kan användas senare för att antingen associera uppdateringar, ta bort meddelanden eller deduplicera om samma fel upptäcks flera gånger.

public class MyFault {
    public String FaultId { get; set; }
    public String Reason { get; set; }
    public String Severity { get; set; }
    public String Description { get; set; }
    public String Location { get; set; }

    // Constructor
    public MyFault(CimInstance DiagnoseResult)
    {
        CimKeyedCollection<CimProperty> Properties = DiagnoseResult.CimInstanceProperties;
        FaultId     = Properties["FaultId"                  ].Value.ToString();
        Reason      = Properties["Reason"                   ].Value.ToString();
        Severity    = Properties["PerceivedSeverity"        ].Value.ToString();
        Description = Properties["FaultingObjectDescription"].Value.ToString();
        Location    = Properties["FaultingObjectLocation"   ].Value.ToString();
    }
}
List<MyFault> Faults = new List<MyFault>;

foreach (CimInstance DiagnoseResult in DiagnoseResults)
{
    Faults.Add(new Fault(DiagnoseResult));
}

Den fullständiga listan över egenskaper i varje fel (DiagnoseResult) dokumenteras senare i avsnittet Felegenskaper .

Felhändelser

När fel skapas, tas bort eller uppdateras genererar Hälsotjänst WMI-händelser. Dessa är viktiga för att hålla programtillståndet synkroniserat utan frekvent avsökning, och kan till exempel hjälpa dig med saker som att bestämma när e-postaviseringar ska skickas. För att prenumerera på dessa händelser använder följande exempelkod mönstret Observer Design.

Börja med att prenumerera på MSFT_StorageFaultEvent händelser.

public void ListenForFaultEvents()
{
    IObservable<CimSubscriptionResult> Events = Session.SubscribeAsync(
        @"root\microsoft\windows\storage", "WQL", "SELECT * FROM MSFT_StorageFaultEvent");
    // Subscribe the Observer
    FaultsObserver<CimSubscriptionResult> Observer = new FaultsObserver<CimSubscriptionResult>(this);
    IDisposable Disposeable = Events.Subscribe(Observer);
}

Implementera sedan en observatör vars OnNext() -metod anropas när en ny händelse genereras.

Varje händelse innehåller ChangeType som anger om ett fel skapas, tas bort eller uppdateras och relevant FaultId.

Dessutom innehåller varje händelse alla egenskaper för själva felet.

class FaultsObserver : IObserver
{
    public void OnNext(T Event)
    {
        // Cast
        CimSubscriptionResult SubscriptionResult = Event as CimSubscriptionResult;

        if (SubscriptionResult != null)
        {
            // Unpack
            CimKeyedCollection<CimProperty> Properties = SubscriptionResult.Instance.CimInstanceProperties;
            String ChangeType = Properties["ChangeType"].Value.ToString();
            String FaultId = Properties["FaultId"].Value.ToString();

            // Create
            if (ChangeType == "0")
            {
                Fault MyNewFault = new MyFault(SubscriptionResult.Instance);
                // TODO: Whatever you want!
            }
            // Remove
            if (ChangeType == "1")
            {
                // TODO: Use FaultId to find and delete whatever representation you have...
            }
            // Update
            if (ChangeType == "2")
            {
                // TODO: Use FaultId to find and modify whatever representation you have...
            }
        }
    }
    public void OnError(Exception e)
    {
        // Handle Exceptions
    }
    public void OnCompleted()
    {
        // Nothing
    }
}

Förstå fellivscykeln

Fel är inte avsedda att markeras som antingen "sedda" eller lösta av användaren. De skapas när Hälsotjänst upptäcker ett problem och de tas bort automatiskt först efter att Hälsotjänst inte längre kan observera problemet. I allmänhet återspeglar detta att problemet har åtgärdats.

I vissa fall kan dock fel återupptäckas av Hälsotjänst, till exempel efter en redundansväxling, tillfälliga anslutningar och så vidare. Av den anledningen kan det vara klokt att bevara din egen representation av fel, så att du enkelt kan deduplicera. Detta är särskilt viktigt om du skickar e-postaviseringar eller motsvarande.

Felegenskaper

I följande tabell visas flera viktiga egenskaper för felobjektet. För det fullständiga schemat kontrollerar du klassen MSFT_StorageDiagnoseResult i storagewmi.mof.

Property Exempel
FaultId {12345-12345-12345-12345-12345}
Feltyp Microsoft.Health.FaultType.Volume.Capacity
Anledning Volymen håller på att få slut på tillgängligt utrymme.
UpplevdAllvarlighetsgrad 5
BeskrivningAvFelandeObjekt Contoso XYZ9000 S.N. 123456789
FelandeObjektPlats Rack A06, RU 25, Slot 11
Rekommenderade åtgärder {"Expandera volymen.", "Migrera arbetsbelastningar till andra volymer."}

FaultId: Unikt ID inom omfånget för ett kluster.

PerceivedSeverity: PerceivedSeverity = { 4, 5, 6 } = { "Informativ", "Varning" och "Fel" }, eller motsvarande färger som blå, gul och röd.

FaultingObjectDescription: Delinformation för maskinvara, vanligtvis tom för programvaruobjekt.

FaultingObjectLocation: Platsinformation för maskinvara, vanligtvis tom för programvaruobjekt.

RecommendedActions: Lista över rekommenderade åtgärder som är oberoende och inte i någon särskild ordning. I dag är den här listan ofta av längd 1.

Egenskaper för felhändelse

I följande tabell visas flera viktiga egenskaper för felhändelsen. För det fullständiga schemat kontrollerar du klassen MSFT_StorageFaultEvent i storagewmi.mof.

Observera ChangeType som anger om ett fel skapas, tas bort eller uppdateras och FaultId. En händelse innehåller också alla egenskaper för det berörda felet.

Property Exempel
ChangeType 0
Fel-ID {12345-12345-12345-12345-12345}
Feltyp Microsoft.Health.FaultType.Volume.Capacity
Anledning "Volymen får slut på tillgängligt utrymme."
Uppfattad Allvarlighetsgrad 5
Beskrivning av felaktigt objekt Contoso XYZ9000 S.N. 123456789
Lokalisering av Felande Objekt Rack A06, RU 25, Fack 11
Rekommenderade åtgärder {"Expandera volymen.", "Migrera arbetsbelastningar till andra volymer."}

ChangeType ChangeType = { 0, 1, 2 } = { "Create", "Remove", "Update" }.

Täckning

I Windows Server 2019 och Azure Local tillhandahåller Hälsotjänst följande feltäckning:

PhysicalDisk (31)

FaultType: Microsoft.Health.Feltyp.FysisktDisk.MisslyckatMedia

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken misslyckades."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.Kommunikationsförlust

  • Allvarlighetsgrad: Varning
  • Orsak: "Anslutningen har förlorats till den fysiska disken."
  • RecommendedAction: "Kontrollera att den fysiska disken fungerar och är korrekt ansluten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.Unresponsive

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken uppvisar återkommande svarsfel."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.FysiskDisk.FörutsägbarFel

  • Allvarlighetsgrad: Varning
  • Orsak: "Ett fel på den fysiska disken förväntas inträffa snart."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnsupportedHardware

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken är i karantän eftersom den inte stöds av lösningsleverantören."
  • RecommendedAction: "Ersätt den fysiska disken med maskinvara som stöds."

FaultTyp: Microsoft.Health.FaultType.FysiskDisk.OsupportedFirmware

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken är i karantän eftersom dess version av den inbyggda programvaran inte stöds av lösningsleverantören."
  • RecommendedAction: "Uppdatera firmware på den fysiska disken till målversionen."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.UnrecognizedMetadata

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken har okända metadata."
  • RecommendedAction: "Den här disken kan innehålla data från en okänd lagringspool. Kontrollera först att det inte finns några användbara data på den här disken och återställ sedan disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.MisslyckadFirmwareUppdatering

  • Allvarlighetsgrad: Varning
  • Orsak: "Det gick inte att uppdatera den inbyggda programvaran på den fysiska disken."
  • RecommendedAction: "Prova att använda en annan binär programvara."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SblFailedMedia

  • Allvarlighetsgrad: Varning
  • Orsak: "Hårddisken misslyckades."
  • RecommendedAction: "Byt ut hårddisken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SblUnresponsive

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken uppvisar återkommande svarsfel."
  • RecommendedAction: "Ersätt den fysiska disken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureBadBlock

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten rapporterade felaktiga block under skrivningar. Ett tillfälligt dåligt block är normalt, men för många kan innebära att enheten fungerar felaktigt, skadas eller börjar sluta fungera."
  • RecommendedAction: "Om detta fortsätter att hända eller om du märker försämrad prestanda bör du överväga att ersätta hårddisken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureBadBlockRead

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten rapporterade felaktiga block vid läsning. Ett och annat dåligt block är normalt, men för många kan innebära att enheten krånglar, skadas eller börjar gå sönder."
  • RecommendedAction: "Om detta fortsätter att inträffa eller om du upplever minskad prestanda, överväg att ersätta hårddisken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureIoRetry

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten behövde flera försök att läsa eller skriva. Om detta fortsätter att hända kan det innebära att enheten fungerar dåligt, skadas eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du märker minskad prestanda, överväg att byta ut enheten."

Anteckning

Det här systemfelet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.MarginalFailure.EventBased.IoRetry.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureIoFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten kunde inte läsa eller skriva. Om detta fortsätter att hända kan det innebära att enheten fungerar dåligt, skadas eller börjar misslyckas."
  • RecommendedAction: "Om detta fortsätter att hända eller om du observerar lägre prestanda rekommenderas du att byta ut hårddisken."

Kommentar

Den här funktionen är inaktiverad som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.MarginalFailure.EventBased.IoFailure.Enabled till true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.FailureSmart

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten rapporterade följande potentiella problem till Windows med hjälp av SMART (självövervakning, analys och rapporteringsteknik)"
  • RecommendedAction: "Om detta fortsätter eller om du märker minskad prestanda bör du överväga att ersätta hårddisken."

Feltyp: Microsoft.Health.FaultType.FysiskDisk.FelHögSlitage

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har nått en hög procent av sin märkta skrivuthållighet. Enheten kan bli endast läsbar, vilket innebär att den inte kan utföra fler skrivningar, när den når 100 % av sin märkta uthållighet. Kontrollera databladet eller be tillverkaren om mer information om uthållighetsklassificering och beteende vid slutet av livslängden."
  • RecommendedAction: "Om detta fortsätter att inträffa eller om du märker sämre prestanda bör du överväga att ersätta disken."

Felkod: Microsoft.Health.FaultType.PhysicalDisk.FailureReadOnly

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten nådde 100 % av sin klassificerade skrivuthållighet och är nu skrivskyddad, vilket innebär att den inte kan utföra fler skrivningar. SSD-enheter slits ut efter ett visst antal skrivningar, vilket varierar beroende på enhetens uthållighetsklassificering. Mer information finns i enhetens specifikationer eller fråga tillverkaren om uthållighetsklassificering och beteende vid slutet av livscykeln."
  • RecommendedAction: "Om detta fortsätter att hända eller om du upplever lägre prestanda bör du överväga att byta ut enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.SlowestIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög toppfördröjning."
  • RecommendedAction: "Övervaka hårddiskens prestanda och överväg att byta ut hårddisken."

Anteckning

Det här felet är inaktiverat som standard. Om du vill aktivera det anger du hälsoinställningen System.Storage.PhysicalDisk.HighLatency.Threshold.Tail.Enabled till true

FaultType: Microsoft.Health.FaultType.FysiskDisk.HögLatens.MedelIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög genomsnittlig svarstid."
  • RecommendedAction: "Övervaka hårddiskens prestanda och överväg att ersätta enheten."

Kommentar

Det här felet är inaktiverat som standard. För att aktivera funktionen, ställ in hälsoinställningen System.Storage.PhysicalDisk.HighLatency.Threshold.Tail.Enabled på true

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighLatency.Outlier.AverageIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög genomsnittlig svarstid."
  • RecommendedAction: "Övervaka diskens prestanda och överväg att byta ut disken."

Feltyp: Microsoft.Health.Feltyp.FysiskDisk.HögLatens.Avvikare.LångsammasteIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har hög toppfördröjning."
  • RecommendedAction: "Övervaka enhetens prestanda och överväg att ersätta enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighErrorCount.AverageIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har ett stort antal fel."
  • RecommendedAction: "Övervaka hårddiskens prestanda och överväg att ersätta hårddisken."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.HighErrorCount.Outlier.AverageIO

  • Allvarlighetsgrad: Varning
  • Orsak: "Enheten har ett stort antal fel."
  • RecommendedAction: "Övervaka diskens prestanda och fundera på att byta ut disken."

FaultTyp: Microsoft.Health.FaultType.PhysicalDisk.CacheEndastLäsbar

  • Allvarlighetsgrad: Varning
  • Orsak: "Cacheenheten misslyckades med vissa läsningar eller skrivningar, så för att skydda dina data har vi flyttat dem till kapacitetsenheter."
  • RecommendedAction: "Ersätt enheten eller försök rensa och återställa den."

FaultType: Microsoft.Health.FaultType.FysiskDisk.CacheEndastLäsbar.Tömt

  • Allvarlighetsgrad: Varning
  • Orsak: "Cacheenheten misslyckades med vissa läsningar eller skrivningar. För att skydda dina data har vi slutat skriva till cacheenheten och vi försöker flytta dess data till kapacitetsenheter."
  • RecommendedAction: "Vänta medan vi flyttar data."

Faulttyp: Microsoft.Health.FaultType.FysiskDisk.CacheEndastLäsning.MisslyckadDränering

  • Allvarlighetsgrad: Varning
  • Orsak: "Vissa data på cacheenheten kan inte läsas, vilket hindrar oss från att flytta dem till kapacitetsenheter."
  • RecommendedAction: "Byt ut enheten."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.RotationFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Försöket att rotera SED-krypteringsnyckeln till den nya standardinställningen misslyckades."
  • RecommendedAction: "Kontrollera att enheten fungerar och är korrekt ansluten. Om enheten har misslyckats ersätter du den. Starta om SED-krypteringsnyckelrotationen när enheten är felfri."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.NotDefault

  • Allvarlighetsgrad: Varning
  • Orsak: "Den fysiska disken har en SED-krypteringsnyckel, men den matchar inte den aktuella standardnyckeln."
  • RecommendedAction: "Initiera SED-krypteringsnyckelrotation."

Feltyp: Microsoft.Health.FaultType.PhysicalDisk.SedEncKey.NotDefined

  • Allvarlighetsgrad: Varning
  • Orsak: "Det finns ingen definierad SED-standardkrypteringsnyckel för enheten."
  • RecommendedAction: "Ange en standardkrypteringsnyckel för SED."

FaultType: Microsoft.Health.FaultType.StorageScaleUnit.SedEncKey.RotationTimeout

  • Allvarlighetsgrad: Varning
  • Orsak: "Det gick inte att slutföra roteringen av SED-krypteringsnyckeln på servern före tidsgränsen"
  • RecommendedAction: "Kontrollera att servern kan nås och att alla fysiska diskar är felfria."

FaultType: Microsoft.Health.FaultType.PhysicalDisk.DriveArriveFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Fysiska diskar misslyckas med frågor. "
  • RecommendedAction: "Verifiera nätverkets tillförlitlighet. Om problemet kvarstår bör du överväga att ersätta enheten."

Virtuell disk (3)

Feltyp: Microsoft.Health.FaultType.VirtualDisks.NeedsRepair

  • Allvarlighetsgrad: Informativ
  • Orsak: "Vissa data på den här volymen är inte helt tillförlitliga. De är fortfarande tillgängliga."
  • RecommendedAction: "Återställande av dataresiliens."

FaultType: Microsoft.Health.FaultType.VirtualDisks.Detached

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Volymen är otillgänglig. Vissa data kan gå förlorade."
  • RecommendedAction: "Kontrollera den fysiska och/eller nätverksanslutningen för alla lagringsenheter. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.VirtualDisks.Ingen Redundans

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Alla kopior av data är inte tillgängliga för en region med virtuell disk. Arbetsbelastningen kan avbrytas och I/O-fel kan observeras."
  • RecommendedAction: "Om en underhållsåtgärd pågår pausar du den och återställer åtkomsten till all lagring tills lagringen stabiliseras."

Poolkapacitet (2)

FaultType: Microsoft.Health.FaultType.StoragePool.TransactionAndCleanupFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Lagringspoolen kan inte skriva till ett kvorum med metadataenheter. Arbetsbelastningen kan avbrytas och I/O-fel kan observeras."
  • RecommendedAction: "Om en underhållsåtgärd pågår pausar du den och återställer åtkomsten till all lagring tills lagringen stabiliseras."

FaultType: Microsoft.Health.FaultType.StoragePool.PoolCapacityThresholdExceeded

  • Allvarlighetsgrad: Varning
  • Orsak: "Lagringspoolen har slut på kapacitet."
  • RecommendedAction: "Lägg till ytterligare kapacitet i lagringspoolen eller frigör kapacitet."

Volymkapacitet (5)1

Feltyp: Microsoft.Health.Feltyp.Volym.Kapacitet

  • Allvarlighetsgrad: Varning
  • Orsak: "Volymen har slut på tillgängligt utrymme."
  • RecommendedAction: "Expandera volymen eller migrera arbetsbelastningar till andra volymer."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Correctable

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte en kontrollsiffra och kunde korrigera den."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte ett kontrollsummafel och kunde inte korrigera det."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultType: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable.DataRemoved

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte en skada på en fil eller mapp. Filen eller mappen har tagits bort från filsystemets namnområde."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

FaultTyp: Microsoft.Health.FaultType.Volume.FileSystem.Corruption.Uncorrectable.DataRemovalFailure

  • Allvarlighetsgrad: Varning
  • Orsak: "Filsystemet upptäckte en skada på en fil eller mapp. Filsystemet kan ha misslyckats med att ta bort det från filsystemets namnområde."
  • RecommendedAction: "Initiera dataintegritetssökning från schemaläggaren, lagringen kan gå dåligt. Om det pågår en uppdaterings- eller underhållsåtgärd stoppar du den omedelbart. Du kan behöva återställa från säkerhetskopian."

Server (12)

FaultType: Microsoft.Health.FaultType.Server.Down

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern kan inte nås."
  • RecommendedAction: "Starta eller ersätt server."

FaultType: Microsoft.Health.FaultType.Server.Isolated

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern är isolerad från klustret på grund av anslutningsproblem."
  • RecommendedAction: "Om isoleringen kvarstår kontrollerar du nätverken eller migrerar arbetsbelastningar till andra noder."

FaultType: Microsoft.Health.FaultType.Server.Quarantined

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern sätts i karantän av klustret på grund av återkommande fel."
  • RecommendedAction: "Ersätt servern eller åtgärda nätverket."

Feltyp: Microsoft.Health.FaultType.Server.Temperatur

  • Allvarlighetsgrad: Varning
  • Orsak: "Serverns temperatursensor har utlöst en varning."
  • RecommendedAction: "Kontrollera servertemperaturen."

FaultType: Microsoft.Health.FaultType.Server.Storage.Degraded

  • Allvarlighetsgrad: Varning
  • Orsak: "Servern har lagring som inte är fullständig eller uppdaterad, så vi måste synkronisera den med data från andra servrar i klustret. Detta är normalt när en server startas om eller en enhet misslyckas."
  • RecommendedAction: "Vänta medan vi synkroniserar lagringen. Ta inte bort några enheter eller starta inte om några servrar i klustret förrän vi har bekräftat att synkroniseringen är klar."

FaultType: Microsoft.Health.FaultType.Node.CPUOverloaded

  • Allvarlighetsgrad: Varning
  • Orsak: "Serverns CPU-användning är konsekvent över tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till andra servrar med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret (vanligtvis genom att lägga till servrar)."

FaultType: Microsoft.Health.FaultType.Node.VCPUToLCPU

  • Allvarlighetsgrad: Varning
  • Orsak: "Förhållandet mellan virtuella processorer och logiska processorer (trådar) på den här servern har överskridit det konfigurerade tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret."

FaultType: Microsoft.Health.FaultType.Node.LowFreeRam

  • Allvarlighetsgrad: Varning
  • Orsak: "Tillgängligt minne ligger under det konfigurerade tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till ytterligare beräkningskapacitet i klustret."

FaultType: Microsoft.Health.FaultType.Node.HighRootPartitionMemoryUsage

  • Allvarlighetsgrad: Varning
  • Orsak: "Windows Server förbrukar mycket fysiskt minne, vilket överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Sök efter processer eller appar som förbrukar för mycket minne, flytta virtuella datorer till andra servrar eller lägg till minne på servrarna."

FaultType: Microsoft.Health.FaultType.Node.FörHögCpuReservation

  • Allvarlighetsgrad: Varning
  • Orsak: "Den kombinerade CPU-reservationen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella maskiner eller minska deras CPU-reservationer."

FaultType: Microsoft.Health.FaultType.Node.TooHighMemoryUseAfterReclamation

  • Allvarlighetsgrad: Varning
  • Orsak: "Den kombinerade minnestilldelningen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras tilldelade minne."

FaultType: Microsoft.Health.FaultType.Node.SustainedHighCpuUsage

  • Allvarlighetsgrad: Varning
  • Orsak: "Servern har en processoranvändning som konsekvent överskrider tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till mer beräkningskapacitet."

Kluster (6)

FaultType: Microsoft.Health.FaultType.ClusterQuorumWitness.Error

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Klustret är ett serverfel ifrån att krascha."
  • RecommendedAction: "Kontrollera vittnesresursen och starta om efter behov. Starta eller ersätt misslyckade servrar."

FaultType: Microsoft.Health.FaultType.Cluster.ValidationReport.Failed

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Klusterverifiering har hittat problem."
  • RecommendedAction: "Klusterverifiering har hittat fel i vissa kategorier av tester. Se rapporten för klusterverifiering."

FaultType: Microsoft.Health.FaultType.Cluster.ValidationReportDcb.Failed

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Validate-DCB har hittat problem."
  • RecommendedAction: "Validate-DCB har hittat nätverksfel. Se DCB-valideringsrapport."

FaultType: Microsoft.Health.FaultType.Cluster.TooHighCpuReservation

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Den kombinerade CPU-reservationen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska deras CPU-reservationer."

Feltyp: Microsoft.Health.FaultType.Cluster.FörHögMinnesanvändningEfterÅterhämtning

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Den kombinerade minnestilldelningen för virtuella datorer på den här servern överskrider det konfigurerade tröskelvärdet."
  • RecommendedAction: "Överväg att flytta virtuella datorer eller minska det tilldelade minnet."

FaultType: Microsoft.Health.FaultType.Cluster.LångvarigHögCpuAnvändning

  • Allvarlighetsgrad: Kritisk
  • Orsak: "Servern har en processoranvändning som konsekvent överskrider tröskelvärdet."
  • RecommendedAction: "Flytta virtuella datorer till en annan server med lägre CPU-användning eller överväg att lägga till mer beräkningskapacitet."

Nätverkskort/gränssnitt (6)

Feltyp: Microsoft.Hälsa.Feltyp.Nätverkskort.Frånkopplad

  • Allvarlighetsgrad: Varning
  • Orsak: "Nätverksgränssnittet har kopplats från."
  • RecommendedAction: "Återanslut nätverkskabeln."

Feltyp: Microsoft.Health.FaultType.NetworkInterface.Saknas

  • Allvarlighetsgrad: Varning
  • Orsak: "Servern {server} saknar nätverkskort som är anslutna till klusternätverket {klusternätverk}."
  • RecommendedAction: "Anslut servern till det klusternätverk som saknas."

Feltyp: Microsoft.Health.FaultType.NetworkAdapter.Hardware

  • Allvarlighetsgrad: Varning
  • Orsak: "Nätverksgränssnittet har haft ett maskinvarufel."
  • RecommendedAction: "Ersätt nätverksadaptern."

FaultTyp: Microsoft.Health.FaultType.NetworkAdapter.Disabled

  • Allvarlighetsgrad: Varning
  • Orsak: "Nätverksgränssnittet {nätverksgränssnitt} är inte aktiverat och används inte."
  • RecommendedAction: "Aktivera nätverksgränssnittet."

FaultType: Microsoft.Health.FaultType.StorageSubsystem.RDMA.Alert

  • Allvarlighetsgrad: Varning
  • Orsak: "Klustret upptäckte problem med nätverksanslutningen som hindrar Lagringsutrymmen Direct från att fungera korrekt."
  • RecommendedAction: "Kontrollera att nätverket är korrekt konfigurerat och fungerar. Om du använder RDMA Over Converged Ethernet (RoCE) kontrollerar du att Data Center Bridging (DCB), Enhanced Transmission Service (ETS) och Priority Flow Control (PFC) har konfigurerats korrekt och konsekvent på varje klusternod och fysisk växel. Om du inte vet hur du gör detta ber du din leverantör eller någon du litar på att hjälpa dig."

FaultType: Microsoft.Health.FaultType.StorageSubsystem.RDMA.Disabled

  • Allvarlighetsgrad: Varning
  • Orsak: "Klustret upptäckte problem med nätverksanslutningen som hindrar Lagringsutrymmen Direct från att fungera korrekt. För att säkerställa konsekvent prestanda och datasäkerhet har Lagringsutrymmen Direct slutat använda fjärråtkomst till direkt minne (RDMA) även om RDMA-kompatibel maskinvara finns och är aktiverad. Lagringstrafiken fortsätter att flöda men med sämre prestanda med TCP/IP."
  • RecommendedAction: "Kontrollera att nätverket är korrekt konfigurerat och fungerar och aktivera sedan RDMA igen. Om du använder RDMA Over Converged Ethernet (RoCE) kontrollerar du att Data Center Bridging (DCB), Enhanced Transmission Service (ETS) och Priority Flow Control (PFC) har konfigurerats korrekt och konsekvent på varje klusternod och fysisk växel. Om du inte vet hur du gör detta kan du be din leverantör eller någon du litar på att hjälpa dig. Om du vill fortsätta med RDMA inaktiverat kan du stänga den här aviseringen."

Bilaga (6)

FaultType: Microsoft.Health.FaultType.StorageEnclosure.FörloradKommunikation

  • Allvarlighetsgrad: Varning
  • Orsak: "Kommunikationen har gått förlorad till lagringskabinettet."
  • RecommendedAction: "Starta eller ersätt lagringskabinettet."

Feltyp: Microsoft.Health.FaultType.StorageEnclosure.FanError

  • Allvarlighetsgrad: Varning
  • Orsak: "Fläkten på position {position} för lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt fläkten i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.CurrentSensorError

  • Allvarlighetsgrad: Varning
  • Orsak: "Den aktuella sensorn på position {position} i lagringskabinettet har misslyckats."
  • RecommendedAction: "Ersätt en aktuell sensor i lagringskabinettet."

Feltyp: Microsoft.Health.FaultType.StorageEnclosure.VoltageSensorError

  • Allvarlighetsgrad: Varning
  • Orsak: "Spänningssensorn vid position {position} i lagringskabinettet har misslyckats."
  • RecommendedAction: "Byt ut en spänningssensor i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.StorageEnclosure.IoControllerError

  • Allvarlighetsgrad: Varning
  • Orsak: "I/O-styrenheten på position {position} i lagringskabinettet misslyckades."
  • RecommendedAction: "Ersätt en I/O-styrenhet i lagringskabinettet."

FaultType: Microsoft.Health.FaultType.Lagingskapsling.Temperaturgivarproblem

  • Allvarlighetsgrad: Varning
  • Orsak: "Temperatursensorn vid position {position} i lagringskabinettet har misslyckats."
  • RecommendedAction: "Ersätt en temperatursensor i lagringskabinettet."

Utrullning av inbyggd programvara (3)

FaultType: Microsoft.Health.FaultType.FaultDomain.FailedMaintenanceMode

  • Allvarlighetsgrad: Varning
  • Orsak: "För närvarande kan vi inte göra några framsteg under firmwareutrullningen."
  • RecommendedAction: "Kontrollera att alla lagringsutrymmen är felfria och att ingen feldomän för närvarande är i underhållsläge."

FaultType: Microsoft.Health.FaultType.FaultDomain.FirmwareVerifyVersionFailed

  • Allvarlighetsgrad: Varning
  • Orsak: "Utrullning av inbyggd programvara avbröts på grund av oläsbar eller oväntad versionsinformation för inbyggd programvara efter att en uppdatering av den inbyggda programvaran har tillämpats."
  • RecommendedAction: "Starta om distributionen av den inbyggda programvaran när problemet har lösts."

FaultType: Microsoft.Health.FaultType.FaultDomain.För många misslyckade uppdateringar

  • Allvarlighetsgrad: Varning
  • Orsak: "Utrullningen av inbyggd programvara avbröts på grund av att för många fysiska diskar misslyckades med ett uppdateringsförsök för inbyggd programvara."
  • RecommendedAction: "Starta om utrullningen av den inbyggda programvaran när problemet har lösts."

QoS för lagring (3)2

FaultType: Microsoft.Health.FaultType.StorQos.OtillräckligGenomströmning

  • Allvarlighetsgrad: Varning
  • Orsak: "Lagringskapaciteten är otillräcklig för att tillgodose reserverna."
  • RecommendedAction: "Konfigurera om QoS-principer för lagring."

Feltyp: Microsoft.Health.FaultType.StorQos.LostCommunication

  • Allvarlighetsgrad: Varning
  • Orsak: "QoS-principhanteraren för lagring har förlorat kommunikationen med volymen."
  • RecommendedAction: "Var god och starta om noderna {noder}"

FaultType: Microsoft.Health.FaultType.StorQos.MisconfiguredFlow

  • Allvarlighetsgrad: Varning
  • Orsak: "En eller flera lagringskonsumenter (vanligtvis virtuella datorer) använder en icke-existerande policy med id {id}."
  • RecommendedAction: "Återskapa eventuella saknade QoS-principer för lagring."

VM/VHD (7)

FaultType: Microsoft.Health.FaultType.Vm.BadHealthState

  • Allvarlighetsgrad: Varning
  • Orsak: "Hälsotillståndet för den virtuella datorn är inte OK."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.FelaktigDriftstatus

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorns driftstatus är inte OK."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.GuestUnhealthy

  • Allvarlighetsgrad: Varning
  • Orsak: "Gästoperativsystemet på den virtuella datorn rapporterar ett feltillstånd."
  • RecommendedAction: "Felsöka den virtuella datorn."

FaultType: Microsoft.Health.FaultType.Vm.ConfigIsOffline

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorns konfigurationsresurs är offline, vilket innebär att den virtuella datorn inte kan administreras."
  • RecommendedAction: "Återställ den virtuella maskinkonfigurationen online."

FaultType: Microsoft.Health.FaultType.Vm.NotRespondingToControlCodes

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorn svarar inte på klusterkontrollkoder."
  • RecommendedAction: "Kontrollera tillståndet för den virtuella datorklusterresursen."

FaultType: Microsoft.Health.FaultType.Vm.IsNearMemoryLimit

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella datorn behöver mer av sitt konfigurerade maximala minne."
  • RecommendedAction: "Sök efter processer eller appar som förbrukar för mycket minne eller överväg att öka dess maximala minne."

FaultType: Microsoft.Health.FaultType.Vhd.IsNearlyFull

  • Allvarlighetsgrad: Varning
  • Orsak: "Den virtuella hårddisken har nått sin kapacitet. Inga fler data kan skrivas till den, vilket kan påverka de virtuella datorerna negativt."
  • RecommendedAction: "Ändra storlek på den virtuella hårddisken eller ta bort oönskade filer."

1 Anger att volymen har nått 80 % full (mindre allvarlighetsgrad) eller 90 % full (allvarlighetsgrad). 2 Anger att vissa .vhd-filer på volymen inte har uppfyllt sitt minimikrav på IOPS för mer än 10 % (lindrig), 30 % (allvarlig) eller 50 % (kritisk) av ett rullande 24-timmarsfönster.

Kommentar

Hälsotillståndet för komponenter i lagringshöljet, till exempel fläktar, strömförsörjning och sensorer, härleds från SCSI Enclosure Services (SES). Om leverantören inte ger den här informationen kan inte hälsotjänsten visa den.

Ytterligare referenser