Övervaka flera Azure Stack HCI-kluster med Insights

Artikel
03/09/2025

Gäller för: Azure Stack HCI, version 22H2

Viktigt!

Azure Stack HCI är nu en del av Azure Local. Äldre versioner av Azure Stack HCI, till exempel 22H2, fortsätter dock att referera till Azure Stack HCI och återspeglar inte namnändringen. Läs mer.

Den här artikeln beskriver hur du använder Insights för att övervaka flera Azure Stack HCI-kluster. För ett enda Azure Stack HCI-kluster, se Övervaka Azure Stack HCI med Insights.

Viktigt!

Om du registrerade ditt Azure Stack HCI-kluster och konfigurerade Insights före november 2023 kanske vissa funktioner som använder Azure Monitor Agent (AMA) som Arc for Servers, VM Insights, Defender för molnet eller Sentinel inte samlar in loggar och händelsedata korrekt. Felsökningsvägledning finns i avsnittet Felsöka kluster som registrerats före november 2023 .

Information om fördelar, förutsättningar och hur du aktiverar insikter i varje kluster finns i Fördelar, Förutsättningar och Aktivera insikter.

Titta på videon för en snabb introduktion:

Visa insikter om hälsa, prestanda och användning

Insikter lagrar sina data på en Log Analytics-arbetsyta, vilket gör att den kan leverera kraftfull aggregering och filtrering och analysera datatrender över tid. Det finns ingen direkt kostnad för Insights. Användare debiteras baserat på mängden data som matas in och inställningarna för datakvarhållning på log analytics-arbetsytan.

Du kan komma åt Insights från Azure Monitor > Insights Hub > Azure Stack HCI. Du ser följande flikar för att växla mellan vyer: Lägg till i övervakning, Klusterhälsa, Servrar, Virtuella datorer, Lagring.

Filtrera resultat

Visualiseringen kan filtreras mellan prenumerationer. Du kan filtrera resultatet baserat på följande nedrullningsbara menyer:

Tidsintervall: Med det här filtret kan du välja ett intervall för trendvyn. Standardvärdet är Senaste 24 timmarna.
Prenumerationer: Visar de prenumerationer som har registrerat Azure Stack HCI-kluster. Du kan välja flera prenumerationer i det här filtret.
HCI-kluster: Visar en lista över registrerade Azure Stack HCI-kluster som har loggar och övervakningsfunktioner aktiverade i det valda tidsintervallet. Du kan välja flera kluster från det här filtret.
Resursgrupper: Med det här filtret kan du välja alla kluster i en resursgrupp.

Lägg till i övervakning

Den här funktionen innehåller information om kluster som inte övervakas av användaren. Om du vill börja övervaka ett kluster väljer du det för att öppna klustret och väljer sedan Capabilities > Insights. Om du inte ser klustret kontrollerar du att det nyligen har anslutit till Azure.

Kolumn	beskrivning	Exempel
Kluster	Namnet på klustret.	27cls1
Azure-anslutningsstatus	Status för HCI-resursen.	Ansluten
OS-version	Operativsystemet bygger på servern.	10.0.20348.10131

Som standard visar rutnätsvyn de första 250 raderna. Du kan ange värdet genom att redigera rutnätsraderna enligt följande bild:

Du kan exportera informationen i Excel genom att välja Exportera till Excel enligt följande bild:

Excel tillhandahåller Azure-anslutningsstatus på följande sätt:

0: Inte registrerad
1: Frånkopplad
2: Inte nyligen
3: Ansluten

Klusterhälsa

Den här vyn ger en översikt över hälsotillståndet för kluster.

Kolumn	beskrivning	Exempel
Kluster	Namnet på klustret.	27cls1
Senast uppdaterad	Tidsstämpeln för när servern senast uppdaterades.	2022-04-09, 12:15:42
Status	Tillhandahåller hälsotillstånd för serverresurser i klustret. Det kan vara hälsosamt, varnings-, kritiskt eller annat.	Felfri
Felaktig resurs	Beskrivning av vilken resurs som orsakade felet.	Server, Lagringspool, Delssystem
Totalt antal servrar	Antalet servrar i ett kluster.	4

Om klustret saknas eller visar statusen Övrigt går du till Log Analytics-arbetsytan som används för klustret och kontrollerar att agentkonfigurationen samlar in data från loggen microsoft-windows-health/operational . Kontrollera också att klustren nyligen har anslutit till Azure och kontrollera att klustren inte filtreras bort i den här arbetsboken.

Server

Den här vyn ger en översikt över serverhälsa och prestanda samt användning av valda kluster. Den här vyn skapas med hjälp av serverhändelse-ID 3000 för Händelseloggkanalen Microsoft-Windows-SDDC-Management/Operational Windows. Varje rad kan utökas ytterligare för att se nodens hälsostatus. Du kan interagera med klustret och serverresursen för att gå till respektive resurssida.

Virtuella datorer

Den här vyn visar tillståndet för alla virtuella datorer i det valda klustret. Vyn skapas med händelse-ID 3003 för den virtuella datorn i händelseloggkanalen Microsoft-Windows-SDDC-Management/Operational Windows. Varje rad kan utökas ytterligare för att visa distributionen av virtuella datorer mellan servrar i klustret. Du kan interagera med klustret och nodresursen för att navigera till respektive resurssida.

Mätvärde	beskrivning	Exempel
Klusterserver >	Namnet på klustret. Vid expansion visar den servrarna i klustret.	Exempel-VM-1
Senast uppdaterad	Datetimestamp för när servern senast uppdaterades.	2022-04-09, 12:24:02
Totalt antal virtuella datorer	Antalet virtuella datorer i en servernod i ett kluster.	1 av 2 körs
Körs	Antalet virtuella datorer som körs i en servernod i ett kluster.	2
Stoppat	Antalet virtuella maskiner som stoppats på en servernod inom ett kluster.	3
Misslyckad	Antalet virtuella datorer som misslyckades på en servernod inom ett kluster.	2
Övrigt	Om den virtuella datorn är i något av följande tillstånd (Okänd, Startar, Tar ögonblicksbild, Sparar, Stoppar, Pausar, Återupptar, Pausad, Avstängd), betraktas den som "Other".	2

Storage

Den här vyn visar hälsotillståndet för volymer, användning och prestanda i övervakade kluster. Expandera ett kluster för att se tillståndet för enskilda volymer. Den här vyn skapas med hjälp av volymhändelse-ID 3002 i händelseloggkanalen Microsoft-Windows-SDDC-Management/Operational i Windows. Panelerna överst ger en översikt över lagringens hälsotillstånd.

Mätvärde	beskrivning	Exempel
Klustervolym >	Namnet på klustret. Vid expansion visar den volymerna i ett kluster.	AltaylCluster1 > ClusterPerformanceHistory
Senast uppdaterad	Datetimestamp för när lagringen senast uppdaterades.	2022-04-14, 14:58:55
Volymhälsa	Status för volymen. Det kan vara frisk, varningsläge, kritiskt eller annat.	Felfri
Storlek	Enhetens totala kapacitet i byte under rapporteringsperioden.	25B
Förbrukning	Procentandelen tillgänglig kapacitet under rapporteringsperioden.	23.54%
Iops	Indata-/utdataåtgärder per sekund.	45/s (sekunder per sekund)
Trend	IOPS-trenden.
Genomflöde	Antal byte per sekund som Application Gateway har betjänat.	5 B/s
Trend (B/s)	Genomströmningstrenden.
Genomsnittlig svarstid	Svarstid är den genomsnittliga tid det tar för I/O-begäran att slutföras.	334 μs

Anpassa insikter

Eftersom användarupplevelsen bygger på Azure Monitor-arbetsboksmallar kan användarna redigera visualiseringar och frågor och spara dem som en anpassad arbetsbok.

Om du använder visualiseringen från Azure Monitor > Insights Hub > Azure Stack HCI väljer du Anpassa Redigera > Spara > som för att spara en kopia av den ändrade versionen i en anpassad arbetsbok.

Arbetsböcker sparas i en resursgrupp. Alla med åtkomst till resursgruppen kan komma åt den anpassade arbetsboken.

De flesta frågor skrivs med hjälp av Kusto-frågespråk (KQL). Vissa frågor skrivs med hjälp av Resource Graph-frågan. Mer information finns i följande artiklar:

Support

Om du vill öppna ett supportärende för Insights använder du tjänsttypen Insights för Azure Stack HCI under Övervakning och hantering.

Händelseloggkanal

Insikter och övervakningsvyer baseras på Microsoft-Windows-SDDC-Management/Operational Windows Event Log Channel. När övervakning är aktiverat sparas data från den här kanalen på en Log Analytics-arbetsyta.

Visa och ändra cacheintervallet för dumpar

Standardintervallet för att dumpa cachen är inställt på 3 600 sekunder (1 timme).

Använd följande PowerShell-cmdletar för att visa cachedumpintervallvärdet:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Använd följande cmdletar för att ändra frekvensen för cachedump. Om värdet är 0 slutar det att publicera händelser:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Windows-händelser i loggkanalen

Den här kanalen innehåller fem händelser. Varje händelse har klusternamn och Azure Resource Manager-ID som EventData.

Händelse-ID	Händelsetyp
3000	Server
3001	Köra
3002	Volym
3003	Virtuell maskin
3004	Kluster

Kolumnvärde för serverhändelse 3000 RenderedDescription

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

De flesta variabler är självförklarande från den här JSON-informationen. I tabellen nedan visas dock några variabler som är lite svårare att förstå.

Variabel	beskrivning
m_servers	Matris med servernoder.
m_statusKategori	Serverns hälsostatus.
m_status	Serverns tillstånd. Det är en matris som kan innehålla ett eller två värden. Det första värdet är obligatoriskt (0–4). Det andra värdet är valfritt (5–9).

Värden för variabeln m_statusCategory är följande:

Värde	Innebörd
0	Felfri
1	Varning
2	Ohälsosamt
255	Övrigt

Värdena för variabeln m_status är följande:

Värde	Innebörd
0	Upp
1	Ned
2	Under underhåll
3	Ansluta
4	Normal
5	Isolerad
6	I karantän
7	Dränering
8	Tömning har slutförts
9	Avloppet misslyckades
0xffff	Okänt

Kolumnvärde för Drive-event 3001 RenderedDescription

Enhetshändelse 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Kolumnvärde för volymhändelse 3002 RenderadBeskrivning

Volymhändelse 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

De flesta variabler är självförklarande från ovanstående JSON-information. I tabellen nedan visas dock några variabler som är lite svårare att förstå.

Variabel	beskrivning
Volymlista	Matris med volymer.
m_Statuskategori	Hälsostatus för volymen.
m_Status	Volymens status Det är en matris som kan innehålla ett eller två värden. Det första värdet är obligatoriskt (0–4). Det andra värdet är valfritt (5–9).

Värden för variabeln m_statusCategory är följande:

Värde	Innebörd
0	Felfri
1	Varning
2	Ohälsosamt
255	Övrigt

Värdena för variabeln m_status är följande:

Värde	Innebörd
0	Okänt
1	Övrigt
2	OK
3	Behöver repareras
4	Stressad
5	Förutsägande fel
6	Fel
7	Fel som inte kan återställas
8	Påbörjar
9	Stoppar
10	Stoppade
11	I tjänst
12	Ingen kontakt
13	Förlorad kommunikation
14	Avbröts
15	Vilande
16	Stödjande entitet vid fel
17	Slutförd
18	Strömläge
19	Flytta
0xD002	Nedåt
0xD003	Behöver omsynkroniseras

Kolumnvärde för händelse 3003 på virtuell dator RenderedDescription

Händelse för virtuell dator 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Kolumnvärde för klusterhändelse 3004 Renderad beskrivning

Klusterhändelse 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Mer information om den data som samlas in finns i Fel i hälsotjänst.

Nästa steg

Relaterad information finns i:

Dela via