Delen via


Meerdere Azure Stack HCI-clusters bewaken met Insights

Van toepassing op: Azure Stack HCI, versie 22H2

Belangrijk

Azure Stack HCI maakt nu deel uit van Azure Local. Oudere versies van Azure Stack HCI, bijvoorbeeld 22H2, blijven verwijzen naar Azure Stack HCI en geven de naamwijziging niet weer. Meer informatie.

In dit artikel wordt uitgelegd hoe u Insights gebruikt om meerdere Azure Stack HCI-clusters te bewaken. Zie Azure Stack HCI bewaken met Inzichten voor één Azure Stack HCI-cluster.

Belangrijk

Als u uw Azure Stack HCI-cluster hebt geregistreerd en inzichten hebt geconfigureerd vóór november 2023, verzamelen bepaalde functies die gebruikmaken van Azure Monitor Agent (AMA), zoals Arc for Servers, VM Insights, Defender voor Cloud of Sentinel mogelijk niet correct logboeken en gebeurtenisgegevens. Zie de sectie Problemen met clusters oplossen, geregistreerd vóór november 2023 voor hulp bij het oplossen van problemen.

Zie Voordelen, Vereisten, en Inzichten inschakelen voor meer informatie over de voordelen, vereisten en het inschakelen van Insights op elk cluster.

Bekijk de video voor een korte inleiding:

Inzicht in status, prestaties en gebruik weergeven

Inzichten slaan hun gegevens op in een Log Analytics-werkruimte, waarmee krachtige aggregatie en filtering mogelijk zijn, en biedt de mogelijkheid om in de loop van de tijd datatrends te analyseren. Er zijn geen directe kosten voor Inzichten. Gebruikers worden gefactureerd op basis van de hoeveelheid gegevens die is opgenomen en de instellingen voor gegevensretentie van hun Log Analytics-werkruimte.

U hebt toegang tot Inzichten vanuit Azure Monitor > Insights Hub > Azure Stack HCI. U ziet de volgende tabbladen om te schakelen tussen weergaven: Toevoegen aan bewaking, clusterstatus, servers, virtuele machines, opslag.

Resultaten filteren

De visualisatie kan worden gefilterd over abonnementen heen. U kunt de resultaten filteren op basis van de volgende vervolgkeuzelijsten:

  • Tijdsbereik: Met dit filter kunt u een bereik selecteren voor de trendweergave. De standaardwaarde is afgelopen 24 uur.
  • Abonnementen: Toont de abonnementen die Azure Stack HCI-clusters hebben geregistreerd. U kunt in dit filter meerdere abonnementen selecteren.
  • HCI-clusters: toont de geregistreerde Azure Stack HCI-clusters waarvoor logboeken en bewakingsmogelijkheden zijn ingeschakeld in het geselecteerde tijdsbereik. U kunt meerdere clusters selecteren in dit filter.
  • Resourcegroepen: Met dit filter kunt u alle clusters in een resourcegroep selecteren.

Toevoegen aan bewaking

Deze functie bevat details van clusters die niet worden bewaakt door de gebruiker. Als u wilt beginnen met het bewaken van een cluster, selecteert u het om dat cluster te openen en selecteert u Vervolgens Capabilities > Insights. Als u uw cluster niet ziet, controleert u of het onlangs is verbonden met Azure.

Schermopname voor het selecteren van cluster voor bewaking.

Kolom Beschrijving Voorbeeld
Cluster De naam van het cluster. 27cls1
Azure-verbindingsstatus De HCI-resourcestatus. Verbonden
Besturingssysteemversie Het besturingssysteem is gebaseerd op de server. 10.0.20348.10131

In de rasterweergave worden standaard de eerste 250 rijen weergegeven. U kunt de waarde instellen door de rasterrijen te bewerken, zoals wordt weergegeven in de volgende afbeelding:

Schermopname van het scherm voor het instellen van rasterwaarden.

U kunt de details in Excel exporteren door Exporteren naar Excel te selecteren, zoals wordt weergegeven in de volgende afbeelding:

Schermopname van de koppeling voor exporteren naar Excel.

In Excel wordt de Verbindingsstatus van Azure als volgt opgeven:

  • 0: Niet geregistreerd
  • 1: Verbinding verbroken
  • 2: Niet recent
  • 3: Verbonden

Clustergroepsgezondheid

Deze weergave biedt een overzicht van de status van clusters.

Schermopname van overzichtsinformatie over clusterstatus.

Kolom Beschrijving Voorbeeld
Cluster De naam van het cluster. 27cls1
Laatst bijgewerkt De tijdstempel van het tijdstip waarop de server voor het laatst is bijgewerkt. 4/9/2022, 12:15:42 PM
Status Geeft de gezondheid van serverbronnen in het cluster weer. Het kan gezond zijn, een waarschuwing, kritiek, of iets anders. Gezond
Resource met fouten Beschrijving van welke resource de fout heeft veroorzaakt. Server, StoragePool, Subsysteem
Totaal aantal servers Het aantal servers in een cluster. 4

Als uw cluster ontbreekt of de status Overige weergeeft, gaat u naar de Log Analytics-werkruimte die voor het cluster wordt gebruikt en zorgt u ervoor dat de agentconfiguratie gegevens vastlegt uit het microsoft-windows-status-/operationele logboek. Zorg er ook voor dat de clusters onlangs verbonden zijn met Azure en controleer of de clusters niet gefilterd zijn in deze werkmap.

Server

Deze weergave biedt een overzicht van de serverstatus en prestaties en het gebruik van geselecteerde clusters. Deze weergave is gebouwd met behulp van de servergebeurtenis-id 3000 van het Microsoft-Windows-SDDC-Management/Operational Windows-gebeurtenislogboekkanaal. Elke rij kan verder worden uitgebreid om de status van het knooppunt weer te geven. U kunt communiceren met het cluster en de serverresource om naar de betreffende resourcepagina te navigeren.

Schermopname van de status van servers.

Virtuele machines

Deze weergave biedt de status van alle VIRTUELE machines in het geselecteerde cluster. De weergave is gebouwd met behulp van het gebeurtenis-id 3003 van de virtuele machine in het Microsoft-Windows-SDDC-Management/Operational Windows-gebeurtenislogboekkanaal. Elke rij kan verder worden uitgebreid om de distributie van VM's over servers in het cluster weer te geven. U kunt communiceren met het cluster en de knooppuntresource om naar de betreffende resourcepagina te navigeren.

Schermopname van de status van virtuele machines.

Metrisch Beschrijving Voorbeeld
Clusterserver > De naam van het cluster. Bij uitbreiding worden de servers in het cluster weergegeven. Voorbeeld-VM-1
Laatst bijgewerkt De datum/tijdstempel waarop de server voor het laatst is bijgewerkt. 4/9/2022, 12:24:02 PM
Totaal aantal virtuele machines Het aantal virtuele machines in een serverknooppunt binnen een cluster. 1 van 2 is actief
Lopend Het aantal virtuele machines dat wordt uitgevoerd in een serverknooppunt binnen een cluster. 2
Gestopt Het aantal virtuele machines dat is gestopt in een serverknoop binnen een cluster. 3
Mislukt Het aantal virtuele machines dat is mislukt op een serverknooppunt binnen een cluster. 2
Overige Als de VM in een van de volgende staten verkeert (Onbekend, Starten, Momentopnamen maken, Opslaan, Stoppen, Onderbreken, Hervatten, Gepauzeerd, Opgeschort), wordt deze beschouwd als 'Overig'. 2

Opslag

In deze weergave ziet u de status van volumes, gebruik en prestaties in bewaakte clusters. Vouw een cluster uit om de status van afzonderlijke volumes weer te geven. Deze weergave is gebouwd met behulp van de volumegebeurtenis-id 3002 van het Microsoft-Windows-SDDC-Management/Operational Windows-gebeurtenislogboekkanaal. De tegels bovenaan bieden een overzicht van de status van de opslag.

Schermopname van de status van opslagvolumes.

Metrisch Beschrijving Voorbeeld
Clustervolume > De naam van het cluster. Bij uitbreiding worden de volumes in een cluster weergegeven. AltaylCluster1 > ClusterPerformanceHistory
Laatst bijgewerkt De datum/tijdstempel waarop de opslag voor het laatst is bijgewerkt. 14-4-2022, 2:58:55 uur
Gezondheid van volume De status van het volume. Het kan gezond, waarschuwing, kritiek of ander zijn. Gezond
Grootte De totale capaciteit van het apparaat in bytes tijdens de rapportageperiode. 25B
Gebruik Het percentage beschikbare capaciteit tijdens de rapportageperiode. 23.54%
Iops Invoer-/uitvoerbewerkingen per seconde. 45 per seconde
Trend De IOPS-trend.
Doorvoer Het aantal bytes per seconde dat de Application Gateway heeft geleverd. 5B/s
Trend (B/s) De doorvoertrend.
Gemiddelde latentie Latentie is de gemiddelde tijd die nodig is om de I/O-aanvraag te voltooien. 334 μs

Inzichten aanpassen

Omdat de gebruikerservaring is gebaseerd op Azure Monitor-werkmapsjablonen, kunnen gebruikers de visualisaties en query's bewerken en opslaan als een aangepaste werkmap.

Als u de visualisatie van Azure Monitor > Insights hub > Azure Stack HCI gebruikt, selecteer dan Aanpassen > Bewerken > Opslaan als om een kopie van uw gewijzigde versie op te slaan in een persoonlijke werkmap.

Werkmappen worden opgeslagen in een resourcegroep. Iedereen met toegang tot de hulpbrongroep kan de aangepaste werkmap openen.

De meeste query's worden geschreven met behulp van Kusto-querytaal (KQL). Sommige query's worden geschreven met behulp van de Resource Graph-query. Raadpleeg voor meer informatie de volgende artikelen:

Ondersteuning

Als u een ondersteuningsticket voor Insights wilt openen, gebruikt u het servicetype Insights voor Azure Stack HCI onder Bewaking en beheer.

Gebeurtenislogboekkanaal

Inzichten en bewakingsweergaven zijn gebaseerd op het gebeurtenislogboekkanaal Microsoft-Windows-SDDC-Management/Operational Windows. Wanneer bewaking is ingeschakeld, worden de gegevens van dit kanaal opgeslagen in een Log Analytics-werkruimte.

Het interval van de dumpcache weergeven en wijzigen

Het standaardinterval voor het dumpen van de cache is ingesteld op 3600 seconden (1 uur).

Gebruik de volgende PowerShell-cmdlets om de cachedumpintervalwaarde weer te geven:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Gebruik de volgende cmdlets om de frequentie van cachedump te wijzigen. Als deze optie is ingesteld op 0, worden publicatie-gebeurtenissen gestopt:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Windows-gebeurtenissen in het logboekkanaal

Dit kanaal bevat vijf gebeurtenissen. Elke gebeurtenis heeft de clusternaam en de Azure Resource Manager-id als EventData.

Gebeurtenis-id Gebeurtenistype:
3000 Server
3001 Rijden
3002 Volume
3003 Virtuele machine
3004 Cluster

Waarde van de kolom RenderedDescription in servergebeurtenis 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

De meeste variabelen zijn zelfverklarend aan de hand van deze JSON-informatie. De onderstaande tabel bevat echter een aantal variabelen die wat moeilijker te begrijpen zijn.

Variabele Beschrijving
m_servers Matrix van serverknooppunten.
m_statusCategory Gezondheidsstatus van de server.
m_status Status van de server. Het is een matrix die een of twee waarden kan bevatten. De eerste waarde is verplicht (0-4). De tweede waarde is optioneel (5-9).

Waarden voor de m_statusCategory variabele zijn als volgt:

Waarde Betekenis
0 Gezond
1 Waarschuwing
2 Ongezond
255 Overige

De waarden voor de variabele m_status zijn als volgt:

Waarde Betekenis
0 Omhoog
1 Buiten gebruik
2 In onderhoud
3 Deelnemen
4 Normaal
5 Geïsoleerd
6 In quarantaine
7 Afvoeren
8 Afvoer voltooid
9 Afvoer is mislukt
0xffff Onbekend

Schijfgebeurtenis 3001 RenderedDescription kolomwaarde

Station gebeurtenis 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Kolomwaarde RenderedDescription bij volumegebeurtenis 3002

Volume gebeurtenis 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

De meeste variabelen zijn verklarend voor de bovenstaande JSON-informatie. De onderstaande tabel bevat echter een aantal variabelen die wat moeilijker te begrijpen zijn.

Variabele Beschrijving
Volumelijst Matrix van volumes.
m_StatusCategorie Gezondheidsstatus van volume.
m_Status Status van het volume. Het is een matrix die een of twee waarden kan bevatten. De eerste waarde is verplicht (0-4). De tweede waarde is optioneel (5-9).

Waarden voor de m_statusCategory variabele zijn als volgt:

Waarde Betekenis
0 Gezond
1 Waarschuwing
2 Ongezond
255 Overige

De waarden voor de variabele m_status zijn als volgt:

Waarde Betekenis
0 Onbekend
1 Overige
2 OK
3 Reparatie nodig
4 Gestrest
5 Voorspelde storing
6 Fout
7 Fout die niet kan worden hersteld
8 Starten
9 Beëindigen
10 Gestopt
11 In gebruik
12 Geen contactpersoon
13 Communicatie verloren
14 Afgebroken
15 Latent
16 Ondersteunende entiteit in fout
17 Voltooid
18 Energiemodus
19 Verhuizen
0xD002 Buiten gebruik
0xD003 Moet opnieuw worden gesynchroniseerd

Kolomwaarde voor RenderedDescription bij virtuele machinegebeurtenis 3003

Gebeurtenis 3003 van virtuele machine

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Clustergebeurtenis 3004 VerwerkteBeschrijving kolomwaarde

Cluster gebeurtenis 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Zie Health Service-fouten voor meer informatie over de verzamelde gegevens.

Volgende stappen

Zie voor verwante informatie: