Monitorování několika clusterů Azure Stack HCI pomocí Přehledů

Článek
01/09/2025

Platí pro: Azure Stack HCI verze 22H2

Důležité

Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.

Tento článek vysvětluje, jak pomocí Přehledů monitorovat více clusterů Azure Stack HCI. Informace o jednom clusteru Azure Stack HCI najdete v tématu Monitorování Azure Stack HCI pomocí přehledů.

Důležité

Pokud jste zaregistrovali cluster Azure Stack HCI a nakonfigurovali přehledy před listopadem 2023, nemusí některé funkce, které používají agenta služby Azure Monitor (AMA), jako je Arc for Servers, VM Insights, Defender for Cloud nebo Sentinel, správně shromažďovat protokoly a data událostí. Pokyny k řešení potíží najdete v části Řešení potíží s clustery zaregistrovanými před listopadem 2023 .

Informace o výhodách, požadavcích a povolení přehledů v jednotlivých clusterech najdete v tématu Výhody, Požadavky a Povolení přehledů .

Podívejte se na video s rychlým úvodem:

Zobrazení přehledů o stavu, výkonu a využití

Insights ukládá svá data do pracovního prostoru služby Log Analytics, který umožňuje poskytovat výkonné agregace a filtrování a analýzu trendů dat v průběhu času. Přehledy nemají žádné přímé náklady. Uživatelé se účtují na základě ingestovaných dat a nastavení uchovávání dat v pracovním prostoru služby Log Analytics.

K přehledům můžete přistupovat z >. Mezi zobrazeními se zobrazí následující karty: Přidání do monitorování, stavu clusteru, serverů, virtuálních počítačů, úložiště.

Filtrování výsledků

Vizualizaci je možné filtrovat napříč předplatnými. Výsledky můžete filtrovat podle následujících rozevíracích nabídek:

Časový rozsah: Tento filtr umožňuje vybrat rozsah pro zobrazení trendu. Výchozí hodnota je Posledních 24 hodin.
Předplatná: Zobrazuje předplatná, která zaregistrovala clustery Azure Stack HCI. V tomto filtru můžete vybrat více předplatných.
Clustery HCI: Zobrazí seznam registrovaných clusterů Azure Stack HCI s povolenými možnostmi protokolů a monitorování ve vybraném časovém rozsahu. Z tohoto filtru můžete vybrat více clusterů.
Skupiny prostředků: Tento filtr umožňuje vybrat všechny clustery v rámci skupiny prostředků.

Přidat do monitorování

Tato funkce poskytuje podrobnosti o clusterech, které uživatel nemonitoruje. Pokud chcete spustit monitorování clusteru, vyberte ho, aby se cluster otevřel, a pak vyberte Capabilities > Insights. Pokud cluster nevidíte, ujistěte se, že je nedávno připojený k Azure.

Sloupec	Popis	Příklad
Cluster	Název clusteru.	27cls1
Stav připojení Azure	Stav prostředku HCI.	Připojeno
Verze operačního systému	Operační systém se sestaví na serveru.	10.0.20348.10131

Ve výchozím nastavení se v zobrazení mřížky zobrazuje prvních 250 řádků. Hodnotu můžete nastavit úpravou řádků mřížky, jak je znázorněno na následujícím obrázku:

Podrobnosti v Excelu můžete exportovat tak , že vyberete Exportovat do Excelu , jak je znázorněno na následujícím obrázku:

Excel poskytne stav připojení Azure následujícím způsobem:

0: Nezaregistrováno
1: Odpojeno
2: V poslední době ne
3: Připojeno

Stav clusteru

Toto zobrazení poskytuje přehled o stavu clusterů.

Sloupec	Popis	Příklad
Cluster	Název clusteru.	27cls1
Naposledy aktualizované	Časové razítko poslední aktualizace serveru.	9.4.2022, 12:15:42
Stav	Poskytuje stav prostředků serveru v clusteru. Může to být v pořádku, upozornění, kritické nebo jiné.	V pořádku
Chybující prostředek	Popis prostředku způsobil chybu.	Server, fond úložiště, subsystém
Celkový počet serverů	Počet serverů v clusteru	4

Pokud váš cluster chybí nebo zobrazuje stav Jiný, přejděte do pracovního prostoru služby Log Analytics, který se používá pro cluster, a ujistěte se, že konfigurace agenta zaznamenává data z protokolu microsoft-windows-health/operational log. Ujistěte se také, že se clustery nedávno připojily k Azure, a zkontrolujte, že clustery nejsou v tomto sešitu filtrované.

Server

Toto zobrazení poskytuje přehled o stavu serveru a výkonu a využití vybraných clusterů. Toto zobrazení se sestaví pomocí události serveru s ID 3000 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek je možné dále rozšířit, aby se zobrazil stav uzlu. S prostředkem clusteru a serveru můžete pracovat a přejít na příslušnou stránku prostředků.

Virtuální počítače

Toto zobrazení poskytuje stav všech virtuálních počítačů ve vybraném clusteru. Zobrazení se sestaví pomocí události virtuálního počítače s ID 3003 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek je možné dále rozšířit a zobrazit distribuci virtuálních počítačů mezi servery v clusteru. S prostředkem clusteru a uzlu můžete pracovat a přejít na stránku příslušného prostředku.

Metrický	Popis	Příklad
Server clusteru >	Název clusteru. Při rozšíření se zobrazí servery v clusteru.	Sample-VM-1
Poslední aktualizace	Datum a čas poslední aktualizace serveru.	9.4.2022, 12:24:02
Celkový počet virtuálních počítačů	Počet virtuálních počítačů v uzlu serveru v clusteru	1 z 2 spuštěných
Spuštěno	Počet virtuálních počítačů spuštěných v uzlu serveru v clusteru	2
Zastaveno	Počet virtuálních počítačů zastavených v uzlu serveru v clusteru	3
Neúspěšný	Počet virtuálních počítačů selhal v uzlu serveru v clusteru.	2
Jiný důvod	Pokud je virtuální počítač v jednom z následujících stavů (Neznámý, Spuštěno, Snímek, Ukládání, Zastavení, Pozastavení, Obnovení, Pozastaveno, Pozastaveno), považuje se za "Jiné".	2

Úložiště

Toto zobrazení ukazuje stav svazků, využití a výkonu napříč monitorovanými clustery. Rozbalením clusteru zobrazíte stav jednotlivých svazků. Toto zobrazení se sestaví pomocí ID události svazku 3002 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Dlaždice v horní části poskytují přehled o stavu úložiště.

Metrický	Popis	Příklad
Svazek clusteru >	Název clusteru. Při rozšíření se zobrazí svazky v clusteru.	AltaylCluster1 > ClusterPerformanceHistory
Naposledy aktualizované	Datum a čas poslední aktualizace úložiště.	14.4.2022, 2:58:55
Stav svazku	Stav svazku. Může to být v pořádku, upozornění, kritické nebo jiné.	V pořádku
Velikost	Celková kapacita zařízení vbajch	25B
Využití	Procento dostupné kapacity během sledovaného období	23.54%
Iops	Vstupně-výstupní operace za sekundu	45/s
Trend	Trend IOPS.
Propustnost	Počet bajtů za sekundu, které služba Application Gateway obsluhovala.	5B/s
Trend (B/s)	Trend propustnosti.
Průměrná latence	Latence je průměrná doba, kterou trvá dokončení V/V požadavku.	334 μs

Přizpůsobení přehledů

Vzhledem k tomu, že uživatelské prostředí je postavené na šablonách sešitů služby Azure Monitor, můžou uživatelé upravovat vizualizace a dotazy a ukládat je jako přizpůsobený sešit.

Pokud používáte vizualizaci z >, vyberte > a uložte kopii upravené verze do vlastního sešitu.

Sešity se ukládají do skupiny prostředků. Každý, kdo má přístup ke skupině prostředků, má přístup k přizpůsobenému sešitu.

Většina dotazů se zapisuje pomocí dotazovací jazyk Kusto (KQL). Některé dotazy se zapisují pomocí dotazu Resource Graph. Další informace najdete v následujících článcích:

Technická podpora

Pokud chcete otevřít lístek podpory pro Přehledy, použijte typ služby Insights pro Azure Stack HCI v části Monitorování a správa.

Kanál protokolu událostí

Zobrazení přehledů a monitorování jsou založená na kanálu protokolu událostí systému Microsoft-Windows-SDDC/Operational Windows. Pokud je povolené monitorování, ukládají se data z tohoto kanálu do pracovního prostoru služby Log Analytics.

Zobrazení a změna intervalu mezipaměti výpisu paměti

Výchozí interval pro výpis mezipaměti je nastavený na 3600 sekund (1 hodinu).

K zobrazení hodnoty intervalu výpisu mezipaměti použijte následující rutiny PowerShellu:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Ke změně frekvence výpisu mezipaměti použijte následující rutiny. Pokud je nastavená hodnota 0, zastaví publikování událostí:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Události Windows v kanálu protokolu

Tento kanál zahrnuje pět událostí. Každá událost má název clusteru a ID Azure Resource Manageru jako EventData.

ID události	Typ události
3000	Server
3001	Řídit
3002	Objem
3003	Virtuální počítač
3004	Cluster

Hodnota sloupce RenderedDescription události serveru 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Většinaproměnných Následující tabulka ale uvádí několik proměnných, které jsou trochu obtížnější pochopit.

Proměnná	Popis
m_servers	Pole uzlů serveru
m_statusCategory	Stav serveru
m_status	Stav serveru. Jedná se o matici, která může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0–4). Druhá hodnota je volitelná (5–9).

Hodnoty m_statusCategory proměnné jsou následující:

Hodnota	Význam
0	V pořádku
0	Upozorňující
2	Není v pořádku
255	Jiný důvod

Hodnoty m_status proměnné jsou následující:

Hodnota	Význam
0	Nahoru
0	Dolů
2	V údržbě
3	Připojení
4	Normální
5	Izolovaný režim
6	V karanténě
7	Vypouštění
8	Vyprazdnění dokončeno
9	Vyprázdnění se nezdařilo.
0xffff	Neznámý

Jednotka události 3001 RenderedDescription hodnota sloupce

Událost jízdy 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Hodnota sloupce RenderedDescription události svazku 3002

Událost svazku 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Většina proměnných je sama vysvětlující z výše uvedených informací JSON. Následující tabulka ale uvádí několik proměnných, které jsou trochu obtížnější pochopit.

Proměnná	Popis
VolumeList	Pole svazků
m_StatusCategory	Stav svazku
m_Status	Stav svazku. Jedná se o matici, která může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0–4). Druhá hodnota je volitelná (5–9).

Hodnoty m_statusCategory proměnné jsou následující:

Hodnota	Význam
0	V pořádku
0	Upozorňující
2	Není v pořádku
255	Jiný důvod

Hodnoty m_status proměnné jsou následující:

Hodnota	Význam
0	Neznámý
0	Jiný důvod
2	OK
3	Potřebuje opravu.
4	Zdůrazněný
5	Prediktivní selhání
6	Chyba
7	Chyba, která není obnovitelná
8	Spouštění
9	Zastavování
10	Zastaveno
11	Ve službě
12	Žádný kontakt
13	Ztracená komunikace
14	Bylo přerušeno
15	Nečinný
16	Podpůrná entita v chybě
17	Dokončeno
18	Režim napájení
19	Přemístění
0xD002	Dolů
0xD003	Potřebuje provést opětovnou synchronizaci.

Hodnota sloupce RenderedDescription události virtuálního počítače 3003

Událost virtuálního počítače 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Hodnota sloupce RenderedDescription události clusteru 3004

Událost clusteru 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Další informace o shromážděných datech najdete v tématu Chyby služby Health Service.

Další kroky

Související informace najdete tady:

Sdílet prostřednictvím