Sdílet prostřednictvím


Monitorování několika clusterů Azure Stack HCI pomocí Přehledů

Platí pro: Místní Azure verze 22H2

Důležité

Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.

Tento článek vysvětluje, jak pomocí Přehledů monitorovat více clusterů Azure Stack HCI. Informace o jednom clusteru Azure Stack HCI najdete v tématu Monitorování Azure Stack HCI pomocí přehledů.

Důležité

Pokud jste zaregistrovali cluster Azure Stack HCI a nakonfigurovali přehledy před listopadem 2023, nemusí některé funkce, které používají agenta služby Azure Monitor (AMA), jako je Arc for Servers, VM Insights, Defender for Cloud nebo Sentinel, správně shromažďovat protokoly a data událostí. Pokyny k řešení potíží najdete v části Řešení potíží s clustery zaregistrovanými před listopadem 2023 .

Informace o výhodách, požadavcích a povolení přehledů v jednotlivých clusterech najdete v tématu Výhody, Požadavky a Povolení přehledů.

Podívejte se na video s rychlým úvodem:

Zobrazení přehledů o stavu, výkonu a využití

Insights ukládá svá data do pracovního prostoru služby Log Analytics, který umožňuje poskytovat výkonné agregace a filtrování a analýzu trendů dat v průběhu času. Přehledy nemají žádné přímé náklady. Uživatelé se účtují na základě ingestovaných dat a nastavení uchovávání dat v pracovním prostoru služby Log Analytics.

K přehledům můžete přistupovat z centra Azure Monitor > Insights v Azure Stack HCI>. Mezi zobrazeními se zobrazí následující karty: Přidání do monitorování, stavu clusteru, serverů, virtuálních počítačů, úložiště.

Filtrování výsledků

Vizualizaci je možné filtrovat napříč předplatnými. Výsledky můžete filtrovat podle následujících rozevíracích nabídek:

  • Časový rozsah: Tento filtr umožňuje vybrat rozsah pro zobrazení trendu. Výchozí hodnota je Posledních 24 hodin.
  • Předplatná: Zobrazuje předplatná, která zaregistrovala clustery Azure Stack HCI. V tomto filtru můžete vybrat více předplatných.
  • Clustery HCI: Zobrazí seznam registrovaných clusterů Azure Stack HCI s povolenými možnostmi protokolů a monitorování ve vybraném časovém rozsahu. Z tohoto filtru můžete vybrat více clusterů.
  • Skupiny prostředků: Tento filtr umožňuje vybrat všechny clustery v rámci skupiny prostředků.

Přidat do monitorování

Tato funkce poskytuje podrobnosti o clusterech, které uživatel nemonitoruje. Pokud chcete spustit monitorování clusteru, vyberte ho, aby se cluster otevřel, a pak vyberte Capabilities > Insights. Pokud cluster nevidíte, ujistěte se, že je nedávno připojený k Azure.

Snímek obrazovky pro výběr clusteru pro monitorování

Sloupec Popis Příklad
Cluster Název clusteru. 27cls1
Stav připojení Azure Stav prostředku HCI. Připojeno
Verze operačního systému Operační systém se sestaví na serveru. 10.0.20348.10131

Ve výchozím nastavení se v zobrazení mřížky zobrazuje prvních 250 řádků. Hodnotu můžete nastavit úpravou řádků mřížky, jak je znázorněno na následujícím obrázku:

Snímek obrazovky znázorňující nastavení hodnot mřížky

Podrobnosti v Excelu můžete exportovat tak , že vyberete Exportovat do Excelu , jak je znázorněno na následujícím obrázku:

Snímek obrazovky s odkazem pro export do Excelu

Excel poskytne stav připojení Azure následujícím způsobem:

  • 0: Nezaregistrováno
  • 1: Odpojeno
  • 2: V poslední době ne
  • 3: Připojeno

Stav clusteru

Toto zobrazení poskytuje přehled o stavu clusterů.

Snímek obrazovky zobrazující informace přehledu stavu clusteru

Sloupec Popis Příklad
Cluster Název clusteru. 27cls1
Naposledy aktualizované Časové razítko poslední aktualizace serveru. 9.4.2022, 12:15:42
Stav Poskytuje stav prostředků serveru v clusteru. Může to být v pořádku, upozornění, kritické nebo jiné. V pořádku
Chybující prostředek Popis prostředku způsobil chybu. Server, fond úložiště, subsystém
Celkový počet serverů Počet serverů v clusteru 4

Pokud váš cluster chybí nebo zobrazuje stav Jiný, přejděte do pracovního prostoru služby Log Analytics, který se používá pro cluster, a ujistěte se, že konfigurace agenta zaznamenává data z protokolu microsoft-windows-health/operational log. Ujistěte se také, že se clustery nedávno připojily k Azure, a zkontrolujte, že clustery nejsou v tomto sešitu filtrované.

Server

Toto zobrazení poskytuje přehled o stavu serveru a výkonu a využití vybraných clusterů. Toto zobrazení se sestaví pomocí události serveru s ID 3000 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek je možné dále rozšířit, aby se zobrazil stav uzlu. S prostředkem clusteru a serveru můžete pracovat a přejít na příslušnou stránku prostředků.

Snímek obrazovky zobrazující stav serverů

Virtuální počítače

Toto zobrazení poskytuje stav všech virtuálních počítačů ve vybraném clusteru. Zobrazení se sestaví pomocí události virtuálního počítače s ID 3003 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek je možné dále rozšířit a zobrazit distribuci virtuálních počítačů mezi servery v clusteru. S prostředkem clusteru a uzlu můžete pracovat a přejít na stránku příslušného prostředku.

Snímek obrazovky znázorňující stav virtuálních počítačů

Metrický Popis Příklad
Server clusteru > Název clusteru. Při rozšíření se zobrazí servery v clusteru. Sample-VM-1
Poslední aktualizace Datum a čas poslední aktualizace serveru. 9.4.2022, 12:24:02
Celkový počet virtuálních počítačů Počet virtuálních počítačů v uzlu serveru v clusteru 1 z 2 spuštěných
Spuštěno Počet virtuálních počítačů spuštěných v uzlu serveru v clusteru 2
Zastaveno Počet virtuálních počítačů zastavených v uzlu serveru v clusteru 3
Neúspěšný Počet virtuálních počítačů selhal v uzlu serveru v clusteru. 2
Jiný důvod Pokud je virtuální počítač v jednom z následujících stavů (Neznámý, Spuštěno, Snímek, Ukládání, Zastavení, Pozastavení, Obnovení, Pozastaveno, Pozastaveno), považuje se za "Jiné". 2

Úložiště

Toto zobrazení ukazuje stav svazků, využití a výkonu napříč monitorovanými clustery. Rozbalením clusteru zobrazíte stav jednotlivých svazků. Toto zobrazení se sestaví pomocí ID události svazku 3002 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Dlaždice v horní části poskytují přehled o stavu úložiště.

Snímek obrazovky znázorňující stav svazků úložiště

Metrický Popis Příklad
Svazek clusteru > Název clusteru. Při rozšíření se zobrazí svazky v clusteru. AltaylCluster1 > ClusterPerformanceHistory
Naposledy aktualizované Datum a čas poslední aktualizace úložiště. 14.4.2022, 2:58:55
Stav svazku Stav svazku. Může to být v pořádku, upozornění, kritické nebo jiné. V pořádku
Velikost Celková kapacita zařízení vbajch 25B
Využití Procento dostupné kapacity během sledovaného období 23.54%
Iops Vstupně-výstupní operace za sekundu 45/s
Trend Trend IOPS.
Propustnost Počet bajtů za sekundu, které služba Application Gateway obsluhovala. 5B/s
Trend (B/s) Trend propustnosti.
Průměrná latence Latence je průměrná doba, kterou trvá dokončení V/V požadavku. 334 μs

Přizpůsobení přehledů

Vzhledem k tomu, že uživatelské prostředí je postavené na šablonách sešitů služby Azure Monitor, můžou uživatelé upravovat vizualizace a dotazy a ukládat je jako přizpůsobený sešit.

Pokud používáte vizualizaci z centra Azure Monitor > Insights Hub Azure Stack HCI, vyberte Možnost Upravit > uložit > jako a uložte kopii upravené verze do vlastního > sešitu.

Sešity se ukládají do skupiny prostředků. Každý, kdo má přístup ke skupině prostředků, má přístup k přizpůsobenému sešitu.

Většina dotazů se zapisuje pomocí dotazovací jazyk Kusto (KQL). Některé dotazy se zapisují pomocí dotazu Resource Graph. Další informace najdete v následujících článcích:

Technická podpora

Pokud chcete otevřít lístek podpory pro Přehledy, použijte typ služby Insights pro Azure Stack HCI v části Monitorování a správa.

Kanál protokolu událostí

Zobrazení přehledů a monitorování jsou založená na kanálu protokolu událostí systému Microsoft-Windows-SDDC/Operational Windows. Pokud je povolené monitorování, ukládají se data z tohoto kanálu do pracovního prostoru služby Log Analytics.

Zobrazení a změna intervalu mezipaměti výpisu paměti

Výchozí interval pro výpis mezipaměti je nastavený na 3600 sekund (1 hodinu).

K zobrazení hodnoty intervalu výpisu mezipaměti použijte následující rutiny PowerShellu:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Ke změně frekvence výpisu mezipaměti použijte následující rutiny. Pokud je nastavená hodnota 0, zastaví publikování událostí:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Události Windows v kanálu protokolu

Tento kanál zahrnuje pět událostí. Každá událost má název clusteru a ID Azure Resource Manageru jako EventData.

ID události Typ události
3000 Server
3001 Řídit
3002 Objem
3003 Virtuální počítač
3004 Cluster

Hodnota sloupce RenderedDescription události serveru 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Většinaproměnných Následující tabulka ale uvádí několik proměnných, které jsou trochu obtížnější pochopit.

Proměnná Popis
m_servers Pole uzlů serveru
m_statusCategory Stav serveru
m_status Stav serveru. Jedná se o matici, která může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0–4). Druhá hodnota je volitelná (5–9).

Hodnoty m_statusCategory proměnné jsou následující:

Hodnota Význam
0 V pořádku
0 Upozorňující
2 Není v pořádku
255 Jiný důvod

Hodnoty m_status proměnné jsou následující:

Hodnota Význam
0 Nahoru
0 Dolů
2 V údržbě
3 Připojení
4 Normální
5 Izolovaný režim
6 V karanténě
7 Vypouštění
8 Vyprazdnění dokončeno
9 Vyprázdnění se nezdařilo.
0xffff Neznámý

Jednotka události 3001 RenderedDescription hodnota sloupce

Událost jízdy 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Hodnota sloupce RenderedDescription události svazku 3002

Událost svazku 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Většina proměnných je sama vysvětlující z výše uvedených informací JSON. Následující tabulka ale uvádí několik proměnných, které jsou trochu obtížnější pochopit.

Proměnná Popis
VolumeList Pole svazků
m_StatusCategory Stav svazku
m_Status Stav svazku. Jedná se o matici, která může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0–4). Druhá hodnota je volitelná (5–9).

Hodnoty m_statusCategory proměnné jsou následující:

Hodnota Význam
0 V pořádku
0 Upozorňující
2 Není v pořádku
255 Jiný důvod

Hodnoty m_status proměnné jsou následující:

Hodnota Význam
0 Neznámý
0 Jiný důvod
2 OK
3 Potřebuje opravu.
4 Zdůrazněný
5 Prediktivní selhání
6 Chyba
7 Chyba, která není obnovitelná
8 Spouštění
9 Zastavování
10 Zastaveno
11 Ve službě
12 Žádný kontakt
13 Ztracená komunikace
14 Bylo přerušeno
15 Nečinný
16 Podpůrná entita v chybě
17 Dokončeno
18 Režim napájení
19 Přemístění
0xD002 Dolů
0xD003 Potřebuje provést opětovnou synchronizaci.

Hodnota sloupce RenderedDescription události virtuálního počítače 3003

Událost virtuálního počítače 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Hodnota sloupce RenderedDescription události clusteru 3004

Událost clusteru 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Další informace o shromážděných datech najdete v tématu Chyby služby Health Service.

Další kroky

Související informace najdete tady: