Monitorování několika clusterů Azure Stack HCI pomocí Přehledů
Platí pro: Místní Azure verze 22H2
Důležité
Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.
Tento článek vysvětluje, jak pomocí Přehledů monitorovat více clusterů Azure Stack HCI. Informace o jednom clusteru Azure Stack HCI najdete v tématu Monitorování Azure Stack HCI pomocí přehledů.
Důležité
Pokud jste zaregistrovali cluster Azure Stack HCI a nakonfigurovali přehledy před listopadem 2023, nemusí některé funkce, které používají agenta služby Azure Monitor (AMA), jako je Arc for Servers, VM Insights, Defender for Cloud nebo Sentinel, správně shromažďovat protokoly a data událostí. Pokyny k řešení potíží najdete v části Řešení potíží s clustery zaregistrovanými před listopadem 2023 .
Informace o výhodách, požadavcích a povolení přehledů v jednotlivých clusterech najdete v tématu Výhody, Požadavky a Povolení přehledů.
Podívejte se na video s rychlým úvodem:
Zobrazení přehledů o stavu, výkonu a využití
Insights ukládá svá data do pracovního prostoru služby Log Analytics, který umožňuje poskytovat výkonné agregace a filtrování a analýzu trendů dat v průběhu času. Přehledy nemají žádné přímé náklady. Uživatelé se účtují na základě ingestovaných dat a nastavení uchovávání dat v pracovním prostoru služby Log Analytics.
K přehledům můžete přistupovat z centra Azure Monitor > Insights v Azure Stack HCI>. Mezi zobrazeními se zobrazí následující karty: Přidání do monitorování, stavu clusteru, serverů, virtuálních počítačů, úložiště.
Filtrování výsledků
Vizualizaci je možné filtrovat napříč předplatnými. Výsledky můžete filtrovat podle následujících rozevíracích nabídek:
- Časový rozsah: Tento filtr umožňuje vybrat rozsah pro zobrazení trendu. Výchozí hodnota je Posledních 24 hodin.
- Předplatná: Zobrazuje předplatná, která zaregistrovala clustery Azure Stack HCI. V tomto filtru můžete vybrat více předplatných.
- Clustery HCI: Zobrazí seznam registrovaných clusterů Azure Stack HCI s povolenými možnostmi protokolů a monitorování ve vybraném časovém rozsahu. Z tohoto filtru můžete vybrat více clusterů.
- Skupiny prostředků: Tento filtr umožňuje vybrat všechny clustery v rámci skupiny prostředků.
Přidat do monitorování
Tato funkce poskytuje podrobnosti o clusterech, které uživatel nemonitoruje. Pokud chcete spustit monitorování clusteru, vyberte ho, aby se cluster otevřel, a pak vyberte Capabilities > Insights. Pokud cluster nevidíte, ujistěte se, že je nedávno připojený k Azure.
Sloupec | Popis | Příklad |
---|---|---|
Cluster | Název clusteru. | 27cls1 |
Stav připojení Azure | Stav prostředku HCI. | Připojeno |
Verze operačního systému | Operační systém se sestaví na serveru. | 10.0.20348.10131 |
Ve výchozím nastavení se v zobrazení mřížky zobrazuje prvních 250 řádků. Hodnotu můžete nastavit úpravou řádků mřížky, jak je znázorněno na následujícím obrázku:
Podrobnosti v Excelu můžete exportovat tak , že vyberete Exportovat do Excelu , jak je znázorněno na následujícím obrázku:
Excel poskytne stav připojení Azure následujícím způsobem:
- 0: Nezaregistrováno
- 1: Odpojeno
- 2: V poslední době ne
- 3: Připojeno
Stav clusteru
Toto zobrazení poskytuje přehled o stavu clusterů.
Sloupec | Popis | Příklad |
---|---|---|
Cluster | Název clusteru. | 27cls1 |
Naposledy aktualizované | Časové razítko poslední aktualizace serveru. | 9.4.2022, 12:15:42 |
Stav | Poskytuje stav prostředků serveru v clusteru. Může to být v pořádku, upozornění, kritické nebo jiné. | V pořádku |
Chybující prostředek | Popis prostředku způsobil chybu. | Server, fond úložiště, subsystém |
Celkový počet serverů | Počet serverů v clusteru | 4 |
Pokud váš cluster chybí nebo zobrazuje stav Jiný, přejděte do pracovního prostoru služby Log Analytics, který se používá pro cluster, a ujistěte se, že konfigurace agenta zaznamenává data z protokolu microsoft-windows-health/operational log. Ujistěte se také, že se clustery nedávno připojily k Azure, a zkontrolujte, že clustery nejsou v tomto sešitu filtrované.
Server
Toto zobrazení poskytuje přehled o stavu serveru a výkonu a využití vybraných clusterů. Toto zobrazení se sestaví pomocí události serveru s ID 3000 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek je možné dále rozšířit, aby se zobrazil stav uzlu. S prostředkem clusteru a serveru můžete pracovat a přejít na příslušnou stránku prostředků.
Virtuální počítače
Toto zobrazení poskytuje stav všech virtuálních počítačů ve vybraném clusteru. Zobrazení se sestaví pomocí události virtuálního počítače s ID 3003 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek je možné dále rozšířit a zobrazit distribuci virtuálních počítačů mezi servery v clusteru. S prostředkem clusteru a uzlu můžete pracovat a přejít na stránku příslušného prostředku.
Metrický | Popis | Příklad |
---|---|---|
Server clusteru > | Název clusteru. Při rozšíření se zobrazí servery v clusteru. | Sample-VM-1 |
Poslední aktualizace | Datum a čas poslední aktualizace serveru. | 9.4.2022, 12:24:02 |
Celkový počet virtuálních počítačů | Počet virtuálních počítačů v uzlu serveru v clusteru | 1 z 2 spuštěných |
Spuštěno | Počet virtuálních počítačů spuštěných v uzlu serveru v clusteru | 2 |
Zastaveno | Počet virtuálních počítačů zastavených v uzlu serveru v clusteru | 3 |
Neúspěšný | Počet virtuálních počítačů selhal v uzlu serveru v clusteru. | 2 |
Jiný důvod | Pokud je virtuální počítač v jednom z následujících stavů (Neznámý, Spuštěno, Snímek, Ukládání, Zastavení, Pozastavení, Obnovení, Pozastaveno, Pozastaveno), považuje se za "Jiné". | 2 |
Úložiště
Toto zobrazení ukazuje stav svazků, využití a výkonu napříč monitorovanými clustery. Rozbalením clusteru zobrazíte stav jednotlivých svazků. Toto zobrazení se sestaví pomocí ID události svazku 3002 kanálu protokolu událostí systému Microsoft-Windows-SDDC-Management/Operational Windows. Dlaždice v horní části poskytují přehled o stavu úložiště.
Metrický | Popis | Příklad |
---|---|---|
Svazek clusteru > | Název clusteru. Při rozšíření se zobrazí svazky v clusteru. | AltaylCluster1 > ClusterPerformanceHistory |
Naposledy aktualizované | Datum a čas poslední aktualizace úložiště. | 14.4.2022, 2:58:55 |
Stav svazku | Stav svazku. Může to být v pořádku, upozornění, kritické nebo jiné. | V pořádku |
Velikost | Celková kapacita zařízení vbajch | 25B |
Využití | Procento dostupné kapacity během sledovaného období | 23.54% |
Iops | Vstupně-výstupní operace za sekundu | 45/s |
Trend | Trend IOPS. | |
Propustnost | Počet bajtů za sekundu, které služba Application Gateway obsluhovala. | 5B/s |
Trend (B/s) | Trend propustnosti. | |
Průměrná latence | Latence je průměrná doba, kterou trvá dokončení V/V požadavku. | 334 μs |
Přizpůsobení přehledů
Vzhledem k tomu, že uživatelské prostředí je postavené na šablonách sešitů služby Azure Monitor, můžou uživatelé upravovat vizualizace a dotazy a ukládat je jako přizpůsobený sešit.
Pokud používáte vizualizaci z centra Azure Monitor > Insights Hub Azure Stack HCI, vyberte Možnost Upravit > uložit > jako a uložte kopii upravené verze do vlastního > sešitu.
Sešity se ukládají do skupiny prostředků. Každý, kdo má přístup ke skupině prostředků, má přístup k přizpůsobenému sešitu.
Většina dotazů se zapisuje pomocí dotazovací jazyk Kusto (KQL). Některé dotazy se zapisují pomocí dotazu Resource Graph. Další informace najdete v následujících článcích:
Technická podpora
Pokud chcete otevřít lístek podpory pro Přehledy, použijte typ služby Insights pro Azure Stack HCI v části Monitorování a správa.
Kanál protokolu událostí
Zobrazení přehledů a monitorování jsou založená na kanálu protokolu událostí systému Microsoft-Windows-SDDC/Operational Windows. Pokud je povolené monitorování, ukládají se data z tohoto kanálu do pracovního prostoru služby Log Analytics.
Zobrazení a změna intervalu mezipaměti výpisu paměti
Výchozí interval pro výpis mezipaměti je nastavený na 3600 sekund (1 hodinu).
K zobrazení hodnoty intervalu výpisu mezipaměti použijte následující rutiny PowerShellu:
Get-ClusterResource "sddc management" | Get-ClusterParameter
Ke změně frekvence výpisu mezipaměti použijte následující rutiny. Pokud je nastavená hodnota 0, zastaví publikování událostí:
Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>
Události Windows v kanálu protokolu
Tento kanál zahrnuje pět událostí. Každá událost má název clusteru a ID Azure Resource Manageru jako EventData.
ID události | Typ události |
---|---|
3000 | Server |
3001 | Řídit |
3002 | Objem |
3003 | Virtuální počítač |
3004 | Cluster |
Hodnota sloupce RenderedDescription události serveru 3000
{
"m_servers":[
{
"m_statusCategory":"Integer",
"m_status":[
"Integer",
"…"
],
"m_id":"String",
"m_name":"String",
"m_totalPhysicalMemoryInBytes":"Integer",
"m_usedPhysicalMemoryInBytes":"Integer",
"m_totalProcessorsUsedPercentage":"Integer",
"m_totalClockSpeedInMHz":"Integer",
"m_uptimeInSeconds":"Integer",
"m_InboundNetworkUsage":"Double (Bits/sec)",
"m_OutboundNetworkUsage":"Double (Bits/sec)",
"m_InboundRdmaUsage":"Double (Bits/sec)",
"m_OutboundRdmaUsage":"Double (Bits/sec)",
"m_site":"String",
"m_location":"String",
"m_vm":{
"m_totalVmsUnknown":"Integer",
"m_totalVmsRunning":"Integer",
"m_totalVmsStopped":"Integer",
"m_totalVmsFailed":"Integer",
"m_totalVmsPaused":"Integer",
"m_totalVmsSuspended":"Integer",
"m_totalVmsStarting":"Integer",
"m_totalVmsSnapshotting":"Integer",
"m_totalVmsSaving":"Integer",
"m_totalVmsStopping":"Integer",
"m_totalVmsPausing":"Integer",
"m_totalVmsResuming":"Integer"
},
"m_osVersion":"String",
"m_buildNumber":"String",
"m_totalPhysicalProcessors":"Integer",
"m_totalLogicalProcessors":"Integer"
},
"…"
],
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
}
Většinaproměnných Následující tabulka ale uvádí několik proměnných, které jsou trochu obtížnější pochopit.
Proměnná | Popis |
---|---|
m_servers | Pole uzlů serveru |
m_statusCategory | Stav serveru |
m_status | Stav serveru. Jedná se o matici, která může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0–4). Druhá hodnota je volitelná (5–9). |
Hodnoty m_statusCategory proměnné jsou následující:
Hodnota | Význam |
---|---|
0 | V pořádku |
0 | Upozorňující |
2 | Není v pořádku |
255 | Jiný důvod |
Hodnoty m_status proměnné jsou následující:
Hodnota | Význam |
---|---|
0 | Nahoru |
0 | Dolů |
2 | V údržbě |
3 | Připojení |
4 | Normální |
5 | Izolovaný režim |
6 | V karanténě |
7 | Vypouštění |
8 | Vyprazdnění dokončeno |
9 | Vyprázdnění se nezdařilo. |
0xffff | Neznámý |
Jednotka události 3001 RenderedDescription hodnota sloupce
Událost jízdy 3001
{
"m_drives":[
{
"m_uniqueId":"String",
"m_model":"String",
"m_type":"Integer",
"m_canPool":"Boolean",
"m_sizeInBytes":"Integer",
"m_sizeUsedInBytes":"Integer",
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
},
"…"
],
"m_correlationId":"String",
"m_isLastElement":"Boolean"
}
Hodnota sloupce RenderedDescription události svazku 3002
Událost svazku 3002
{
"VolumeList":[
{
"m_Id":"String",
"m_Label":"String",
"m_Path":"String",
"m_StatusCategory":"Integer",
"m_Status":[
"Integer",
"…"
],
"m_Size":"Integer (Bytes)",
"m_SizeUsed":"Integer (Bytes)",
"m_TotalIops":"Double (Count/second)",
"m_TotalThroughput":"Double (Bytes/Second)",
"m_AverageLatency":"Double (Seconds)",
"m_Resiliency":"Integer",
"m_IsDedupEnabled":"Boolean",
"m_FileSystem":"String"
},
"…"
],
"m_Alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
}
Většina proměnných je sama vysvětlující z výše uvedených informací JSON. Následující tabulka ale uvádí několik proměnných, které jsou trochu obtížnější pochopit.
Proměnná | Popis |
---|---|
VolumeList | Pole svazků |
m_StatusCategory | Stav svazku |
m_Status | Stav svazku. Jedná se o matici, která může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0–4). Druhá hodnota je volitelná (5–9). |
Hodnoty m_statusCategory proměnné jsou následující:
Hodnota | Význam |
---|---|
0 | V pořádku |
0 | Upozorňující |
2 | Není v pořádku |
255 | Jiný důvod |
Hodnoty m_status proměnné jsou následující:
Hodnota | Význam |
---|---|
0 | Neznámý |
0 | Jiný důvod |
2 | OK |
3 | Potřebuje opravu. |
4 | Zdůrazněný |
5 | Prediktivní selhání |
6 | Chyba |
7 | Chyba, která není obnovitelná |
8 | Spouštění |
9 | Zastavování |
10 | Zastaveno |
11 | Ve službě |
12 | Žádný kontakt |
13 | Ztracená komunikace |
14 | Bylo přerušeno |
15 | Nečinný |
16 | Podpůrná entita v chybě |
17 | Dokončeno |
18 | Režim napájení |
19 | Přemístění |
0xD002 | Dolů |
0xD003 | Potřebuje provést opětovnou synchronizaci. |
Hodnota sloupce RenderedDescription události virtuálního počítače 3003
Událost virtuálního počítače 3003
{
"m_totalVmsUnknown":"Integer",
"m_totalVmsRunning":"Integer",
"m_totalVmsStopped":"Integer",
"m_totalVmsFailed":"Integer",
"m_totalVmsPaused":"Integer",
"m_totalVmsSuspended":"Integer",
"m_totalVmsStarting":"Integer",
"m_totalVmsSnapshotting":"Integer",
"m_totalVmsSaving":"Integer",
"m_totalVmsStopping":"Integer",
"m_totalVmsPausing":"Integer",
"m_totalVmsResuming":"Integer",
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
}
Hodnota sloupce RenderedDescription události clusteru 3004
Událost clusteru 3004
{
"m_cpuUsage":"Double (%)",
"m_totalVolumeIops":"Double",
"m_averageVolumeLatency":"Double (Seconds)",
"m_totalVolumeThroughput":"Double (Bytes/Second)",
"m_totalVolumeSizeInBytes":"Integer",
"m_usedVolumeSizeInBytes":"Integer",
"m_totalMemoryInBytes":"Integer",
"m_usedMemoryInBytes":"Integer",
"m_isStretch":"Boolean",
"m_QuorumType":"String",
"m_QuorumMode":"String",
"m_QuorumState":"String",
"m_alerts":{
"m_totalUnknown":"Integer",
"m_totalHealthy":"Integer",
"m_totalWarning":"Integer",
"m_totalCritical":"Integer"
}
Další informace o shromážděných datech najdete v tématu Chyby služby Health Service.
Další kroky
Související informace najdete tady: