Udostępnij za pośrednictwem


Monitorowanie wielu systemów lokalnych platformy Azure za pomocą szczegółowych informacji

Dotyczy: Azure Local 2311.2 i nowsze

W tym artykule wyjaśniono, jak używać usługi Insights do monitorowania wielu systemów lokalnych platformy Azure. W przypadku pojedynczego systemu lokalnego platformy Azure zobacz Monitorowanie pojedynczego systemu lokalnego platformy Azure za pomocą szczegółowych informacji.

Aby uzyskać informacje o korzyściach, wymaganiach wstępnych i sposobie włączania szczegółowych informacji w poszczególnych systemach lokalnych platformy Azure, zobacz Korzyści, wymagania wstępne i Włączanie szczegółowych informacji.

Aby monitorować wiele lokalnych systemów platformy Azure za pomocą Insights, należy włączyć Insights osobno dla każdego systemu. Zamiast tego możesz włączyć Funkcje Insights na dużą skalę przy użyciu zasad platformy Azure. Aby uzyskać więcej informacji, zobacz Włączanie funkcji Insights dla usługi Azure Local na dużą skalę przy użyciu zasad Azure.

Obejrzyj film wideo, aby zapoznać się z krótkim wprowadzeniem:

Wyświetlanie informacji o kondycji, wydajności i użyciu

Usługa Insights przechowuje swoje dane w obszarze roboczym usługi Log Analytics, co umożliwia dostarczanie zaawansowanych agregacji i filtrowania i analizowania trendów danych w czasie. Nie ma bezpośrednich kosztów usługi Insights. Opłaty są naliczane na podstawie ilości pozyskanych danych oraz ustawień przechowywania danych w obszarze roboczym usługi Log Analytics.

Dostęp do Insights można uzyskać za pomocą usługi Azure Monitor>Insights>Azure Local. Użyj następujących kart, aby przełączać się między widokami: Dodaj do monitorowania, Stan klastra, Węzły, Maszyny wirtualne i Pamięć.

Filtrowanie wyników

Wizualizację można filtrować w subskrypcjach. Wyniki można filtrować na podstawie następujących menu rozwijanych:

  • Zakres czasu: ten filtr umożliwia wybranie zakresu widoku trendu. Wartość domyślna to Ostatnie 24 godziny.
  • Subskrypcje: przedstawia subskrypcje, które zarejestrowały klastry lokalne platformy Azure. Możesz wybrać wiele subskrypcji w tym filtrze.
  • Klastry: wyświetla listę zarejestrowanych klastrów lokalnych platformy Azure z włączonymi funkcjami dzienników i monitorowania w wybranym zakresie czasu. Możesz wybrać wiele klastrów z tego filtru.
  • Grupy zasobów: ten filtr umożliwia wybranie wszystkich klastrów w grupie zasobów.

Dodaj do monitorowania

Ta funkcja zawiera szczegółowe informacje o klastrach, które nie są monitorowane przez użytkownika. Aby rozpocząć monitorowanie klastra, wybierz go, aby otworzyć ten klaster, a następnie wybierz pozycję Capabilities > Insights. Jeśli klaster nie jest widoczny, upewnij się, że został niedawno połączony z platformą Azure.

Zrzut ekranu przedstawiający wybieranie klastra do monitorowania.

Kolumna opis Przykład
Klaster Nazwa klastra. 27cls1
Stan połączenia platformy Azure Stan zasobu lokalnego platformy Azure. Połączono
Wersja systemu operacyjnego System operacyjny jest zbudowany na węźle. 10.0.20348.10131

Domyślnie widok tabeli przedstawia pierwsze 250 wierszy. Wartość można ustawić, edytując wiersze siatki, jak pokazano na poniższej ilustracji:

Zrzut ekranu przedstawiający ekran ustawiania wartości siatki.

Szczegóły można wyeksportować w programie Excel, wybierając pozycję Eksportuj do programu Excel , jak pokazano na poniższej ilustracji:

Zrzut ekranu przedstawiający link do eksportowania do programu Excel.

Program Excel udostępni stan połączenia platformy Azure w następujący sposób:

  • 0: Niezarejestrowane
  • 1: Rozłączono
  • 2: Nie ostatnio
  • 3: Połączone

Kondycja klastra

Ten widok zawiera omówienie kondycji klastrów.

Zrzut ekranu przedstawiający informacje o kondycji klastra.

Kolumna opis Przykład
Klaster Nazwa klastra. 27cls1
Ostatnia aktualizacja Sygnatura czasowa ostatniej aktualizacji węzła. 09.04.2022, 12:15:42
Stan Zapewnia stan kondycji węzłów w klastrze. Może to być zdrowe, ostrzeżenie, krytyczne lub inne. Zdrowy
Zasób z błędami Opis zasobu, który spowodował błąd. Serwer, Pula pamięci masowej, Podsystem
Łączna liczba węzłów Liczba węzłów w klastrze. 4

Jeśli klaster jest brakujący lub wyświetla stan Inny, przejdź do obszaru roboczego usługi Log Analytics używanego przez klaster i upewnij się, że konfiguracja agenta przechwytuje dane z dziennika microsoft-windows-health/operational. Upewnij się również, że klastry zostały ostatnio połączone z platformą Azure i sprawdź, czy klastry nie są odfiltrowane w tym skoroszycie.

Węzły

Ten widok zawiera omówienie kondycji i wydajności węzła oraz użycia wybranych klastrów. Ten widok jest tworzony przy użyciu identyfikatora zdarzenia serwera 3000 kanału dziennika zdarzeń systemu Windows Microsoft-Windows-SDDC-Management/Operational Windows Event Log Channel. Każdy wiersz można dodatkowo rozszerzyć, aby wyświetlić stan kondycji węzła. Możesz wchodzić w interakcje z klastrem i zasobem węzła, aby przejść do odpowiedniej strony zasobów.

Zrzut ekranu przedstawiający stan kondycji węzłów.

Maszyny wirtualne

Ten widok zawiera stan wszystkich maszyn wirtualnych w wybranym klastrze. Widok jest tworzony przy użyciu zdarzenia maszyny wirtualnej o identyfikatorze 3003 kanału dziennika zdarzeń systemu Windows Microsoft-Windows-SDDC-Management/Operational Windows Event Log Channel. Każdy wiersz można dodatkowo rozszerzyć, aby wyświetlić rozkład maszyn wirtualnych między węzłami w klastrze. Możesz wchodzić w interakcje z zasobem klastra i węzła, aby przejść do odpowiedniej strony zasobów.

Zrzut ekranu przedstawiający kondycję maszyn wirtualnych.

Metryczne opis Przykład
Węzeł klastra > Nazwa klastra. Po rozwinięciu są wyświetlane węzły w klastrze. Sample-VM-1
Ostatnia aktualizacja Znacznik czasu, kiedy węzeł był ostatnio aktualizowany. 4/9/2022, 12:24:02
Łączna liczba maszyn wirtualnych Liczba maszyn wirtualnych w węźle w klastrze. 1 z 2 działa
Bieganie Liczba maszyn wirtualnych uruchomionych w węźle w klastrze. 2
Zatrzymana Liczba maszyn wirtualnych zatrzymanych w węźle w klastrze. 3
Niepowodzenie Liczba maszyn wirtualnych, które uległy awarii w węźle w klastrze. 2
Inne Jeśli maszyna wirtualna znajduje się w jednym z następujących stanów (Nieznany, Uruchamianie, Robienie migawki, Zapisywanie, Zatrzymywanie, Wstrzymywanie, Wznawianie, Wstrzymane, Zawieszone), jest uznawana za "Inne". 2

Przechowywanie

Ten widok przedstawia kondycję woluminów, użycia i wydajności w monitorowanych klastrach. Rozwiń klaster, aby wyświetlić stan poszczególnych woluminów. Ten widok został utworzony przy użyciu identyfikatora zdarzenia woluminu 3002 z dziennika zdarzeń Microsoft-Windows-SDDC-Management/Operational Windows Event Log Channel. Kafelki w górnej części zawierają omówienie kondycji magazynu.

Zrzut ekranu przedstawiający kondycję woluminów magazynu.

Metryczne opis Przykład
Wolumin klastra > Nazwa klastra. Podczas rozszerzania pokazuje woluminy w klastrze. AltaylCluster1 > ClusterPerformanceHistory
Ostatnia aktualizacja Znacznik czasowy ostatniej aktualizacji przechowywania. 14.04.2022, 2:58:55
Kondycja woluminu Stan woluminu. Może być zdrowe, ostrzegawcze, krytyczne lub inne. Zdrowy
Rozmiar Łączna pojemność urządzenia w bajtach w okresie raportowania. 25 mld
Użycie Procent dostępnej pojemności w okresie raportowania. 23.54%
Iops Operacje wejścia/wyjścia na sekundę. 45 na sekundę
Tendencja Trend IOPS.
Produktywność Liczba bajtów na sekundę obsługiwana przez usługę Application Gateway. 5B/s
Trend (B/s) Trend przepływności.
Średnie opóźnienie Opóźnienie to średni czas potrzebny na ukończenie żądania we/wy. 334 μs

Dostosuj analizy

Ponieważ środowisko użytkownika jest oparte na szablonach skoroszytów usługi Azure Monitor, użytkownicy mogą edytować wizualizacje i zapytania i zapisywać je jako dostosowany skoroszyt.

Jeśli używasz wizualizacji z centrum Azure Monitor Insights Hub Azure Local, wybierz opcje Dostosuj, Edytuj, Zapisz jako, aby zapisać kopię zmodyfikowanej wersji w niestandardowym skoroszycie.

Skoroszyty są zapisywane w grupie zasobów. Wszyscy z dostępem do grupy zasobów mogą uzyskiwać dostęp do dostosowanego skoroszytu.

Większość zapytań jest zapisywanych przy użyciu język zapytań Kusto (KQL). Niektóre zapytania są zapisywane przy użyciu zapytania usługi Resource Graph. Aby uzyskać więcej informacji, zobacz następujące artykuły:

Wsparcie

Aby otworzyć bilet pomocy technicznej dla Insights, użyj typu Insights dla Azure Local w obszarze Monitorowanie i zarządzanie.

Kanał dziennika zdarzeń

Widoki analizy i monitorowania są oparte na kanale dziennika zdarzeń Microsoft-Windows-SDDC-Management/Operational. Po włączeniu monitorowania dane z tego kanału są zapisywane w obszarze roboczym usługi Log Analytics.

Wyświetlanie i zmienianie interwału pamięci podręcznej zrzutu

Domyślny interwał zrzutu pamięci podręcznej to 3600 sekund (1 godzina).

Użyj następujących poleceń cmdlet programu PowerShell, aby wyświetlić wartość interwału zrzutu pamięci podręcznej:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Użyj następujących poleceń cmdlet, aby zmienić częstotliwość zrzutu pamięci podręcznej. Jeśli ustawiono wartość 0, spowoduje to zatrzymanie publikowania zdarzeń:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Zdarzenia systemu Windows w kanale dziennika

Ten kanał zawiera pięć zdarzeń. Każde zdarzenie ma nazwę klastra i identyfikator usługi Azure Resource Manager jako EventData.

Identyfikator zdarzenia Typ zdarzenia
3000 Serwer
3001 Napęd
3002 Objętość
3003 Maszyna wirtualna
3004 Klaster

Wartość w kolumnie RenderedDescription dotycząca zdarzenia serwera 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Większość zmiennych jest oczywista na podstawie tych informacji w formacie JSON. W poniższej tabeli wymieniono jednak kilka zmiennych, które są nieco trudniejsze do zrozumienia.

Zmienna opis
m_servers Tablica węzłów.
m_statusCategory Stan kondycji węzła.
m_status Stan węzła. Jest to tablica, która może zawierać jedną lub dwie wartości. Pierwsza wartość jest obowiązkowa (0–4). Druga wartość jest opcjonalna (5–9).

Wartości zmiennej m_statusCategory są następujące:

Wartość Znaczenie
0 Zdrowy
1 Ostrzeżenie
2 Niezdrowy
255 Inne

Wartości zmiennej m_status są następujące:

Wartość Znaczenie
0 W górę
1 W dół
2 W konserwacji
3 Dołączenie
4 Normalna
5 Izolowana
6 Poddane kwarantannie
7 Opróżniania
8 Ukończono opróżnianie
9 Opróżnianie nie powiodło się
0xffff Nieznane

Zdarzenie sterownika 3001 Wartość kolumny RenderedDescription

Zdarzenie dysku 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Wartość kolumny RenderedDescription dla zdarzenia dotyczącego woluminu 3002

Zdarzenie woluminu 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Większość zmiennych jest oczywista na podstawie powyższych informacji JSON. Poniższa tabela zawiera jednak kilka zmiennych, które są nieco trudniejsze do zrozumienia.

Zmienna opis
VolumeList Tablica woluminów.
m_StatusCategory Stan kondycji woluminu.
m_Status Stan woluminu. Jest to tablica, która może zawierać jedną lub dwie wartości. Pierwsza wartość jest obowiązkowa (0–4). Druga wartość jest opcjonalna (5–9).

Wartości zmiennej m_statusCategory są następujące:

Wartość Znaczenie
0 Zdrowy
1 Ostrzeżenie
2 Niezdrowy
255 Inne

Wartości zmiennej m_status są następujące:

Wartość Znaczenie
0 Nieznane
1 Inne
2 OK
3 Wymaga naprawy
4 Zestresowany / Zestresowana
5 Niepowodzenie predykcyjne
6 Błąd
7 Błąd niemożliwy do odzyskania
8 Uruchamianie
9 Zatrzymywanie
10 Zatrzymana
11 W usłudze
12 Brak kontaktu
13 Utracona komunikacja
14 Zostało przerwane
15 Uśpiony
16 Podmiot wspierający w błędzie
17 Ukończone
18 Tryb zasilania i wydajności
19 Przeniesienie
0xD002 W dół
0xD003 Wymaga ponownej synchronizacji

Wartość kolumny RenderedDescription dla zdarzenia maszyny wirtualnej 3003

Zdarzenie maszyny wirtualnej 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Wartość kolumny RenderedDescription zdarzenia klastra 3004

Zdarzenie klastra 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Aby uzyskać więcej informacji na temat zebranych danych, zobacz Usterki usług zdrowotnych.

Następne kroki

Aby uzyskać powiązane informacje, zobacz: