Udostępnij za pośrednictwem


Rozwiązanie Agent Health w usłudze Azure Monitor

Rozwiązanie Agent Health na platformie Azure pomaga zrozumieć, którzy agenci monitorowania nie odpowiadają i przesyłają dane operacyjne. Obejmuje to wszystkich agentów, którzy raportują bezpośrednio do obszaru roboczego usługi Log Analytics w usłudze Azure Monitor lub do grupy zarządzania programu System Center Operations Manager połączonej z usługą Azure Monitor.

Możesz również użyć rozwiązania Agent Health, aby:

  • Śledź, ile agentów jest wdrażanych i gdzie są dystrybuowane geograficznie.
  • Wykonaj inne zapytania, aby zachować świadomość dystrybucji agentów wdrożonych na platformie Azure, w innych środowiskach w chmurze lub lokalnie.

Ważne

Rozwiązanie Agent Health monitoruje tylko kondycję agenta usługi Log Analytics, który jest przestarzały od 31 sierpnia 2024 r. To rozwiązanie nie monitoruje kondycji agenta usługi Azure Monitor.

Wymagania wstępne

Przed wdrożeniem tego rozwiązania upewnij się, że obsługa agentów systemu Windows jest obsługiwana w obszarze roboczym usługi Log Analytics lub raportowanie do grupy zarządzania programu Operations Manager zintegrowanej z obszarem roboczym.

Pakiety administracyjne

Jeśli grupa zarządzania programu Operations Manager jest połączona z obszarem roboczym usługi Log Analytics, w programie Operations Manager są instalowane następujące pakiety administracyjne. Te pakiety administracyjne są również instalowane na bezpośrednio połączonych komputerach z systemem Windows po dodaniu tego rozwiązania:

  • Microsoft System Center Advisor HealthAssessment Direct Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

Nie ma nic do skonfigurowania tych pakietów administracyjnych ani zarządzania nimi. Aby uzyskać więcej informacji na temat aktualizowania pakietów administracyjnych rozwiązania, zobacz artykuł Connect Operations Manager to Log Analytics (Połączenie programu Operations Manager z usługą Log Analytics).

Konfigurowanie

Dodaj rozwiązanie Agent Health do obszaru roboczego usługi Log Analytics przy użyciu procesu opisanego w temacie Dodawanie rozwiązań. Nie trzeba konfigurować niczego więcej.

Obsługiwani agenci

W poniższej tabeli opisano połączone źródła obsługiwane przez to rozwiązanie.

Połączone źródło Obsługiwane opis
Agenci dla systemu Windows Tak Zdarzenia pulsu są zbierane z bezpośrednich agentów systemu Windows.
Grupa zarządzania programu System Center Operations Manager Tak Zdarzenia pulsu są zbierane z agentów, którzy zgłaszają do grupy zarządzania co 60 sekund, a następnie są przekazywane do usługi Azure Monitor. Bezpośrednie połączenie agentów programu Operations Manager z usługą Azure Monitor nie jest wymagane. Dane zdarzenia pulsu są przekazywane z grupy zarządzania do obszaru roboczego usługi Log Analytics.

Korzystanie z rozwiązania

Po dodaniu rozwiązania do obszaru roboczego usługi Log Analytics kafelek Kondycja agenta zostanie dodany do pulpitu nawigacyjnego. Ten kafelek pokazuje całkowitą liczbę agentów oraz liczbę nieodpowiadających agentów w ciągu ostatnich 24 godzin.

Zrzut ekranu przedstawiający kafelek Kondycja agenta na pulpicie nawigacyjnym.

Wybierz kafelek Kondycja agenta, aby otworzyć pulpit nawigacyjny kondycji agenta. Na pulpicie nawigacyjnym znajdują się kolumny wymienione w poniższej tabeli. Każda kolumna zawiera listę 10 najważniejszych zdarzeń według liczby, które spełniają kryteria tej kolumny dla określonego zakresu czasu. Możesz uruchomić wyszukiwanie w dziennikach, które zawiera całą listę. Wybierz pozycję Zobacz wszystkie pod każdą kolumną lub wybierz nagłówek kolumny.

Kolumna opis
Liczba agentów w miarę upływu czasu Trend liczby agentów w ciągu siedmiu dni dla agentów systemów Linux i Windows
Liczba nieodpowiadających agentów Lista agentów, którzy nie wysłali pulsu w ciągu ostatnich 24 godzin
Rozkład według typu systemu operacyjnego Partycja liczby agentów systemu Windows i Linux w środowisku
Dystrybucja według wersji agenta Partycja wersji agenta zainstalowanych w danym środowisku i liczba z nich
Dystrybucja według kategorii agentów Partycja kategorii agentów wysyłających zdarzenia pulsu: agentów bezpośrednich, agentów programu Operations Manager lub serwera zarządzania programu Operations Manager
Dystrybucja według grupy zarządzania Partycja grup zarządzania programu Operations Manager w danym środowisku
Lokalizacja geograficzna agentów Partycja krajów/regionów, w których masz agentów, oraz łączna liczba agentów zainstalowanych w każdym kraju/regionie
Liczba zainstalowanych bram Liczba serwerów z zainstalowaną bramą usługi Log Analytics oraz lista tych serwerów

Zrzut ekranu przedstawiający przykład pulpitu nawigacyjnego rozwiązania Agent Health.

Rekordy dziennika usługi Azure Monitor

Rozwiązanie tworzy jeden typ rekordu w obszarze roboczym usługi Log Analytics: puls. Rekordy pulsu mają właściwości wymienione w poniższej tabeli.

Właściwości opis
Type Heartbeat
Category Direct Agent, SCOM Agent lub SCOM Management Server
Computer Nazwa komputera
OSType System operacyjny Windows lub Linux
OSMajorVersion Wersja główna systemu operacyjnego
OSMinorVersion Wersja pomocnicza systemu operacyjnego
Version Wersja agenta usługi Log Analytics lub agenta programu Operations Manager
SCAgentChannel Direct i/lub SCManagementServer
IsGatewayInstalled true jeśli brama usługi Log Analytics jest zainstalowana; inaczej false
ComputerIP Publiczny adres IP maszyny wirtualnej platformy Azure, jeśli jest dostępny; Adres SNAT platformy Azure (nie prywatny adres IP) dla maszyny wirtualnej korzystającej z prywatnego adresu IP
ComputerPrivateIPs Lista prywatnych adresów IP komputera
RemoteIPCountry Lokalizacja geograficzna, w której wdrożono komputer
ManagementGroupName Nazwa grupy zarządzania programu Operations Manager
SourceComputerId Unikatowy identyfikator komputera
RemoteIPLongitude Długość geograficzna lokalizacji geograficznej komputera
RemoteIPLatitude Szerokość geograficzna lokalizacji geograficznej komputera

Każdy agent, który raportuje do serwera zarządzania programu Operations Manager, będzie wysyłał dwa pulsy. Wartość SCAgentChannel właściwości będzie zawierać wartości i Direct SCManagementServer, w zależności od źródeł danych i rozwiązań do monitorowania, które zostały włączone w ramach subskrypcji.

Jeśli pamiętasz, dane z rozwiązań są wysyłane:

  • Bezpośrednio z serwera zarządzania programu Operations Manager do usługi Azure Monitor.
  • Bezpośrednio z agenta do usługi Azure Monitor ze względu na ilość danych zebranych na agencie.

W przypadku zdarzeń pulsu, które mają wartość SCManagementServer, wartość jest adresem IP serwera zarządzania, ComputerIP ponieważ faktycznie przekazuje dane. W przypadku pulsów, w których SCAgentChannel ustawiono wartość Direct, jest to publiczny adres IP agenta.

Przykładowe przeszukiwania dzienników

W poniższej tabeli przedstawiono przykładowe wyszukiwanie dzienników dla rekordów zbieranych przez rozwiązanie.

Query opis
Puls | distinct Computer Łączna liczba agentów
Puls | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(24h) Liczba nieodpowiadających agentów w ciągu ostatnich 24 godzin
Puls | summarize LastCall = max(TimeGenerated) by Computer | gdzie LastCall < ago(15m) Liczba nieodpowiadających agentów w ciągu ostatnich 15 minut
Puls | where TimeGenerated > ago(24h) and Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Komputery w trybie online w ciągu ostatnich 24 godzin
Puls | where TimeGenerated > ago(24h) i Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Łączna liczba agentów w trybie offline w ciągu ostatnich 30 minut (przez ostatnie 24 godziny)
Puls | summarize AggregatedValue = dcount(Computer) by OSType Trend liczby agentów w czasie według typu systemu operacyjnego
Puls | summarize AggregatedValue = dcount(Computer) by OSType Rozkład według typu systemu operacyjnego
Puls | summarize AggregatedValue = dcount(Computer) by Version Dystrybucja według wersji agenta
Puls | summarize AggregatedValue = count() by Category Dystrybucja według kategorii agentów
Puls | summarize AggregatedValue = dcount(Computer) by ManagementGroupName Dystrybucja według grupy zarządzania
Puls | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry Lokalizacja geograficzna agentów
Puls | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer Liczba zainstalowanych bram usługi Log Analytics

Następne kroki

Dowiedz się więcej o generowaniu alertów z zapytań dzienników w usłudze Azure Monitor.