Rozwiązanie Agent Health w usłudze Azure Monitor
Rozwiązanie Agent Health na platformie Azure pomaga zrozumieć, którzy agenci monitorowania nie odpowiadają i przesyłają dane operacyjne. Obejmuje to wszystkich agentów, którzy raportują bezpośrednio do obszaru roboczego usługi Log Analytics w usłudze Azure Monitor lub do grupy zarządzania programu System Center Operations Manager połączonej z usługą Azure Monitor.
Możesz również użyć rozwiązania Agent Health, aby:
- Śledź, ile agentów jest wdrażanych i gdzie są dystrybuowane geograficznie.
- Wykonaj inne zapytania, aby zachować świadomość dystrybucji agentów wdrożonych na platformie Azure, w innych środowiskach w chmurze lub lokalnie.
Ważne
Rozwiązanie Agent Health monitoruje tylko kondycję agenta usługi Log Analytics, który jest przestarzały od 31 sierpnia 2024 r. To rozwiązanie nie monitoruje kondycji agenta usługi Azure Monitor.
Wymagania wstępne
Przed wdrożeniem tego rozwiązania upewnij się, że obsługa agentów systemu Windows jest obsługiwana w obszarze roboczym usługi Log Analytics lub raportowanie do grupy zarządzania programu Operations Manager zintegrowanej z obszarem roboczym.
Pakiety administracyjne
Jeśli grupa zarządzania programu Operations Manager jest połączona z obszarem roboczym usługi Log Analytics, w programie Operations Manager są instalowane następujące pakiety administracyjne. Te pakiety administracyjne są również instalowane na bezpośrednio połączonych komputerach z systemem Windows po dodaniu tego rozwiązania:
- Microsoft System Center Advisor HealthAssessment Direct Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentDirect)
- Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)
Nie ma nic do skonfigurowania tych pakietów administracyjnych ani zarządzania nimi. Aby uzyskać więcej informacji na temat aktualizowania pakietów administracyjnych rozwiązania, zobacz artykuł Connect Operations Manager to Log Analytics (Połączenie programu Operations Manager z usługą Log Analytics).
Konfigurowanie
Dodaj rozwiązanie Agent Health do obszaru roboczego usługi Log Analytics przy użyciu procesu opisanego w temacie Dodawanie rozwiązań. Nie trzeba konfigurować niczego więcej.
Obsługiwani agenci
W poniższej tabeli opisano połączone źródła obsługiwane przez to rozwiązanie.
Połączone źródło | Obsługiwane | opis |
---|---|---|
Agenci dla systemu Windows | Tak | Zdarzenia pulsu są zbierane z bezpośrednich agentów systemu Windows. |
Grupa zarządzania programu System Center Operations Manager | Tak | Zdarzenia pulsu są zbierane z agentów, którzy zgłaszają do grupy zarządzania co 60 sekund, a następnie są przekazywane do usługi Azure Monitor. Bezpośrednie połączenie agentów programu Operations Manager z usługą Azure Monitor nie jest wymagane. Dane zdarzenia pulsu są przekazywane z grupy zarządzania do obszaru roboczego usługi Log Analytics. |
Korzystanie z rozwiązania
Po dodaniu rozwiązania do obszaru roboczego usługi Log Analytics kafelek Kondycja agenta zostanie dodany do pulpitu nawigacyjnego. Ten kafelek pokazuje całkowitą liczbę agentów oraz liczbę nieodpowiadających agentów w ciągu ostatnich 24 godzin.
Wybierz kafelek Kondycja agenta, aby otworzyć pulpit nawigacyjny kondycji agenta. Na pulpicie nawigacyjnym znajdują się kolumny wymienione w poniższej tabeli. Każda kolumna zawiera listę 10 najważniejszych zdarzeń według liczby, które spełniają kryteria tej kolumny dla określonego zakresu czasu. Możesz uruchomić wyszukiwanie w dziennikach, które zawiera całą listę. Wybierz pozycję Zobacz wszystkie pod każdą kolumną lub wybierz nagłówek kolumny.
Kolumna | opis |
---|---|
Liczba agentów w miarę upływu czasu | Trend liczby agentów w ciągu siedmiu dni dla agentów systemów Linux i Windows |
Liczba nieodpowiadających agentów | Lista agentów, którzy nie wysłali pulsu w ciągu ostatnich 24 godzin |
Rozkład według typu systemu operacyjnego | Partycja liczby agentów systemu Windows i Linux w środowisku |
Dystrybucja według wersji agenta | Partycja wersji agenta zainstalowanych w danym środowisku i liczba z nich |
Dystrybucja według kategorii agentów | Partycja kategorii agentów wysyłających zdarzenia pulsu: agentów bezpośrednich, agentów programu Operations Manager lub serwera zarządzania programu Operations Manager |
Dystrybucja według grupy zarządzania | Partycja grup zarządzania programu Operations Manager w danym środowisku |
Lokalizacja geograficzna agentów | Partycja krajów/regionów, w których masz agentów, oraz łączna liczba agentów zainstalowanych w każdym kraju/regionie |
Liczba zainstalowanych bram | Liczba serwerów z zainstalowaną bramą usługi Log Analytics oraz lista tych serwerów |
Rekordy dziennika usługi Azure Monitor
Rozwiązanie tworzy jeden typ rekordu w obszarze roboczym usługi Log Analytics: puls. Rekordy pulsu mają właściwości wymienione w poniższej tabeli.
Właściwości | opis |
---|---|
Type |
Heartbeat |
Category |
Direct Agent , SCOM Agent lub SCOM Management Server |
Computer |
Nazwa komputera |
OSType |
System operacyjny Windows lub Linux |
OSMajorVersion |
Wersja główna systemu operacyjnego |
OSMinorVersion |
Wersja pomocnicza systemu operacyjnego |
Version |
Wersja agenta usługi Log Analytics lub agenta programu Operations Manager |
SCAgentChannel |
Direct i/lub SCManagementServer |
IsGatewayInstalled |
true jeśli brama usługi Log Analytics jest zainstalowana; inaczej false |
ComputerIP |
Publiczny adres IP maszyny wirtualnej platformy Azure, jeśli jest dostępny; Adres SNAT platformy Azure (nie prywatny adres IP) dla maszyny wirtualnej korzystającej z prywatnego adresu IP |
ComputerPrivateIPs |
Lista prywatnych adresów IP komputera |
RemoteIPCountry |
Lokalizacja geograficzna, w której wdrożono komputer |
ManagementGroupName |
Nazwa grupy zarządzania programu Operations Manager |
SourceComputerId |
Unikatowy identyfikator komputera |
RemoteIPLongitude |
Długość geograficzna lokalizacji geograficznej komputera |
RemoteIPLatitude |
Szerokość geograficzna lokalizacji geograficznej komputera |
Każdy agent, który raportuje do serwera zarządzania programu Operations Manager, będzie wysyłał dwa pulsy. Wartość SCAgentChannel
właściwości będzie zawierać wartości i Direct
SCManagementServer
, w zależności od źródeł danych i rozwiązań do monitorowania, które zostały włączone w ramach subskrypcji.
Jeśli pamiętasz, dane z rozwiązań są wysyłane:
- Bezpośrednio z serwera zarządzania programu Operations Manager do usługi Azure Monitor.
- Bezpośrednio z agenta do usługi Azure Monitor ze względu na ilość danych zebranych na agencie.
W przypadku zdarzeń pulsu, które mają wartość SCManagementServer
, wartość jest adresem IP serwera zarządzania, ComputerIP
ponieważ faktycznie przekazuje dane. W przypadku pulsów, w których SCAgentChannel
ustawiono wartość Direct
, jest to publiczny adres IP agenta.
Przykładowe przeszukiwania dzienników
W poniższej tabeli przedstawiono przykładowe wyszukiwanie dzienników dla rekordów zbieranych przez rozwiązanie.
Query | opis |
---|---|
Puls | distinct Computer | Łączna liczba agentów |
Puls | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(24h) | Liczba nieodpowiadających agentów w ciągu ostatnich 24 godzin |
Puls | summarize LastCall = max(TimeGenerated) by Computer | gdzie LastCall < ago(15m) | Liczba nieodpowiadających agentów w ciągu ostatnich 15 minut |
Puls | where TimeGenerated > ago(24h) and Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer | Komputery w trybie online w ciągu ostatnich 24 godzin |
Puls | where TimeGenerated > ago(24h) i Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer | Łączna liczba agentów w trybie offline w ciągu ostatnich 30 minut (przez ostatnie 24 godziny) |
Puls | summarize AggregatedValue = dcount(Computer) by OSType | Trend liczby agentów w czasie według typu systemu operacyjnego |
Puls | summarize AggregatedValue = dcount(Computer) by OSType | Rozkład według typu systemu operacyjnego |
Puls | summarize AggregatedValue = dcount(Computer) by Version | Dystrybucja według wersji agenta |
Puls | summarize AggregatedValue = count() by Category | Dystrybucja według kategorii agentów |
Puls | summarize AggregatedValue = dcount(Computer) by ManagementGroupName | Dystrybucja według grupy zarządzania |
Puls | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry | Lokalizacja geograficzna agentów |
Puls | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer | Liczba zainstalowanych bram usługi Log Analytics |
Następne kroki
Dowiedz się więcej o generowaniu alertów z zapytań dzienników w usłudze Azure Monitor.