Projekt Flash — monitorowanie dostępności maszyny wirtualnej platformy Azure przy użyciu usługi Azure Resource Graph

Artykuł
08/24/2024

Azure Resource Graph to jedno rozwiązanie oferowane przez program Flash. Flash to wewnętrzna nazwa projektu przeznaczona do tworzenia niezawodnego, niezawodnego i szybkiego mechanizmu monitorowania kondycji maszyny wirtualnej przez klientów.

W tym artykule opisano korzystanie z usługi Azure Resource Graph do monitorowania dostępności maszyny wirtualnej platformy Azure. Aby zapoznać się z ogólnym omówieniem rozwiązań Flash, zobacz Omówienie programu Flash.

Aby uzyskać dokumentację specyficzną dla innych rozwiązań oferowanych przez program Flash, wybierz następujące artykuły:

Azure Resource Graph — HealthResources

Ta funkcja jest obecnie ogólnie dostępna. Jest to przydatne w przypadku przeprowadzania badań na dużą skalę. Oferuje bardzo przyjazne dla użytkownika środowisko pobierania informacji przy użyciu języka zapytań Kusto (KQL). Może również służyć jako centralne centrum informacji o zasobach i umożliwia łatwe pobieranie danych historycznych.

Oprócz już przepływających stanów dostępności maszyn wirtualnych opublikowaliśmy adnotacje dotyczące dostępności maszyn wirtualnych w usłudze Azure Resource Graph (ARG) na potrzeby szczegółowego przypisania błędów i analizy przestojów oraz włączenia 14-dniowego mechanizmu śledzenia zmian w celu śledzenia historycznych zmian dostępności maszyny wirtualnej w celu szybkiego debugowania. Dzięki tym nowym dodaniu z przyjemnością ogłaszamy ogólną dostępność informacji o dostępności maszyn wirtualnych w zestawie danych HealthResources w usłudze ARG! Dzięki tej ofercie użytkownicy mogą wykonywać następujące czynności:

Wydajne wykonywanie zapytań dotyczących najnowszej migawki dostępności maszyn wirtualnych we wszystkich subskrypcjach platformy Azure jednocześnie i przy małych opóźnieniach w celu okresowego i ulotnego monitorowania.
Dokładnie oceń wpływ na umowy SLA biznesowe dla całej floty i szybko wyzwól zdecydowane działania zaradcze w odpowiedzi na zakłócenia i typ podpisu awarii.
Skonfiguruj niestandardowe pulpity nawigacyjne, aby nadzorować kompleksową kondycję aplikacji przez dołączenie informacji o dostępności maszyny wirtualnej z metadanymi zasobów obecnymi w usłudze ARG.
Śledzenie istotnych zmian dostępności maszyn wirtualnych w kroczącym 14-dniowym przedziale czasu przy użyciu mechanizmu śledzenia zmian do przeprowadzania szczegółowych badań.

Przykładowe zapytania

Rozpocznij

Użytkownicy mogą wykonywać zapytania dotyczące usługi ARG za pośrednictwem programu PowerShell, interfejsu API REST, interfejsu wiersza polecenia platformy Azure, a nawet witryny Azure Portal. Poniższe kroki szczegółowo opisują sposób uzyskiwania dostępu do danych w witrynie Azure Portal.

Po przejściu do witryny Azure Portal przejdź do Eksploratora usługi Resource Graph.
Wybierz kartę Tabela i (pojedyncza) kliknij tabelę HealthResources, aby pobrać najnowszą migawkę informacji o dostępności maszyny wirtualnej (stan dostępności i adnotacje dotyczące kondycji).

W tabeli HealthResources są wypełniane dwa typy zdarzeń:

resourcehealth/availabilitystatuses

To zdarzenie oznacza najnowszy stan dostępności maszyny wirtualnej na podstawie kontroli kondycji wykonywanych przez podstawową platformę Azure. Stany dostępności, które obecnie emitujemy dla maszyn wirtualnych, to:

Dostępne: maszyna wirtualna jest uruchomiona zgodnie z oczekiwaniami.
Niedostępne: Wykryliśmy zakłócenia normalnego działania maszyny wirtualnej, a zatem aplikacje nie będą działać zgodnie z oczekiwaniami.
Nieznany: platforma nie może dokładnie wykryć kondycji maszyny wirtualnej. Użytkownicy mogą zwykle zaewidencjonować stan aktualizacji w ciągu kilku minut.

Aby sondować najnowszy stan dostępności maszyny wirtualnej, zapoznaj się z polem właściwości, które zawiera następujące szczegóły:

Przykład

{
 "targetResourceType": "Microsoft.Compute/virtualMachines",
 "previousAvailabilityState": "Available",
 "targetResourceId": "/subscriptions//resourceGroups//providers/Microsoft.Compute/virtualMachines/",
 "occurredTime": "2022-10-11T11:13:59.9570000Z",
 "availabilityState": "Unavailable"
 }

Opis właściwości

Właściwości	Opis	Odpowiadająca kategoria kondycji zasobów (RHC)
targetResourceType	Typ zasobu, dla którego przepływają dane dotyczące kondycji	resourceType
targetResourceId	Identyfikator zasobu	resourceId
occurredTime	Sygnatura czasowa, gdy platforma emituje najnowszy stan dostępności	eventTimestamp
previousAvailabilityState	Poprzedni stan dostępności maszyny wirtualnej	previousHealthStatus
availabilityState	Bieżący stan dostępności maszyny wirtualnej	currentHealthStatus

Zapoznaj się z sekcją HealthResources w dokumentacji zapytań dotyczących przykładów, aby zapoznać się z listą zapytań początkowych, aby dokładniej zapoznać się z danymi.

resourcehealth/resourceannotations (NOWO DODANE)

To zdarzenie kontekstuje wszelkie zmiany dostępności maszyny wirtualnej, szczegółowo określając niezbędne atrybuty błędów, aby ułatwić użytkownikom badanie i eliminowanie zakłóceń w razie potrzeby. Zobacz pełną listę adnotacji dostępności maszyn wirtualnych emitowanych przez platformę. Te adnotacje mogą być szeroko klasyfikowane w trzech zasobnikach:

Adnotacje przestojów: te adnotacje są emitowane, gdy platforma wykryje przejście dostępności maszyny wirtualnej do niedostępnej. (Na przykład podczas nieoczekiwanych awarii hosta ponowne uruchomienie operacji naprawy).
Adnotacje informacyjne: te adnotacje są emitowane podczas działań płaszczyzny sterowania bez wpływu na dostępność maszyny wirtualnej. (Na przykład alokacja maszyny wirtualnej/zatrzymywanie/usuwanie/uruchamianie). Zwykle w odpowiedzi nie są wymagane żadne dalsze działania klienta.
Adnotacje o obniżonej wydajności: te adnotacje są emitowane, gdy dostępność maszyny wirtualnej jest zagrożona. (Na przykład gdy modele przewidywania błędów przewidują obniżoną sprawność składnika sprzętowego, który może spowodować ponowne uruchomienie maszyny wirtualnej w danym momencie). Zdecydowanie zachęcamy użytkowników do ponownego wdrożenia do terminu określonego w komunikacie adnotacji, aby uniknąć nieprzewidzianej utraty danych lub przestoju. W jednym z następujących scenariuszy może zostać wyświetlony alert w usłudze Resource Health lub Dziennik aktywności zestawów skalowania maszyn wirtualnych platformy Azure:
- Maszyny wirtualne w zestawach skalowania maszyn wirtualnych platformy Azure są w trakcie zatrzymywania, cofania przydziału, usuwania lub uruchamiania.
- Wykonano skalowanie w operacjach w poziomie lub w zestawach skalowania maszyn wirtualnych.
- Alert wskazuje, że zagregowana kondycja platformy zestawów skalowania maszyn wirtualnych jest w stanie przejściowym "Obniżona wydajność".

Aby sondować skojarzone adnotacje dotyczące dostępności maszyny wirtualnej dla zasobu, jeśli istnieje, zapoznaj się z polem właściwości, które zawiera następujące szczegóły:

Przykład

{
 "targetResourceType": "Microsoft.Compute/virtualMachines", "targetResourceId": "/subscriptions//resourceGroups//providers/Microsoft.Compute/virtualMachines/",
 "annotationName": "VirtualMachineHostRebootedForRepair",
 "occurredTime": "2022-09-25T20:21:37.5280000Z",
 "category": "Unplanned",
 "summary": "We're sorry, your virtual machine isn't available because an unexpected failure on the host server. Azure has begun the auto-recovery process and is currently rebooting the host server. No further action is required from you at this time. The virtual machine will be back online after the reboot completes.",
 "context": "Platform Initiated",
 "reason": "Unexpected host failure"
 }

Opis właściwości

Właściwości	Opis	Odpowiedni rhC
targetResourceType	Typ zasobu, dla którego przepływają dane dotyczące kondycji	resourceType
targetResourceId	Identyfikator zasobu	resourceId
occurredTime	Sygnatura czasowa, gdy najnowszy stan dostępności jest emitowany przez platformę	eventTimestamp
annotationName	Nazwa emitowanego adnotacji	eventName
reason	Krótkie omówienie wpływu dostępności obserwowanego przez klienta	title
category	Określa, czy działanie platformy, które wyzwoliło adnotację, było planowaną konserwacją, czy nieplanowaną naprawą. To pole nie ma zastosowania do zdarzeń zainicjowanych przez klienta/maszynę wirtualną. Możliwe wartości: Planned, Unplanned, Not Applicable, Null	category
kontekst	Wskazuje, czy działanie, które wyzwoliło adnotację, było spowodowane autoryzowanym użytkownikiem lub procesem (zainicjowanym przez klienta), platformą Azure (zainicjowaną przez platformę) lub działaniem w systemie operacyjnym gościa, które spowodowało wpływ dostępności (zainicjowane przez maszynę wirtualną). Możliwe wartości: zainicjowane przez platformę, zainicjowane przez użytkownika, zainicjowane przez maszynę wirtualną, nie dotyczy, null	kontekst
Podsumowanie	Instrukcja szczegółowo opisując przyczynę emisji adnotacji wraz z krokami korygowania, które użytkownicy mogą wykonać	Podsumowanie

Zapoznaj się z sekcją HealthResources w dokumentacji zapytań dotyczących przykładów, aby zapoznać się z listą zapytań początkowych, aby dokładniej zapoznać się z danymi.

Zaplanowano wiele ulepszeń metadanych adnotacji, które są udostępniane w zestawie danych HealthResources. Te wzbogacenia zapewniają użytkownikom dostęp do bogatszych atrybutów błędów, aby zdecydowanie przygotować odpowiedź na zakłócenia. Równolegle dążymy do wydłużenia czasu trwania wyszukiwania historycznego do co najmniej 30 dni, aby użytkownicy mogli kompleksowo śledzić wcześniejsze zmiany dostępności maszyn wirtualnych.

Następne kroki

Aby dowiedzieć się więcej o oferowanych rozwiązaniach, przejdź do odpowiedniego artykułu dotyczącego rozwiązania:

Aby zapoznać się z ogólnym omówieniem monitorowania maszyn wirtualnych platformy Azure, zobacz Monitorowanie maszyn wirtualnych platformy Azure i dokumentacja monitorowania maszyn wirtualnych platformy Azure.

Udostępnij za pośrednictwem

Projekt Flash — monitorowanie dostępności maszyny wirtualnej platformy Azure przy użyciu usługi Azure Resource Graph

Azure Resource Graph — HealthResources

Przykładowe zapytania

Rozpocznij

Przykład

Opis właściwości

Przykład

Opis właściwości

Następne kroki

Opinia

Dodatkowe zasoby