Udostępnij za pośrednictwem


Rozwiązywanie problemów z alertami dotyczącymi metryk usługi Azure Monitor

W tym artykule omówiono typowe pytania dotyczące alertów metryk usługi Azure Monitor i sposobu ich rozwiązywania.

Alerty usługi Azure Monitor proaktywnie powiadamiają o znalezieniu ważnych warunków w danych monitorowania. Umożliwiają one identyfikowanie i rozwiązywanie problemów przed ich zauważeniem przez użytkowników systemu. Aby uzyskać więcej informacji na temat alertów, zobacz Omówienie alertów na platformie Microsoft Azure.

Alert metryki nie został wyzwolony, gdy powinien

Jeśli uważasz, że alert dotyczący metryki powinien zostać wyzwolony, ale nie został on wyświetlony w witrynie Azure Portal, spróbuj wykonać następujące czynności:

  1. Przejrzyj konfigurację reguły alertu metryki.

    • Sprawdź, czy typ agregacji i stopień szczegółowości agregacji (okres) są skonfigurowane zgodnie z oczekiwaniami. Typ agregacji określa sposób agregacji wartości metryk. Aby dowiedzieć się więcej, zobacz Omówienie agregacji i wyświetlania metryk usługi Azure Monitor. Stopień szczegółowości agregacji (okres) określa, jak daleko wstecz ocena agreguje wartości metryk przy każdym uruchomieniu reguły alertu.

    • Sprawdź, czy wartość progowa lub ważność są skonfigurowane zgodnie z oczekiwaniami.

    • W przypadku reguły alertu korzystającej z progów dynamicznych sprawdź, czy są skonfigurowane ustawienia zaawansowane. Liczba naruszeń może filtrować alerty i ignorować dane, zanim będzie mieć wpływ na sposób obliczania progów.

      Uwaga

      Progi dynamiczne wymagają co najmniej 3 dni i 30 próbek metryk, zanim staną się aktywne.

  2. Sprawdź, czy alert został wyzwolony, ale nie wysłał powiadomienia.

    Przejrzyj listę wyzwolonych alertów, aby sprawdzić, czy możesz zlokalizować wyzwolony alert. Jeśli na liście widzisz alert, ale masz problem z niektórymi jego akcjami lub powiadomieniami, zobacz Rozwiązywanie problemów w alertach usługi Azure Monitor.

  3. Sprawdź, czy alert jest już aktywny.

    Sprawdź, czy w serii czasowej metryki jest już wyzwolony alert, dla którego oczekiwano otrzymania alertu. Alerty dotyczące metryk są domyślnie stanowe, co oznacza, że po wyzwoleniu alertu w określonej serii czasowej metryki więcej alertów dotyczących tej serii czasowej nie zostanie wyzwolonych, dopóki problem nie zostanie już zaobserwowany. Ten wybór projektu zmniejsza szum. Alert jest automatycznie rozwiązany, gdy warunek alertu nie zostanie spełniony w trakcie trzech kolejnych ocen.

  4. Sprawdź używane wymiary.

    Jeśli wybrano kilka wartości wymiarów dla metryki, reguła alertu monitoruje poszczególne szeregi czasowe metryki (zgodnie z kombinacją wartości wymiarów) pod kątem naruszenia progu. Aby również monitorować zagregowane szeregi czasowe metryki bez wybranych wymiarów, skonfiguruj kolejną regułę alertu dla metryki bez wybierania wymiarów.

  5. Sprawdź stopień szczegółowości agregacji i czasu.

    Jeśli używasz wykresów metryk, upewnij się, że:

    • Wybrana opcja Agregacja na wykresie metryki jest taka sama jak typ agregacji w regule alertu.
    • Wybrany stopień szczegółowości czasu jest taki sam jak stopień szczegółowości agregacji (okres) w regule alertu i nie jest ustawiony na Wartość Automatyczna.
  6. Sprawdź, czy reguła alertu nie ma pierwszego okresu oceny w szeregach czasowych.

    Możesz zmniejszyć prawdopodobieństwo braku pierwszej oceny dodanych szeregów czasowych, upewniając się, że wybrano stopień szczegółowości agregacji (okres), który jest większy niż częstotliwość oceny w następujących przypadkach:

    • Po dodaniu nowej kombinacji wartości wymiaru do reguły alertu metryki, która monitoruje wiele wymiarów.
    • Po dodaniu nowego zasobu do zakresu do reguły alertu metryki, która monitoruje wiele zasobów.
    • Gdy metryka jest emitowana po okresie dłuższym niż 24 godziny, w którym nie była emitowana dla reguły alertu dotyczącego metryk, która monitoruje metrykę, która nie jest emitowana w sposób ciągły (metryka rozrzedzona).

Alert metryki nie jest wyzwalany za każdym razem, gdy warunek zostanie spełniony

Alerty metryk są domyślnie stanowe, więc inne alerty nie są wyzwalane, jeśli w określonym szeregu czasowym jest już wyzwolony alert. Aby ustawić konkretną regułę alertu metryki bezstanową i otrzymywać alerty dotyczące każdej oceny, w której jest spełniony warunek alertu, użyj jednej z następujących opcji:

  • Jeśli tworzysz regułę alertu programowo, na przykład za pomocą usługi Azure Resource Manager, programu PowerShell, rest lub interfejsu wiersza polecenia platformy Azure, ustaw autoMitigate właściwość na False.

  • Jeśli utworzysz regułę alertu w witrynie Azure Portal, wyczyść opcję Automatycznie rozwiąż alerty w sekcji Szczegóły reguły alertu. Częstotliwość powiadomień dotyczących alertów metryk bezstanowych różni się w zależności od skonfigurowanej częstotliwości reguły alertu:

  • Częstotliwość alertów mniejsza niż 5 minut: gdy warunek będzie nadal spełniony, powiadomienie jest wysyłane gdzieś między jedną a sześcioma minutami.

  • Częstotliwość alertów większa niż 5 minut: podczas gdy warunek będzie nadal spełniony, między skonfigurowaną częstotliwością a dwukrotnie większą częstotliwością jest wysyłane powiadomienie. Na przykład w przypadku reguły alertu z częstotliwością 15 minut powiadomienie jest wysyłane gdzieś od 15 do 30 minut.

Uwaga

Tworzenie bezstanowej reguły alertu metryki uniemożliwia rozwiązywanie problemów z wyzwolonych alertów. Tak więc, nawet po spełnieniu warunku, wyzwolone alerty pozostają w stanie wyzwolony do 30-dniowego okresu przechowywania.

Reguła alertu metryki z progiem dynamicznym nie jest wystarczająca

Może wystąpić reguła alertu, która używa progów dynamicznych, nie jest uruchamiana lub nie jest wystarczająco wrażliwa, mimo że jest skonfigurowana z wysoką poufnością. Może się tak zdarzyć, gdy rozkład metryki jest bardzo nieregularny. Rozważ jedno z następujących rozwiązań, aby rozwiązać ten problem:

  • Przejdź do monitorowania uzupełniającej metryki, która jest odpowiednia dla danego scenariusza, jeśli ma to zastosowanie. Na przykład sprawdź zmiany współczynnika powodzenia, a nie współczynnik niepowodzeń.
  • Spróbuj wybrać inną wartość dla stopnia szczegółowości agregacji (okres).
  • Sprawdź, czy w ciągu ostatnich 10 dni nastąpiła drastyczna zmiana zachowania metryki, taka jak awaria. Nagłe zmiany mogą mieć wpływ na górne i niższe progi obliczone dla metryki i uczynić je szerszymi. Poczekaj kilka dni, aż awaria nie zostanie już uwzględniona w obliczeniu progów. Możesz również edytować regułę alertu, aby użyć opcji Ignoruj dane przed w ustawieniach zaawansowanych.
  • Jeśli dane mają cotygodniową sezonowość, ale za mało historii jest dostępna dla metryki, obliczone progi mogą spowodować posiadanie szerokich granic górnej i dolnej. Na przykład obliczenie może traktować dni robocze i weekendy w taki sam sposób i tworzyć szerokie granice, które nie zawsze pasują do danych. Ten problem powinien zostać rozwiązany po udostępnieniu wystarczającej liczby historii metryk. Następnie wykryto poprawną sezonowość i odpowiednio zaktualizuje obliczone progi.

Alert dotyczący metryki został wyzwolony, mimo że nie powinien

Jeśli uważasz, że alert dotyczący metryki nie powinien zostać wyzwolony, ale tak, poniższe kroki mogą pomóc rozwiązać ten problem.

  1. Przejrzyj listę wyzwolonych alertów, aby zlokalizować wyzwolony alert. Wybierz alert, aby wyświetlić jego szczegóły. Przejrzyj informacje podane w obszarze Dlaczego ten alert został wyzwolony? aby wyświetlić wykres metryki, wartość metryki i wartość progową w momencie wyzwolenia alertu.

    Uwaga

    Jeśli używasz progów dynamicznych i uważasz, że progi nie są poprawne, prześlij opinię przy użyciu ikony frown. Ta opinia wpływa na badania algorytmiczne uczenia maszynowego i pomoże poprawić przyszłe wykrywanie.

  2. Jeśli wybrano wiele wartości wymiarów dla metryki, alert zostanie wyzwolony, gdy którykolwiek z szeregów czasowych metryki (zdefiniowanych przez kombinację wartości wymiarów) narusza próg. Aby uzyskać więcej informacji na temat używania wymiarów w alertach metryk, zobacz Zawężanie celu przy użyciu wymiarów.

  3. Przejrzyj konfigurację reguły alertu, aby upewnić się, że jest ona prawidłowo skonfigurowana:

    • Sprawdź, czy typ agregacji, stopień szczegółowości agregacji (okres) i Wartość progowa lub Ważność są skonfigurowane zgodnie z oczekiwaniami.
    • W przypadku reguły alertu korzystającej z progów dynamicznych sprawdź, czy ustawienia zaawansowane są skonfigurowane, ponieważ liczba naruszeń może filtrować alerty i ignorować dane, zanim będą mogły mieć wpływ na sposób obliczania progów.

    Uwaga

    Progi dynamiczne wymagają co najmniej 3 dni i 30 próbek metryk, zanim staną się aktywne.

  4. Jeśli używasz wykresów metryk, upewnij się, że:

    • Wybrana opcja Agregacja na wykresie metryki jest taka sama jak typ agregacji w regule alertu.
    • Wybrany stopień szczegółowości czasu jest taki sam jak stopień szczegółowości agregacji (okres) w regule alertu i że nie jest ustawiony na Wartość Automatyczna.
  5. Jeśli alert został wyzwolony, gdy istnieją już wyzwolone alerty, które monitorują te same kryteria, które nie zostały rozwiązane, sprawdź, czy reguła alertu nie została skonfigurowana do automatycznego rozwiązywania alertów. Oznacza to, że reguła alertu jest bezstanowa i nie rozwiązuje automatycznie wyzwolonych alertów i nie wymaga rozwiązania wyzwolonego alertu przed ponownym uruchomieniem w tej samej serii czasowej. Aby sprawdzić, czy reguła alertu nie jest skonfigurowana do automatycznego rozwiązywania problemów:

    • Edytuj regułę alertu w witrynie Azure Portal. Sprawdź, czy pole wyboru Automatycznie rozwiąż alerty w sekcji Szczegóły reguły alertu zostało wyczyszczone.
    • Przejrzyj skrypt używany do wdrożenia reguły alertu lub pobierz definicję reguły alertu. Sprawdź, czy właściwość jest ustawiona autoMitigate na false.

Reguła alertu metryki z progami dynamicznymi jest zbyt duża lub jest zbyt hałaśliwa

Jeśli reguła alertu korzystająca z progów dynamicznych jest zbyt hałaśliwa lub jest zbyt duża, może być konieczne zmniejszenie poufności reguły alertu progów dynamicznych. Skorzystaj z jednej z następujących opcji:

  • Czułość progowa: ustaw czułość na Niska , aby być bardziej odporna na odchylenia.
  • Liczba naruszeń (w obszarze Ustawienia zaawansowane): skonfiguruj regułę alertu, aby wyzwalać tylko wtedy, gdy w określonym okresie wystąpi kilka odchyleń. To ustawienie sprawia, że reguła jest mniej podatna na odchylenia przejściowe.

Reguła alertu metryki z progami dynamicznymi pokazuje wartości, które nie należą do zakresu oczekiwanych wartości

Gdy wartość metryki wykazuje duże wahania, progi dynamiczne mogą utworzyć szeroki model wokół wartości metryk, co może spowodować obniżenie lub wyższe granice niż oczekiwano. Ten scenariusz może wystąpić, gdy:

  • Czułość jest ustawiona na niską.

  • Metryka wykazuje nieregularne zachowanie z wysoką wariancją, która pojawia się jako skoki lub spadki danych.

    Rozważ zmniejszenie poufności modelu przez wybranie większej poufności lub wybranie większego okresu wyszukiwania. Możesz również użyć opcji Ignoruj dane przed , aby wykluczyć ostatnie nieregularności z danych historycznych używanych do kompilowania modelu.

Problemy z konfigurowaniem reguł alertów dotyczących metryk

Nie można odnaleźć metryki do alertu

Jeśli chcesz otrzymywać alerty dotyczące określonej metryki, ale nie widzisz jej podczas tworzenia reguły alertu, sprawdź, czy:

  • Jeśli widzisz niektóre metryki dla zasobu, ale nie możesz znaleźć określonej metryki, sprawdź, czy ta metryka jest obsługiwana. Jeśli tak, zobacz opis metryki, aby sprawdzić, czy jest on dostępny tylko w określonych wersjach lub wydaniach zasobu.
  • Jeśli metryka nie jest dostępna dla zasobu, może być dostępna w dziennikach zasobów i może być monitorowana przy użyciu alertów dzienników. Aby uzyskać więcej informacji, zobacz, jak zbierać i analizować dzienniki zasobów z zasobu platformy Azure.

Nie można odnaleźć metryki do alertu: Metryki gościa maszyn wirtualnych

Aby otrzymywać alerty dotyczące metryk systemu operacyjnego gościa maszyn wirtualnych, takich jak pamięć i miejsce na dysku, upewnij się, że zainstalowano wymaganego agenta do zbierania tych danych do metryk usługi Azure Monitor dla:

Aby uzyskać więcej informacji na temat zbierania danych z systemu operacyjnego gościa maszyny wirtualnej, zobacz Monitorowanie maszyn wirtualnych platformy Azure.

Uwaga

Jeśli skonfigurowano metryki gościa do wysłania do obszaru roboczego usługi Log Analytics, metryki są wyświetlane w zasobie obszaru roboczego usługi Log Analytics i zaczynają wyświetlać dane dopiero po utworzeniu reguły alertu, która je monitoruje. W tym celu postępuj zgodnie z instrukcjami, aby skonfigurować alert metryki na potrzeby dzienników.

Obecnie monitorowanie metryki gościa dla wielu maszyn wirtualnych z jedną regułą alertu nie jest obsługiwane przez alerty metryk. Można jednak użyć reguły alertu dziennika. W tym celu upewnij się, że metryki gościa są zbierane w obszarze roboczym usługi Log Analytics i utwórz regułę alertu dziennika w obszarze roboczym.

Nie można odnaleźć wymiaru metryki do alertu

Jeśli chcesz otrzymywać alerty dotyczące określonych wartości wymiarów metryki , ale nie możesz znaleźć następujących wartości:

  • Wyświetlenie wartości wymiarów na liście Wartości wymiarów może potrwać kilka minut.
  • Wyświetlone wartości wymiarów są oparte na danych metryk zebranych w ciągu ostatniego dnia.
  • Jeśli wartość wymiaru nie jest jeszcze emitowana lub nie jest wyświetlana, możesz użyć opcji Dodaj wartość niestandardową, aby dodać niestandardową wartość wymiaru.
  • Jeśli chcesz otrzymywać alerty o wszystkich możliwych wartościach wymiaru, a nawet uwzględnić przyszłe wartości, wybierz opcję Wybierz wszystkie bieżące i przyszłe wartości .
  • Niestandardowe wymiary metryk usługi Application Insights są domyślnie wyłączone. Aby włączyć kolekcję wymiarów dla tych metryk niestandardowych, zobacz Metryki oparte na dziennikach i wstępnie agregowane w usłudze Application Insights.

Chcesz skonfigurować regułę alertu dla metryki niestandardowej, która nie jest jeszcze emitowana

Podczas tworzenia reguły alertu dotyczącego metryk nazwa metryki jest weryfikowana względem interfejsu API definicji metryk, aby upewnić się, że istnieje. W niektórych przypadkach chcesz utworzyć regułę alertu dla metryki niestandardowej, nawet zanim zostanie ona wyemitowana. Przykładem jest użycie szablonu usługi Resource Manager do utworzenia zasobu usługi Application Insights, który będzie emitować niestandardową metrykę wraz z regułą alertu, która monitoruje daną metrykę.

Aby uniknąć niepowodzenia wdrażania podczas próby zweryfikowania definicji metryki niestandardowej, użyj skipMetricValidation parametru w criteria sekcji reguły alertu. Ten parametr powoduje pominięcie walidacji metryki. Zobacz poniższy przykład, aby dowiedzieć się, jak używać tego parametru w szablonie usługi Resource Manager. Aby uzyskać więcej informacji, zobacz pełne przykłady szablonów usługi Resource Manager dotyczące tworzenia reguł alertów dotyczących metryk.

"criteria": {
    "odata.type": "Microsoft.Azure.Monitor.SingleResourceMultipleMetricCriteria",
        "allOf": [
            {
                "name" : "condition1",
                "metricName": "myCustomMetric",
                "metricNamespace": "myCustomMetricNamespace",
                "dimensions":[],
                "operator": "GreaterThan",
                "threshold" : 10,
                "timeAggregation": "Average",
                "skipMetricValidation": true
            }
        ]
    }

Uwaga

Użycie parametru skipMetricValidation może być również wymagane podczas definiowania reguły alertu dla istniejącej metryki niestandardowej, która nie została emitowana w ciągu kilku dni.

Ostrzeżenia i błędy podczas konfigurowania reguł alertów dotyczących metryk

Progi dynamiczne nie są obecnie dostępne dla tego ostrzeżenia dotyczącego metryk

Progi dynamiczne są obsługiwane w przypadku większości metryk, ale nie wszystkich. Aby uzyskać listę metryk, zobacz Metryki nieobsługiwane przez progi dynamiczne.

Metryka nie jest dostępna dla wybranego zakresu. Może się tak zdarzyć, jeśli metryka ma zastosowanie tylko do określonej wersji lub błędu jednostki SKU

Przejrzyj opis metryki w temacie Obsługiwane metryki w usłudze Azure Monitor , aby sprawdzić, czy jest ona dostępna tylko w określonych wersjach lub wydaniach zasobu lub tego konkretnego typu.

Na przykład w zasobach usługi SQL Database lub usługach plików usługi Storage istnieją określone metryki obsługiwane tylko dla określonych wersji zasobu.

Brak dostępnych sygnałów do wyświetlenia. Spróbuj zmienić zakres tego błędu reguły alertu

Ten błąd wskazuje problem z zakresem reguły alertu. Może się to zdarzyć podczas edytowania reguły alertu o zakresie do typu zasobu, który obsługuje konfigurację wielu zasobów (np. maszynę wirtualną lub bazę danych SQL) i próbuje dodać inny zasób tego samego typu, ale z innego regionu. Alerty dotyczące wielu zasobów tego samego typu z różnych regionów nie są obsługiwane w alertach dotyczących metryk.

Limity usługi dla reguł alertów dotyczących metryk są zbyt małe

Dozwolona liczba reguł alertów dotyczących metryk na subskrypcję podlega limitom usług.

Zobacz Sprawdzanie liczby używanych reguł alertów dotyczących metryk, aby zobaczyć, ile reguł alertów metryk jest obecnie używanych.

Jeśli osiągnięto limit usługi, następujące kroki mogą pomóc w rozwiązaniu problemu:

  1. Spróbuj usunąć lub wyłączyć reguły alertów dotyczących metryk, które nie są już używane.
  2. Zacznij korzystać z reguł alertów dotyczących metryk, które monitorują wiele zasobów. Dzięki tej funkcji jedna reguła alertu może monitorować wiele zasobów przy użyciu tylko jednej reguły alertu zliczanej względem limitu przydziału. Aby uzyskać więcej informacji na temat tej funkcji i obsługiwanych typów zasobów, zobacz alerty dotyczące metryk.
  3. Jeśli chcesz zwiększyć limit przydziału, otwórz wniosek o pomoc techniczną i podaj następujące elementy:
    • Identyfikatory subskrypcji, dla których należy zwiększyć limit przydziału.
    • Typ zasobu dla zwiększenia limitu przydziału. Wybierz pozycję Alerty metryk.
    • Żądany limit przydziału.

Następne kroki

Aby uzyskać ogólne informacje dotyczące rozwiązywania problemów z alertami i powiadomieniami, zobacz Rozwiązywanie problemów w alertach usługi Azure Monitor.