Řešení potíží s upozorněními na metriky služby Azure Monitor
Tento článek popisuje běžné dotazy týkající se upozornění metrik služby Azure Monitor a jejich řešení.
Výstrahy služby Azure Monitor proaktivně upozorňují na výskyt důležitých podmínek v monitorovaných datech. Umožňují vám identifikovat a řešit problémy předtím, než si je uživatelé systému všimnou. Další informace o upozorňování najdete v tématu Přehled výstrah v Microsoft Azure.
Upozornění na metriku se neaktivovalo, když mělo
Pokud se domníváte, že se upozornění na metriku mělo aktivovat, ale nemělo se aktivovat a není uvedené na webu Azure Portal, zkuste následující kroky:
Zkontrolujte konfiguraci pravidla upozornění na metriky.
Zkontrolujte, že typ agregace a členitost agregace (období) jsou nakonfigurované podle očekávání. Typ agregace určuje, jak se agregují hodnoty metrik. Další informace najdete v tématu Vysvětlení agregace a zobrazení metrik služby Azure Monitor. Členitost agregace (období) určuje, jak daleko od vyhodnocení agreguje hodnoty metrik při každém spuštění pravidla upozornění.
Zkontrolujte, jestli jsou prahová hodnota nebo citlivost nakonfigurované podle očekávání.
V případě pravidla upozornění, které používá dynamické prahové hodnoty, zkontrolujte, jestli jsou nakonfigurovaná upřesňující nastavení. Počet porušení může filtrovat výstrahy a ignorovat data před tím, než ovlivní způsob výpočtu prahových hodnot.
Poznámka:
Dynamické prahové hodnoty vyžadují alespoň 3 dny a 30 vzorků metrik, než se stanou aktivními.
Zkontrolujte, jestli se upozornění aktivovalo, ale neodeslalo oznámení.
Projděte si seznam aktivovaných upozornění a zjistěte, jestli můžete aktivované upozornění najít. Pokud se upozornění zobrazí v seznamu, ale máte problém s některými jeho akcemi nebo oznámeními, přečtěte si téma Řešení potíží v upozorněních služby Azure Monitor.
Zkontrolujte, jestli je upozornění již aktivní.
Zkontrolujte, jestli se u časových řad metriky již aktivovalo upozornění, u kterého jste očekávali, že se zobrazí upozornění. Upozornění na metriky jsou ve výchozím nastavení stavová, což znamená, že jakmile se upozornění aktivuje u konkrétní časové řady metrik, nebudou se další upozornění na tuto časovou řadu aktivovat, dokud se problém nevyřeší. Tato volba návrhu snižuje šum. Upozornění se automaticky vyřeší, pokud není podmínka výstrahy splněna po dobu tří po sobě jdoucích vyhodnocení.
Zkontrolujte použité dimenze.
Pokud jste pro metriku vybrali některé hodnoty dimenzí, pravidlo upozornění monitoruje každou jednotlivou časovou řadu metrik (definovanou kombinací hodnot dimenzí) pro porušení prahové hodnoty. Pokud chcete také monitorovat agregovanou časnou řadu metrik bez vybraných dimenzí, nakonfigurujte pro metriku další pravidlo upozornění bez výběru dimenzí.
Zkontrolujte agregaci a časové intervaly.
Pokud používáte grafy metrik, ujistěte se, že:
- Vybraná agregace v grafu metrik je stejná jako typ agregace v pravidlu upozornění.
- Vybraná členitost času je stejná jako členitost agregace (období) v pravidlu upozornění a není nastavená na Hodnotu Automaticky.
Zkontrolujte, jestli v pravidlu upozornění chybí první období vyhodnocení v časové řadě.
Pravděpodobnost chybějícího prvního vyhodnocení přidané časové řady můžete snížit tím, že zvolíte členitost agregace (období), která je větší než frekvence vyhodnocování v následujících případech:
- Když se do pravidla upozornění na metriku přidá nová kombinace hodnot dimenzí, které monitoruje více dimenzí.
- Když do oboru přidáte nový prostředek, pravidlo upozornění na metriku, které monitoruje více prostředků.
- Když se metrika vygeneruje po uplynutí období delšího než 24 hodin, kdy se nevygenerovala pro pravidlo upozornění metriky, které monitoruje metriku, která se nevygeneruje nepřetržitě (řídká metrika).
Upozornění na metriku se neaktivuje při každém splnění podmínky.
Upozornění na metriky jsou ve výchozím nastavení stavová, takže se neaktivují další výstrahy, pokud už je aktivované upozornění na konkrétní časovou řadu. Pokud chcete, aby pravidlo upozornění na konkrétní metriku bezstavové a upozorňovalo se na každé vyhodnocení, ve kterém je splněna podmínka upozornění, použijte jednu z těchto možností:
Pokud pravidlo upozornění vytvoříte programově, například prostřednictvím Azure Resource Manageru, PowerShellu, REST nebo Azure CLI, nastavte
autoMitigate
vlastnost naFalse
.Pokud vytvoříte pravidlo upozornění na webu Azure Portal, zrušte zaškrtnutí políčka Automaticky vyřešit výstrahy v části Podrobnosti o pravidle upozornění. Frekvence oznámení pro bezstavová upozornění na metriky se liší v závislosti na nakonfigurované frekvenci pravidla upozornění:
Frekvence upozornění kratší než 5 minut: I když je podmínka stále splněná, oznámení se odešle někam mezi 1 a šesti minutami.
Frekvence upozornění delší než 5 minut: I když je podmínka stále splněná, odešle se oznámení mezi nakonfigurovanou frekvencí a dvojitou frekvencí. Například pro pravidlo upozornění s frekvencí 15 minut se odešle oznámení někam mezi 15 až 30 minutami.
Poznámka:
Vytvoření bezstavového pravidla upozornění na metriku brání vyřešení aktivovaných upozornění. Takže i po splnění podmínky zůstanou aktivovaná upozornění v aktivovaném stavu až do 30denní doby uchovávání.
Pravidlo upozornění na metriku s dynamickou prahovou hodnotou se neaktivuje dostatečně
Můžete narazit na pravidlo upozornění, které používá dynamické prahové hodnoty, se neaktivuje nebo není dostatečně citlivé, i když je nakonfigurované s vysokou citlivostí. K tomu může dojít, když je rozdělení metriky velmi nepravidelné. Při řešení tohoto problému zvažte jedno z následujících řešení:
- Pokud je to možné, přejděte k monitorování doplňkové metriky, která je vhodná pro váš scénář. Například zkontrolujte, jestli se změny úspěšnosti neprobíjely míra selhání.
- Zkuste vybrat jinou hodnotu pro členitost agregace (období).
- Zkontrolujte, jestli v posledních 10 dnech nedošlo k závažné změně chování metrik, například výpadku. Nečekaná změna může ovlivnit horní a dolní prahové hodnoty vypočítané pro metriku a zvětšit je. Počkejte několik dní, než se výpadek nepřebídne do výpočtu prahových hodnot. Pravidlo upozornění můžete také upravit tak, aby před možností Ignorovat data používala v rozšířených nastaveních.
- Pokud data mají týdenní sezónnost, ale pro metriku není k dispozici dostatek historie, můžou počítané prahové hodnoty vést k tomu, že budou mít široké horní a dolní hranice. Výpočet může například zpracovávat pracovní dny a víkendy stejným způsobem a vytvářet široká ohraničení, která se vždy nevejdou do dat. Tento problém by se měl vyřešit, až bude k dispozici dostatek historie metrik. Pak se zjistí správná sezónnost a odpovídajícím způsobem se aktualizují počítané prahové hodnoty.
Upozornění na metriku se aktivovalo, když nemělo
Pokud se domníváte, že se vaše upozornění na metriku nemělo aktivovat, ale přesto se aktivovalo, následující kroky vám můžou pomoct tento problém vyřešit.
Projděte si seznam aktivovaných upozornění a vyhledejte aktivované upozornění. Výběrem výstrahy zobrazíte její podrobnosti. Projděte si informace uvedené v části Proč se tato výstraha aktivovala? Zobrazí se graf metrik, hodnota metriky a prahová hodnota v době, kdy se výstraha aktivovala.
Poznámka:
Pokud používáte dynamické prahové hodnoty a myslíte si, že prahové hodnoty nebyly správné, poskytněte zpětnou vazbu pomocí ikony zamračení. Tato zpětná vazba ovlivňuje algoritmický výzkum strojového učení a pomůže zlepšit budoucí detekce.
Pokud jste pro metriku vybrali více hodnot dimenzí, aktivuje se upozornění, když prahovou hodnotu překročí některá z časových řad metrik (definovaná kombinací hodnot dimenzí). Další informace o použití dimenzí v upozorněních metrik najdete v tématu Zúžení cíle pomocí dimenzí.
Zkontrolujte konfiguraci pravidla upozornění a ujistěte se, že je správně nakonfigurovaná:
- Zkontrolujte, že typ agregace, členitost agregace (období) a prahová hodnota nebo citlivost jsou nakonfigurované podle očekávání.
- V případě pravidla upozornění, které používá dynamické prahové hodnoty, zkontrolujte, jestli jsou nakonfigurovaná upřesňující nastavení, protože počet porušení může filtrovat výstrahy a ignorovat data, než může ovlivnit způsob výpočtu prahových hodnot.
Poznámka:
Dynamické prahové hodnoty vyžadují alespoň 3 dny a 30 vzorků metrik, než se stanou aktivními.
Pokud používáte grafy metrik, ujistěte se, že:
- Vybraná agregace v grafu metrik je stejná jako typ agregace v pravidlu upozornění.
- Vybraná členitost času je stejná jako členitost agregace (období) v pravidlu upozornění a že není nastavená na automatickou.
Pokud se výstraha aktivovala, i když už jsou aktivovaná upozornění, která monitorují stejná kritéria, která nejsou vyřešena, zkontrolujte, jestli pravidlo upozornění není nakonfigurované tak, aby automaticky nevyřešilo výstrahy. To znamená, že pravidlo upozornění je bezstavové a nevyřešuje automaticky aktivovaná upozornění a nevyžaduje vyřešení aktivované výstrahy před opětovným spuštěním ve stejné časové řadě. Pokud chcete zkontrolovat, jestli není pravidlo upozornění nakonfigurované tak, aby se automaticky nepřeložila:
- Upravte pravidlo upozornění na webu Azure Portal. Podívejte se, jestli není zaškrtnutá políčko Automaticky vyřešit výstrahy v části Podrobnosti pravidla upozornění.
- Zkontrolujte skript použitý k nasazení pravidla upozornění nebo načtení definice pravidla upozornění. Zkontrolujte,
autoMitigate
jestli je vlastnost nastavená nafalse
hodnotu .
Pravidlo upozornění na metriku s dynamickými prahovými hodnotami se aktivuje příliš mnoho nebo je příliš hlučné.
Pokud pravidlo upozornění, které používá dynamické prahové hodnoty, je příliš hlučné nebo příliš velké, možná budete muset snížit citlivost pravidla upozornění na dynamické prahové hodnoty. Použijte jednu z následujících možností:
- Citlivost prahové hodnoty: Nastavte citlivost na Nízkou , aby byla odolnější vůči odchylkám.
- Počet porušení (v části Upřesnit nastavení): Nakonfigurujte pravidlo upozornění tak, aby se aktivovalo pouze v případě, že v určitém časovém období dojde k několika odchylkám. Díky tomuto nastavení je pravidlo méně náchylné k přechodným odchylkám.
Pravidlo upozornění na metriku s dynamickými prahovými hodnotami zobrazuje hodnoty, které nejsou v rozsahu očekávaných hodnot.
Když hodnota metriky vykazuje velké výkyvy, dynamické prahové hodnoty mohou vytvořit široký model kolem hodnot metrik, což může vést k nižší nebo vyšší hranici, než se čekalo. K tomuto scénáři může dojít v těchto případech:
Citlivost je nastavená na nízkou.
Metrika vykazuje nepravidelné chování s vysokou odchylkou, která se v datech zobrazuje jako špičky nebo poklesy.
Zvažte, že model bude méně citlivý, když zvolíte vyšší citlivost nebo vyberete delší období zpětného vyhledávání. Můžete také použít možnost Ignorovat data před možností vyloučit nedávné nepravidelnosti z historických dat použitých k sestavení modelu.
Problémy s konfigurací pravidel upozornění na metriky
Metriku, na které se má upozornit, nejde najít
Pokud chcete upozorňovat na konkrétní metriku, ale nemůžete ji při vytváření pravidla upozornění zobrazit, zkontrolujte, jestli chcete zjistit:
- Pokud se zobrazí některé metriky pro prostředek, ale nemůžete najít konkrétní metriku, zkontrolujte, jestli je tato metrika podporovaná. Pokud ano, podívejte se na popis metriky a zkontrolujte, jestli je k dispozici pouze v konkrétních verzích nebo edicích prostředku.
- Pokud metrika není pro prostředek dostupná, může být k dispozici v protokolech prostředků a je možné ji monitorovat pomocí upozornění protokolu. Další informace najdete v tématu shromažďování a analýza protokolů prostředků z prostředku Azure.
Metriku, na které se má upozorňovat, nejde najít: Metriky hosta virtuálních počítačů
Pokud chcete upozorňovat na metriky hostovaného operačního systému virtuálních počítačů, jako je paměť a místo na disku, ujistěte se, že jste nainstalovali požadovaného agenta ke shromažďování těchto dat do metrik služby Azure Monitor pro:
Další informace o shromažďování dat z hostovaného operačního systému virtuálního počítače najdete v tématu Monitorování virtuálních počítačů Azure.
Poznámka:
Pokud jste nakonfigurovali metriky hosta tak, aby se odesílaly do pracovního prostoru služby Log Analytics, zobrazí se metriky v rámci prostředku pracovního prostoru služby Log Analytics a začnou zobrazovat data až po vytvoření pravidla upozornění, které je monitoruje. Postupujte podle pokynů ke konfiguraci upozornění na metriku pro protokoly.
Monitorování metrik hosta pro více virtuálních počítačů s jedním pravidlem upozornění v současné době nepodporuje upozornění metrik. Můžete ale použít pravidlo upozornění protokolu. Za tímto účelem se ujistěte, že se metriky hosta shromažďují do pracovního prostoru služby Log Analytics, a vytvořte v pracovním prostoru pravidlo upozornění protokolu.
Nejde najít dimenzi metriky, na které se má upozornit
Pokud chcete upozornit na konkrétní hodnoty dimenzí metriky , ale nemůžete najít tyto hodnoty:
- Zobrazení hodnot dimenzí v seznamu Hodnoty dimenzí může několik minut trvat.
- Zobrazené hodnoty dimenzí vycházejí z dat metriky shromážděných za poslední den.
- Pokud se hodnota dimenze ještě nevygeneruje nebo se nezobrazuje, můžete k přidání vlastní hodnoty dimenze použít možnost Přidat vlastní hodnotu .
- Pokud chcete upozornit na všechny možné hodnoty dimenze a dokonce zahrnout budoucí hodnoty, zvolte možnost Vybrat všechny aktuální a budoucí hodnoty .
- Dimenze vlastních metrik prostředků Application Insights jsou ve výchozím nastavení vypnuté. Pokud chcete zapnout shromažďování dimenzí pro tyto vlastní metriky, podívejte se na metriky založené na protokolu a předem agregované metriky ve službě Application Insights.
Chcete nakonfigurovat pravidlo upozornění na vlastní metriku, která se ještě nevygeneruje.
Když vytvoříte pravidlo upozornění na metriku, název metriky se ověří v rozhraní API pro definice metrik, abyste měli jistotu, že existuje. V některýchpřípadechch Příkladem je, když pomocí šablony Resource Manageru vytvoříte prostředek Application Insights, který vygeneruje vlastní metriku, spolu s pravidlem upozornění, které tuto metriku monitoruje.
Pokud se chcete vyhnout selhání nasazení při pokusu o ověření definic vlastní metriky, použijte skipMetricValidation
parametr v criteria
části pravidla upozornění. Tento parametr způsobí vynechání ověření metriky. V následujícím příkladu se dozvíte, jak tento parametr použít v šabloně Resource Manageru. Další informace najdete v úplných ukázkách šablon Resource Manageru pro vytváření pravidel upozornění na metriky.
"criteria": {
"odata.type": "Microsoft.Azure.Monitor.SingleResourceMultipleMetricCriteria",
"allOf": [
{
"name" : "condition1",
"metricName": "myCustomMetric",
"metricNamespace": "myCustomMetricNamespace",
"dimensions":[],
"operator": "GreaterThan",
"threshold" : 10,
"timeAggregation": "Average",
"skipMetricValidation": true
}
]
}
Poznámka:
Použití parametru skipMetricValidation
může být také vyžadováno, když definujete pravidlo upozornění u existující vlastní metriky, která se během několika dnů nevygenerovala.
Upozornění a chyby při konfiguraci pravidel upozornění na metriky
Dynamické prahové hodnoty nejsou pro toto upozornění metriky aktuálně k dispozici.
Dynamické prahové hodnoty jsou podporovány pro většinu metrik, ale ne pro všechny. Seznam metrik najdete v části Metriky, které nejsou podporovány dynamickými prahovými hodnotami.
Metrika není pro vybraný obor dostupná. K tomu může dojít v případě, že se metrika vztahuje pouze na konkrétní verzi nebo chybu skladové položky.
Projděte si popis metriky v podporovaných metrikách ve službě Azure Monitor a zkontrolujte, jestli je k dispozici jenom v konkrétních verzích nebo edicích prostředku nebo v tomto konkrétním typu.
Například v části Prostředky služby Azure SQL Database nebo Služby úložiště souborů existují konkrétní metriky podporované pouze pro konkrétní verze daného prostředku.
Nejsou k dispozici žádné signály k zobrazení. Zkuste změnit rozsah této chyby pravidla upozornění.
Tato chyba značí problém s rozsahem pravidla upozornění. K tomu může dojít při úpravě pravidla upozornění s rozsahem nastaveným na typ prostředku, který podporuje konfiguraci více prostředků (jako je virtuální počítač nebo databáze SQL) a pokus o přidání dalšího prostředku stejného typu, ale z jiné oblasti. Upozornění na více prostředků stejného typu z různých oblastí není v upozorněních na metriky podporováno.
Limity služby pro pravidla upozornění na metriky jsou příliš malé.
Povolený počet pravidel upozornění na metriky pro každé předplatné podléhá omezením služeb.
Informace o tom, kolik pravidel upozornění metrik se aktuálně používá, najdete v tématu Kontrola počtu použitých pravidel upozornění na metriky.
Pokud jste dosáhli limitu služby, následující kroky vám můžou pomoct tento problém vyřešit:
- Zkuste odstranit nebo zakázat pravidla upozornění na metriky, která se už nepoužívají.
- Přejděte na používání pravidel upozornění na metriky, která monitorují více prostředků. Díky této funkci může jedno pravidlo upozornění monitorovat více prostředků pomocí pouze jednoho pravidla upozornění počítaného do kvóty. Další informace o této funkci a podporovaných typech prostředků najdete v tématu Upozornění na metriky.
- Pokud potřebujete zvýšit limit kvóty, otevřete žádost o podporu a zadejte:
- ID předplatného, pro které je potřeba zvýšit limit kvóty.
- Typ prostředku pro navýšení kvóty Vyberte upozornění metrik.
- Požadovaný limit kvóty
Další kroky
Obecné informace o řešení potíží s upozorněními a oznámeními najdete v tématu Řešení potíží v upozorněních služby Azure Monitor.