Monitorování služby Azure Machine Learning
Tento článek popisuje:
- Typy dat monitorování, které můžete pro tuto službu shromažďovat.
- Způsoby analýzy dat
Poznámka:
Pokud už tuto službu nebo Azure Monitor znáte a chcete jenom vědět, jak analyzovat data monitorování, přečtěte si část Analyzovat na konci tohoto článku.
Pokud máte důležité aplikace a obchodní procesy, které spoléhají na prostředky Azure, musíte monitorovat a dostávat výstrahy pro váš systém. Služba Azure Monitor shromažďuje a agreguje metriky a protokoly ze všech komponent systému. Azure Monitor poskytuje přehled o dostupnosti, výkonu a odolnosti a upozorní vás na problémy. K nastavení a zobrazení dat monitorování můžete použít Azure Portal, PowerShell, Azure CLI, ROZHRANÍ REST API nebo klientské knihovny.
- Další informace o službě Azure Monitor najdete v přehledu služby Azure Monitor.
- Další informace o tom, jak obecně monitorovat prostředky Azure, najdete v tématu Monitorování prostředků Azure pomocí služby Azure Monitor.
Poznámka:
Informace v tomto dokumentu jsou primárně určené správcům, protože popisují monitorování služby Azure Machine Learning a přidružených služeb Azure. Pokud jste datový vědec nebo vývojář a chcete monitorovat informace specifické pro trénování modelu, projděte si následující dokumenty:
- Spuštění, monitorování a zrušení tréninkových spuštění
- Metriky protokolů pro trénovací běhy
- Sledování experimentů pomocí MLflow
Pokud chcete monitorovat informace generované modely nasazenými do online koncových bodů, přečtěte si téma Monitorování online koncových bodů.
Přehledy
Některé služby v Azure mají integrovaný řídicí panel monitorování na webu Azure Portal, který poskytuje výchozí bod pro monitorování vaší služby. Tyto řídicí panely se nazývají přehledy a najdete je v Centru přehledů služby Azure Monitor na webu Azure Portal.
Machine Learning může pomocí Application Insights sledovat metriky a protokoly. Do Application Insights můžete posílat integrované metriky a protokoly a používat funkce Application Insights, jako jsou živé metriky, vyhledávání transakcí, selhání a výkon pro další analýzu. Další informace najdete v tématu Monitorování online koncových bodů.
Typy zdrojů
Azure používá koncept typů prostředků a ID k identifikaci všeho v předplatném. Typy prostředků jsou také součástí ID prostředků pro každý prostředek spuštěný v Azure. Například jeden typ prostředku pro virtuální počítač je Microsoft.Compute/virtualMachines
. Seznam služeb a jejich přidružených typů prostředků najdete v tématu Poskytovatelé prostředků.
Azure Monitor podobně organizuje základní data monitorování do metrik a protokolů na základě typů prostředků, označovaných také jako obory názvů. Různé metriky a protokoly jsou k dispozici pro různé typy prostředků. Vaše služba může být přidružená k více než jednomu typu prostředku.
Další informace o typech prostředků pro Machine Learning najdete v referenčních informacích k datům monitorování služby Machine Learning.
Úložiště dat
Pro Azure Monitor:
- Data metrik se ukládají v databázi metrik služby Azure Monitor.
- Data protokolů se ukládají v úložišti protokolů služby Azure Monitor. Log Analytics je nástroj na webu Azure Portal, který se může dotazovat na toto úložiště.
- Protokol aktivit Azure je samostatné úložiště s vlastním rozhraním na webu Azure Portal.
Volitelně můžete směrovat data metriky a protokolu aktivit do úložiště protokolů služby Azure Monitor. Log Analytics pak můžete použít k dotazování na data a jejich korelaci s jinými daty protokolů.
Mnoho služeb může použít nastavení diagnostiky k odesílání metrik a dat protokolů do jiných umístění úložiště mimo Azure Monitor. Mezi příklady patří Azure Storage, hostované partnerské systémy a partnerské systémy mimo Azure pomocí služby Event Hubs.
Podrobné informace o tom, jak Azure Monitor ukládá data, najdete na datové platformě Azure Monitoru.
Metriky platformy Azure Monitoru
Azure Monitor poskytuje metriky platformy pro většinu služeb. Tady jsou:
- Individuálně definované pro každý obor názvů.
- Uložená v databázi metrik časových řad služby Azure Monitor.
- Zjednodušené a schopné podporovat upozorňování téměř v reálném čase.
- Používá se ke sledování výkonu prostředku v průběhu času.
Kolekce: Azure Monitor shromažďuje metriky platformy automaticky. Není nutná žádná konfigurace.
Směrování: Některé metriky platformy můžete také směrovat do protokolů služby Azure Monitor / Log Analytics, abyste je mohli dotazovat pomocí jiných dat protokolů. Zkontrolujte nastavení exportu DS pro každou metriku a zjistěte, jestli můžete pomocí nastavení diagnostiky směrovat metriku do protokolů služby Azure Monitor nebo Log Analytics.
- Další informace najdete v nastavení diagnostiky metrik.
- Informace o konfiguraci nastavení diagnostiky pro službu najdete v tématu Vytvoření nastavení diagnostiky ve službě Azure Monitor.
Seznam všech metrik, které je možné shromáždit pro všechny prostředky ve službě Azure Monitor, najdete v tématu Podporované metriky ve službě Azure Monitor.
Seznam dostupných metrik pro Machine Learning najdete v referenčních informacích k datům monitorování služby Machine Learning.
Všechny metriky pro Azure Machine Learning jsou v pracovním prostoru služby Machine Learning Service oboru názvů.
Protokoly prostředků služby Azure Monitor
Protokoly prostředků poskytují přehled o operacích, které provedl prostředek Azure. Protokoly se generují automaticky, ale pokud je chcete uložit nebo dotazovat, musíte je směrovat do protokolů služby Azure Monitor. Protokoly jsou uspořádané do kategorií. Daný obor názvů může mít více kategorií protokolu prostředků.
Kolekce: Protokoly prostředků se neshromažďují a neukládají, dokud nevytvoříte nastavení diagnostiky a nenasměrujete protokoly do jednoho nebo více umístění. Při vytváření nastavení diagnostiky určíte, které kategorie protokolů se mají shromažďovat. Existuje několik způsobů, jak vytvořit a udržovat nastavení diagnostiky, včetně webu Azure Portal, prostřednictvím kódu programu a služby Azure Policy.
Směrování: Navrhované výchozí nastavení je směrovat protokoly prostředků do protokolů služby Azure Monitor, abyste je mohli dotazovat pomocí jiných dat protokolu. K dispozici jsou také jiná umístění, jako je Azure Storage, Azure Event Hubs a někteří monitorovací partneři Microsoftu. Další informace najdete v protokolech prostředků Azure a cílech protokolů prostředků.
Podrobné informace o shromažďování, ukládání a směrování protokolů prostředků najdete v tématu Nastavení diagnostiky ve službě Azure Monitor.
Seznam všech dostupných kategorií protokolů prostředků ve službě Azure Monitor najdete v tématu Podporované protokoly prostředků ve službě Azure Monitor.
Všechny protokoly prostředků ve službě Azure Monitor mají stejná pole hlaviček, za kterými následují pole specifická pro službu. Běžné schéma je popsané ve schématu protokolu prostředků služby Azure Monitor.
Dostupné kategorie protokolů prostředků, přidružené tabulky Log Analytics a schémata protokolů pro Machine Learning najdete v referenčních informacích k datům monitorování služby Machine Learning.
Protokol aktivit Azure
Protokol aktivit obsahuje události na úrovni předplatného, které sledují operace pro každý prostředek Azure, jak je vidět mimo tento prostředek; Například vytvoření nového prostředku nebo spuštění virtuálního počítače.
Shromažďování: Události protokolu aktivit se automaticky generují a shromažďují v samostatném úložišti pro zobrazení na webu Azure Portal.
Směrování: Data protokolu aktivit můžete odesílat do protokolů služby Azure Monitor, abyste je mohli analyzovat společně s dalšími daty protokolů. K dispozici jsou také jiná umístění, jako je Azure Storage, Azure Event Hubs a někteří monitorovací partneři Microsoftu. Další informace o směrování protokolu aktivit najdete v tématu Přehled protokolu aktivit Azure.
Analýza dat monitorování
Existuje mnoho nástrojů pro analýzu dat monitorování.
Nástroje služby Azure Monitor
Azure Monitor podporuje následující základní nástroje:
Průzkumník metrik, nástroj na webu Azure Portal, který umožňuje zobrazit a analyzovat metriky pro prostředky Azure. Další informace najdete v tématu Analýza metrik pomocí Průzkumníka metrik služby Azure Monitor.
Log Analytics, nástroj na webu Azure Portal, který umožňuje dotazovat a analyzovat data protokolů pomocí dotazovacího jazyka Kusto (KQL). Další informace najdete v tématu Začínáme s dotazy na protokoly ve službě Azure Monitor.
Protokol aktivit, který má uživatelské rozhraní na webu Azure Portal pro zobrazení a základní vyhledávání. Pokud chcete provádět podrobnější analýzu, musíte data směrovat do protokolů služby Azure Monitor a spouštět složitější dotazy v Log Analytics.
Mezi nástroje, které umožňují složitější vizualizaci, patří:
- Řídicí panely , které umožňují kombinovat různé druhy dat do jednoho podokna na webu Azure Portal.
- Sešity, přizpůsobitelné sestavy, které můžete vytvořit na webu Azure Portal. Sešity můžou obsahovat dotazy na text, metriky a protokoly.
- Grafana, otevřený nástroj platformy, který exceluje v provozních řídicích panelech Grafana umožňuje vytvářet řídicí panely, které obsahují data z více zdrojů, než je Azure Monitor.
- Power BI, služba obchodní analýzy, která poskytuje interaktivní vizualizace napříč různými zdroji dat. Power BI můžete nakonfigurovat tak, aby automaticky naimportovali data protokolů ze služby Azure Monitor, abyste mohli tyto vizualizace využívat.
Nástroje pro export ve službě Azure Monitor
Data ze služby Azure Monitor můžete získat do jiných nástrojů pomocí následujících metod:
Metriky: Pomocí rozhraní REST API pro metriky extrahujte data metrik z databáze metrik služby Azure Monitor. Rozhraní API podporuje filtrovací výrazy pro upřesnění načtených dat. Další informace najdete v referenčních informacích k rozhraní REST API služby Azure Monitor.
Protokoly: Použijte rozhraní REST API nebo přidružené klientské knihovny.
Další možností je export dat pracovního prostoru.
Pokud chcete začít s rozhraním REST API pro Azure Monitor, přečtěte si průvodce rozhraním REST API pro monitorování Azure.
Dotazy Kusto
Data monitorování můžete analyzovat v protokolech služby Azure Monitor nebo v úložišti Log Analytics pomocí dotazovacího jazyka Kusto (KQL).
Důležité
Když na portálu vyberete protokoly z nabídky služby, otevře se Log Analytics s oborem dotazu nastaveným na aktuální službu. Tento obor znamená, že dotazy protokolu budou obsahovat pouze data z tohoto typu prostředku. Pokud chcete spustit dotaz, který obsahuje data z jiných služeb Azure, vyberte v nabídce Azure Monitor protokoly. Podrobnosti najdete v tématu Rozsah dotazů protokolu a časový rozsah ve službě Azure Monitor Log Analytics .
Seznam běžných dotazů pro libovolnou službu najdete v rozhraní dotazů Log Analytics.
S monitorováním prostředků služby Machine Learning můžete použít následující dotazy:
Získání neúspěšných úloh za posledních pět dnů:
AmlComputeJobEvent | where TimeGenerated > ago(5d) and EventType == "JobFailed" | project TimeGenerated , ClusterId , EventType , ExecutionState , ToolType
Získání záznamů pro konkrétní název úlohy:
AmlComputeJobEvent | where JobName == "automl_a9940991-dedb-4262-9763-2fd08b79d8fb_setup" | project TimeGenerated , ClusterId , EventType , ExecutionState , ToolType
Získejte události clusteru za posledních pět dnů pro clustery, ve kterých je velikost virtuálního počítače Standard_D1_V2:
AmlComputeClusterEvent | where TimeGenerated > ago(4d) and VmSize == "STANDARD_D1_V2" | project ClusterName , InitialNodeCount , MaximumNodeCount , QuotaAllocated , QuotaUtilized
Získání přidělení uzlů clusteru za posledních osm dnů:
AmlComputeClusterEvent | where TimeGenerated > ago(8d) and TargetNodeCount > CurrentNodeCount | project TimeGenerated, ClusterName, CurrentNodeCount, TargetNodeCount
Když ke stejnému pracovnímu prostoru služby Log Analytics připojíte více pracovních prostorů Machine Learning, můžete se dotazovat napříč všemi prostředky.
Získejte počet spuštěných uzlů v pracovních prostorech a clusterech za poslední den:
AmlComputeClusterEvent | where TimeGenerated > ago(1d) | summarize avgRunningNodes=avg(TargetNodeCount), maxRunningNodes=max(TargetNodeCount) by Workspace=tostring(split(_ResourceId, "/")[8]), ClusterName, ClusterType, VmSize, VmPriority
Výstrahy
Upozornění služby Azure Monitor vás aktivně upozorňují, když se v datech monitorování nacházejí konkrétní podmínky. Upozornění umožňují identifikovat a řešit problémy ve vašem systému, než si je zákazníci všimnou. Další informace najdete v tématu Upozornění služby Azure Monitor.
Existuje mnoho zdrojů běžných upozornění pro prostředky Azure. Příklady běžných upozornění pro prostředky Azure najdete v tématu Ukázkové dotazy na upozornění protokolu. Web AMBA (Baseline Alerts) služby Azure Monitor poskytuje poloautomatickou metodu implementace důležitých upozornění, řídicích panelů a pokynů pro metriky platformy. Web se vztahuje na neustále se rozšiřující podmnožinu služeb Azure, včetně všech služeb, které jsou součástí cílové zóny Azure (ALZ).
Běžné schéma upozornění standardizuje spotřebu oznámení upozornění služby Azure Monitor. Další informace najdete v tématu Běžné schéma upozornění.
Typy výstrah
Na libovolnou metriku nebo zdroj dat protokolu na datové platformě azure Monitoru můžete upozornit. Existuje mnoho různých typů upozornění v závislosti na službách, které monitorujete, a na datech monitorování, která shromažďujete. Různé typy upozornění mají různé výhody a nevýhody. Další informace naleznete v tématu Volba správného typu upozornění monitorování.
Následující seznam popisuje typy upozornění služby Azure Monitor, které můžete vytvořit:
- Upozornění na metriky vyhodnocují metriky prostředků v pravidelných intervalech. Metriky můžou být metriky platformy, vlastní metriky, protokoly ze služby Azure Monitor převedené na metriky nebo metriky Application Insights. Upozornění na metriky můžou také použít více podmínek a dynamických prahových hodnot.
- Upozornění protokolu umožňují uživatelům použít dotaz Log Analytics k vyhodnocení protokolů prostředků s předdefinovanou frekvencí.
- Upozornění protokolu aktivit se aktivují, když dojde k nové události protokolu aktivit, která odpovídá definovaným podmínkám. Upozornění služby Resource Health a upozornění služby Service Health jsou upozornění protokolu aktivit, která hlásí stav služby a prostředku.
Některé služby Azure také podporují upozornění inteligentního zjišťování, výstrahy Prometheus nebo doporučená pravidla upozornění.
U některých služeb můžete monitorovat škálování použitím stejného pravidla upozornění na metriku u více prostředků stejného typu, které existují ve stejné oblasti Azure. Jednotlivá oznámení se odesílají pro každý monitorovaný prostředek. Podporované služby a cloudy Azure najdete v tématu Monitorování více prostředků pomocí jednoho pravidla upozornění.
Poznámka:
Pokud vytváříte nebo spouštíte aplikaci, která běží ve vaší službě, může Azure Monitor application Insights nabízet více typů upozornění.
Pravidla upozornění služby Machine Learning
Následující tabulka uvádí běžná a doporučená pravidla upozornění pro Machine Learning.
Typ upozornění | Podmínka | Popis |
---|---|---|
Nasazení modelu se nezdařilo. | Typ agregace: Celkem, Operátor: Větší než, Prahová hodnota: 0 | Pokud jedno nebo více nasazení modelu selhalo |
Procento využití kvóty | Typ agregace: Průměr, Operátor: Větší než, Prahová hodnota: 90 | Pokud je procento využití kvóty větší než 90 % |
Nepoužitelné uzly | Typ agregace: Celkem, Operátor: Větší než, Prahová hodnota: 0 | Pokud existuje jeden nebo více nepoužitelných uzlů |
Doporučení poradce
U některých služeb, pokud během operací prostředků dojde k kritickým nebo bezprostředním změnám, zobrazí se na stránce Přehled služby na portálu výstraha. Další informace a doporučené opravy výstrahy najdete v doporučeních Advisoru v části Monitorování v nabídce vlevo. Během normálních operací se nezobrazují žádná doporučení poradce.
Další informace o Azure Advisoru najdete v přehledu Azure Advisoru.
Související obsah
- Informace o metrikách, protokolech a dalších důležitých hodnotách vytvořených pro Machine Learning najdete v referenčních informacích k datům monitorování služby Machine Learning.
- Obecné podrobnosti o monitorování prostředků Azure najdete v tématu Monitorování prostředků Azure pomocí služby Azure Monitor .
- Informace o práci s kvótami souvisejícími se službou Machine Learning najdete v tématu Správa a vyžádání kvót pro prostředky Azure.