Monitorování clusterů Kubernetes pomocí služeb Azure a nativních cloudových nástrojů
Tento článek popisuje, jak monitorovat stav a výkon clusterů Kubernetes a úloh spuštěných na nich pomocí služby Azure Monitor a souvisejících služeb nativních pro Azure a cloud. To zahrnuje clustery spuštěné ve službě Azure Kubernetes Service (AKS) nebo jiných cloudech, jako jsou AWS a GCP. Pro různé role, které obvykle spravují jedinečné komponenty, které tvoří prostředí Kubernetes, jsou k dispozici různé sady pokynů.
Důležité
Tento článek obsahuje kompletní pokyny k monitorování různých vrstev prostředí Kubernetes na základě služby Azure Kubernetes Service (AKS) nebo clusterů Kubernetes v jiných cloudech. Pokud teprve začínáte používat AKS nebo Azure Monitor, přečtěte si téma Monitorování AKS, kde najdete základní informace o tom, jak začít monitorovat cluster AKS.
Vrstvy a role prostředí Kubernetes
Následuje obrázek běžného modelu typického prostředí Kubernetes, počínaje vrstvou infrastruktury až po aplikace. Každá vrstva má odlišné požadavky na monitorování, které řeší různé služby a obvykle jsou spravovány různými rolemi v organizaci.
Odpovědnost za různé vrstvy prostředí Kubernetes a aplikací, které na něm závisí, jsou obvykle řešeny několika rolemi. V závislosti na velikosti vaší organizace můžou tyto role provádět různí lidé nebo dokonce různé týmy. Následující tabulka popisuje různé role, zatímco následující části poskytují scénáře monitorování, se kterými se každý obvykle setká.
Role | Popis |
---|---|
Vývojář | Vyvíjejte a udržujte aplikaci spuštěnou v clusteru. Zodpovídá za konkrétní provoz aplikací, včetně výkonu a selhání aplikace. Udržuje spolehlivost aplikace podle smluv SLA. |
Inženýr platformy | Zodpovídá za cluster Kubernetes. Zřizuje a udržuje platformu používanou vývojářem. |
Síťový inženýr | Zodpovídá za provoz mezi úlohami a veškerým příchozím/výstupním přenosem dat v clusteru. Analyzuje síťový provoz a provádí analýzu hrozeb. |
Výběr monitorovacích nástrojů
Azure poskytuje kompletní sadu služeb založených na službě Azure Monitor pro monitorování stavu a výkonu různých vrstev vaší infrastruktury Kubernetes a aplikací, které na ní závisejí. Tyto služby vzájemně spolupracují a poskytují kompletní řešení monitorování a doporučují se jak pro clustery AKS, tak pro clustery Kubernetes spuštěné v jiných cloudech. Možná máte existující investice do nativních cloudových technologií schválených pro Cloud Native Computing Foundation, v takovém případě se můžete rozhodnout integrovat nástroje Azure do stávajícího prostředí.
Volba nástrojů, které se mají nasadit, a jejich konfigurace bude záviset na požadavcích vašeho konkrétního prostředí. Můžete například použít spravované nabídky v Azure pro Prometheus a Grafana nebo můžete použít stávající instalaci těchto nástrojů s clustery Kubernetes v Azure. Vaše organizace může také použít alternativní nástroje ke shromažďování a analýze protokolů Kubernetes, jako je Splunk nebo Datadog.
Důležité
Monitorování komplexního prostředí, jako je Kubernetes, zahrnuje shromažďování značného množství telemetrie, z nichž velká část způsobuje náklady. Měli byste shromáždit jenom dostatek dat, aby splňovala vaše požadavky. To zahrnuje množství shromážděných dat, frekvenci shromažďování a dobu uchovávání informací. Pokud jste si vědomi nákladů, můžete se rozhodnout implementovat podmnožinu všech funkcí, abyste snížili výdaje na monitorování.
Síťový inženýr
Síťový inženýr zodpovídá za provoz mezi úlohami a veškerým příchozím/výstupním přenosem dat v clusteru. Analyzují síťový provoz a provádějí analýzu hrozeb.
Služby Azure pro správce sítě
Následující tabulka uvádí služby, které síťový inženýr běžně používá ke sledování stavu a výkonu sítě podporující cluster Kubernetes.
Služba | Popis |
---|---|
Network Watcher | Sada nástrojů v Azure pro monitorování virtuálních sítí používaných clustery Kubernetes a diagnostika zjištěných problémů |
Analýza provozu | Funkce služby Network Watcher, která analyzuje protokoly toku, aby poskytovala přehled o toku provozu. |
Přehledy sítě | Funkce služby Azure Monitor, která zahrnuje vizuální znázornění výkonu a stavu různých síťových komponent a poskytuje přístup k nástrojům pro monitorování sítě, které jsou součástí služby Network Watcher. |
Služba Network Insights je ve výchozím nastavení povolená a nevyžaduje žádnou konfiguraci. Network Watcher je ve výchozím nastavení také ve výchozím nastavení povolený v každé oblasti Azure.
Monitorování úrovně 1 – síť
Následují běžné scénáře monitorování sítě.
- Vytvořte protokoly toku pro protokolování informací o provozu PROTOKOLU IP procházejících skupinami zabezpečení sítě používanými vaším clusterem a pak pomocí analýzy provozu analyzujte a poskytněte přehledy o těchto datech. Pravděpodobně použijete stejný pracovní prostor služby Log Analytics pro analýzy provozu, který používáte pro přehledy kontejnerů a protokoly řídicí roviny.
- Pomocí analýzy provozu můžete určit, jestli jakýkoli provoz proudí do nebo z neočekávaných portů používaných clusterem, a také jestli nějaký provoz prochází přes veřejné IP adresy, které by se neměly vystavit. Tyto informace slouží k určení, jestli vaše pravidla sítě potřebují úpravy.
- V případě clusterů AKS můžete pomocí doplňku Network Observability pro AKS (Preview) monitorovat a sledovat přístup mezi službami v clusteru (provoz east-west).
Inženýr platformy
Technik platformy, označovaný také jako správce clusteru, zodpovídá za samotný cluster Kubernetes. Zřizují a spravují platformu používanou vývojáři. Potřebují porozumět stavu clusteru a jeho komponent a umět řešit případné zjištěné problémy. Musí také porozumět nákladům na provoz clusteru a potenciálně umožnit přidělení nákladů různým týmům.
Velké organizace můžou mít také architekta vozového parku, který se podobá technikům platformy, ale zodpovídá za několik clusterů. Potřebují mít přehled o celém prostředí a musí provádět úlohy správy ve velkém měřítku. Doporučení pro škálování jsou zahrnutá v následujících doprovodných materiálech. Přečtěte si téma Co je Azure Kubernetes Fleet Manager? Podrobnosti o vytvoření prostředku fleetu pro scénáře s více clustery a ve velkém měřítku.
Služby Azure pro inženýra platformy
Následující tabulka uvádí služby Azure pro inženýra platformy pro monitorování stavu a výkonu clusteru Kubernetes a jeho komponent.
Služba | Popis |
---|---|
Container Insights | Služba Azure pro clustery Kubernetes s podporou AKS a Azure Arc, které používají kontejnerizovanou verzi agenta Služby Azure Monitor ke shromažďování protokolů stdout/stderr, metrik výkonu a událostí Kubernetes z každého uzlu v clusteru. Data můžete zobrazit na webu Azure Portal nebo je dotazovat pomocí Log Analytics. Nakonfigurujte prostředí Prometheus tak, aby používalo zobrazení Přehledy kontejnerů s daty Prometheus. |
Spravovaná služba Azure Monitoru pro Prometheus | Prometheus je řešení metrik nativní pro cloud z nativní služby Cloud Native Compute Foundation a nejběžnější nástroj používaný ke shromažďování a analýze dat metrik z clusterů Kubernetes. Spravovaná služba Azure Monitoru pro Prometheus je plně spravované řešení, které je kompatibilní s dotazovacím jazykem Prometheus (PromQL) a upozorněními Prometheus a integruje se se službou Azure Managed Grafana pro vizualizaci. Tato služba podporuje vaše investice do opensourcových nástrojů bez složitosti správy vlastního prostředí Prometheus. |
Kubernetes s podporou Azure Arc | Umožňuje připojit se ke clusterům Kubernetes spuštěným v jiných cloudech, abyste je mohli spravovat a konfigurovat v Azure. S nainstalovaným agentem Arc můžete monitorovat AKS a hybridní clustery společně pomocí stejných metod a nástrojů, včetně přehledů kontejnerů a Prometheus. |
Azure Managed Grafana | Plně spravovaná implementace Grafany, což je opensourcová platforma pro vizualizaci dat, která se běžně používá k prezentaci Prometheus a dalších dat. K dispozici je několik předdefinovaných řídicích panelů Grafana pro monitorování kubernetes a řešení potíží s kompletním zásobníkem. |
Konfigurace monitorování pro inženýra platformy
Následující části identifikují kroky pro úplné monitorování prostředí Kubernetes pomocí služeb Azure v tabulce výše. Funkce a možnosti integrace jsou k dispozici pro každou z nich, které vám pomůžou určit, kde může být potřeba tuto konfiguraci upravit tak, aby splňovala vaše konkrétní požadavky.
Onboarding přehledů kontejnerů a spravovaných prometheus může být součástí stejného prostředí, jak je popsáno v tématu Povolení monitorování pro clustery Kubernetes. Následující části popisují jednotlivé jednotlivé části, abyste mohli zvážit všechny možnosti onboardingu a konfigurace pro každý z nich.
Povolení scrapování metrik Prometheus
Důležité
Pokud chcete používat spravovanou službu Azure Monitor pro Prometheus, musíte mít pracovní prostor Služby Azure Monitor. Informace o aspektech návrhu konfigurace pracovního prostoru najdete v tématu Architektura pracovního prostoru služby Azure Monitor.
Povolte scrapování metrik Prometheus spravovanou službou Azure Monitor pro Prometheus z vašeho clusteru pomocí jedné z následujících metod:
- Při vytváření clusteru AKS vyberte možnost Povolit metriky Prometheus.
- Vyberte možnost Povolit metriky Prometheus, když povolíte přehledy kontejnerů v existujícím clusteru AKS nebo clusteru Kubernetes s podporou Služby Azure Arc.
- Povolení pro existující cluster AKS nebo cluster Kubernetes s podporou Arc
Pokud už máte prostředí Prometheus, které chcete použít pro clustery AKS, povolte spravovanou službu Azure Monitor pro Prometheus a pak pomocí vzdáleného zápisu odešlete data do stávajícího prostředí Prometheus. K odesílání dat z existujícího prostředí Prometheus spravovaného prometheus do spravované služby Azure Monitor pro Prometheus můžete použít také vzdálené zápis.
Podrobnosti o metrikách shromažďovaných ve výchozím nastavení a četnosti shromažďování najdete v tématu Výchozí konfigurace metrik Prometheus ve službě Azure Monitor . Pokud chcete přizpůsobit konfiguraci, přečtěte si téma Přizpůsobení výstřižků metrik Prometheus ve spravované službě Azure Monitor pro Prometheus.
Povolení grafany pro analýzu dat Prometheus
Poznámka:
Grafana můžete použít pro monitorování prostředí Kubernetes, pokud máte existující investice do Grafany nebo pokud dáváte přednost použití řídicích panelů Grafana místo Container Insights k analýze dat Prometheus. Pokud nechcete grafana používat, povolte prostředí Prometheus v Přehledech kontejnerů , abyste mohli s daty Prometheus používat zobrazení Přehledy kontejnerů.
Vytvořte instanci spravované grafany a propojte ji s pracovním prostorem služby Azure Monitor, abyste mohli data Prometheus používat jako zdroj dat. Tuto konfiguraci můžete také provést ručně pomocí přidání spravované služby Azure Monitor pro Prometheus jako zdroje dat. Pro monitorování clusterů Kubernetes je k dispozici celá řada předem připravených řídicích panelů, včetně několika, které prezentují podobné informace jako zobrazení Přehledy kontejnerů.
Pokud máte existující prostředí Grafana, můžete ho dál používat a jako zdroj dat přidat spravovanou službu Azure Monitoru pro Prometheus. Do Grafany můžete také přidat zdroj dat služby Azure Monitor, abyste mohli používat data shromážděná službou Container Insights na vlastních řídicích panelech Grafana. Tuto konfiguraci proveďte, pokud se chcete zaměřit na řídicí panely Grafana místo použití zobrazení a sestav Přehledy kontejnerů.
Povolení Container Insights pro shromažďování protokolů
Když pro cluster Kubernetes povolíte Container Insights, nasadí kontejnerizovanou verzi agenta Služby Azure Monitor, který odesílá data do pracovního prostoru služby Log Analytics ve službě Azure Monitor. Container Insights shromažďuje kontejnery stdout/stderr, protokoly infrastruktury a data o výkonu. Všechna data protokolu jsou uložená v pracovním prostoru služby Log Analytics, kde je lze analyzovat pomocí dotazovací jazyk Kusto (KQL).
Informace o požadavcích a možnostech konfigurace pro onboarding clusterů Kubernetes najdete v tématu Povolení přehledů kontejnerů . Připojte se pomocí Azure Policy , abyste zajistili, že všechny clustery zachovávají konzistentní konfiguraci.
Jakmile je pro cluster povolená služba Container Insights, proveďte následující akce pro optimalizaci instalace.
- Povolte prostředí Prometheus v přehledech kontejnerů, abyste mohli používat zobrazení Přehledy kontejnerů s daty Prometheus.
- Pokud chcete zlepšit prostředí dotazů s daty shromážděnými službou Container Insights a snížit náklady na shromažďování, povolte schéma ContainerLogV2 pro každý cluster. Pokud k občasnému řešení potíží používáte jenom protokoly, zvažte konfiguraci této tabulky jako základních protokolů.
- Pomocí předvoleb nákladů popsaných v části Povolení nastavení optimalizace nákladů v Přehledech kontejnerů můžete snížit náklady na příjem dat přehledů kontejnerů snížením množství shromážděných dat. Zakažte shromažďování metrik tak, že nakonfigurujete Přehledy kontejnerů tak, aby shromažďovat pouze protokoly a události , protože mnoho stejných hodnot metrik jako Prometheus.
Pokud máte existující řešení pro shromažďování protokolů, postupujte podle pokynů pro tento nástroj nebo povolte Přehledy kontejnerů a pomocí funkce exportu dat pracovního prostoru služby Log Analytics odešlete data do služby Azure Event Hubs a přeposílejte je do alternativního systému.
Shromažďování protokolů řídicí roviny pro clustery AKS
Protokoly pro komponenty řídicí roviny AKS se implementují v Azure jako protokoly prostředků. Container Insights tyto protokoly nepoužívá, takže je potřeba vytvořit vlastní dotazy na protokoly, abyste je mohli zobrazit a analyzovat. Podrobnosti o struktuře protokolů a dotazech najdete v tématu Jak dotazovat protokoly z Container Insights.
Vytvořte nastavení diagnostiky pro každý cluster AKS pro odesílání protokolů prostředků do pracovního prostoru služby Log Analytics. Azure Policy použijte k zajištění konzistentní konfigurace napříč několika clustery.
Existují náklady na odesílání protokolů prostředků do pracovního prostoru, takže byste měli shromažďovat pouze kategorie protokolů, které chcete použít. Popis kategorií dostupných pro AKS najdete v protokolech prostředků. Začněte tím, že shromáždíte minimální počet kategorií a pak upravíte nastavení diagnostiky tak, aby se shromažďují další kategorie podle vašich potřeb a abyste porozuměli souvisejícím nákladům. Pokud potřebujete zachovat informace z důvodů dodržování předpisů, můžete do účtu úložiště Azure posílat protokoly, abyste snížili náklady. Podrobnosti o nákladech na příjem a uchovávání dat protokolů najdete v podrobnostech o cenách protokolů služby Azure Monitor.
Pokud si nejste jistí, které protokoly prostředků se mají na začátku povolit, použijte následující doporučení, která jsou založená na nejběžnějších požadavcích zákazníků. Pokud potřebujete, můžete později povolit další kategorie.
Kategorie | Zapnout? | Cíl |
---|---|---|
kube-apiserver | Povolit | Pracovní prostor služby Log Analytics |
kube-audit | Povolit | Azure Storage. Tím se náklady zachovají na minimum, ale protokoly auditu se zachovají, pokud je vyžaduje auditor. |
kube-audit-admin | Povolit | Pracovní prostor služby Log Analytics |
kube-controller-manager | Povolit | Pracovní prostor služby Log Analytics |
kube-scheduler | Zakázat | |
automatické škálování clusteru | Povolení, pokud je povolené automatické škálování | Pracovní prostor služby Log Analytics |
stráž | Povolení, pokud je povolené ID Microsoft Entra | Pracovní prostor služby Log Analytics |
Všechny metriky | Zakázání, protože se metriky shromažďují ve spravovaném systému Prometheus | Pracovní prostor služby Log Analytics |
Pokud máte existující řešení pro shromažďování protokolů, postupujte podle pokynů pro tento nástroj nebo povolte přehledy kontejnerů a pomocí funkce exportu dat pracovního prostoru Služby Log Analytics odešlete data do centra událostí Azure a přeposílejte je do alternativního systému.
Shromažďování protokolu aktivit pro clustery AKS
Změny konfigurace clusterů AKS se ukládají do protokolu aktivit. Vytvořte nastavení diagnostiky pro odeslání těchto dat do pracovního prostoru služby Log Analytics, abyste je mohli analyzovat s jinými daty monitorování. Za tuto kolekci dat nejsou žádné náklady a data můžete analyzovat nebo upozorňovat pomocí Log Analytics.
Monitorování úrovně 2 – komponenty na úrovni clusteru
Úroveň clusteru zahrnuje následující komponenty:
Komponenta | Požadavky na monitorování |
---|---|
Uzel | Seznamte se se stavem připravenosti a výkonem procesoru, paměti, disku a IP adres pro každý uzel a proaktivně monitorujte trendy využití před nasazením všech úloh. |
Následují běžné scénáře monitorování komponent na úrovni clusteru.
Přehledy kontejnerů
- Zobrazení clusteru vám umožní zobrazit výkon uzlů v clusteru, včetně využití procesoru a paměti.
- Zobrazení Uzly slouží k zobrazení stavu jednotlivých uzlů a stavu a výkonu podů spuštěných na nich. Další informace o analýze stavu a výkonu uzlů najdete v tématu Monitorování výkonu clusteru Kubernetes pomocí Container Insights.
- V části Sestavy můžete pomocí sešitů Monitorování uzlů analyzovat kapacitu disku, vstupně-výstupní operace disku a využití GPU. Další informace o těchto sešitech najdete v tématu Sešity monitorování uzlů.
- V části Monitorování vyberte Sešity a potom Využití PROTOKOLU IP podsítě, abyste zobrazili přidělení a přiřazení IP adres na každém uzlu pro vybraný časový rozsah.
Řídicí panely Grafana
- Pomocí předem vytvořeného řídicího panelu ve spravované grafana pro Kubelet můžete zobrazit stav a výkon každého z nich.
- Pomocí řídicích panelů Grafana s hodnotami metrik Prometheus souvisejícími s disky, jako je například
node_disk_io_time_seconds_total
awindows_logical_disk_free_bytes
monitorování připojeného úložiště. - K dispozici je několik řídicích panelů Kubernetes, které vizualizují výkon a stav uzlů na základě dat uložených v systému Prometheus.
Log Analytics
- V dialogovém okně Dotazy pro váš pracovní prostor služby Log Analytics vyberte kategorii Kontejnery, abyste získali přístup k předem připraveným dotazům na protokoly clusteru, včetně dotazu protokolu inventáře imagí, který načítá data z tabulky ContainerImageInventory naplněné službami Container Insights.
Řešení potíží
- V případě scénářů řešení potíží možná budete muset přistupovat k uzlům přímo kvůli údržbě nebo okamžitému shromažďování protokolů. Z bezpečnostních důvodů nejsou uzly AKS přístupné z internetu, ale pomocí
kubectl debug
příkazu SSH se připojte k uzlům AKS. Další informace o tomto procesu najdete v tématu Připojení pomocí SSH k uzlům clusteru Azure Kubernetes Service (AKS) pro účely údržby nebo řešení potíží.
Analýza nákladů
- Nakonfigurujte OpenCost, což je opensourcový projekt neutrálního CNCF pro pochopení nákladů na Kubernetes, aby podporoval analýzu nákladů na cluster. Exportuje podrobná data nákladů do úložiště Azure.
- Data z OpenCost můžete použít k rozpisu relativního využití clusteru různými týmy ve vaší organizaci, abyste mohli přidělit náklady mezi jednotlivými týmy.
- Pomocí dat z OpenCost se ujistěte, že cluster využívá plnou kapacitu svých uzlů tím, že hustě zabalí úlohy, a na rozdíl od mnoha menších uzlů používá méně velkých uzlů.
Monitorování úrovně 3 – Spravované komponenty Kubernetes
Spravovaná úroveň Kubernetes zahrnuje následující komponenty:
Komponenta | Sledování |
---|---|
API Server | Monitorujte stav serveru rozhraní API a identifikujte případné zvýšení zatížení požadavků a kritických bodů v případě výpadku služby. |
Kubelet | Monitorujte Kubelet, který pomáhá řešit problémy se správou podů, nespouští se, uzly nejsou připravené nebo se ukončí pody. |
Následují běžné scénáře monitorování spravovaných komponent Kubernetes.
Přehledy kontejnerů
- V části Monitorování vyberte Metriky a zobrazte čítač Příchozí požadavky .
- V části Sestavy můžete pomocí sešitu Kubelet zobrazit stav a výkon jednotlivých kubeletů. Další informace o těchto sešitech najdete v tématu Sešity monitorování zdrojů.
Grafana
- Pomocí předem vytvořeného řídicího panelu ve spravované grafana pro Kubelet můžete zobrazit stav a výkon jednotlivých kubeletů.
- K úplnému zobrazení výkonu serveru API použijte řídicí panel, jako je například server rozhraní API Kubernetes. To zahrnuje například hodnoty latence požadavků a dobu zpracování pracovního fronty.
Log Analytics
Pomocí dotazů protokolu s protokoly prostředků můžete analyzovat protokoly roviny řízení vygenerované komponentami AKS.
Všechny aktivity konfigurace pro AKS se protokolují v protokolu aktivit. Když protokol aktivit odešlete do pracovního prostoru služby Log Analytics, můžete ho analyzovat pomocí Log Analytics. Například následující ukázkový dotaz se dá použít k vrácení záznamů, které identifikují úspěšný upgrade napříč všemi clustery AKS.
AzureActivity | where CategoryValue == "Administrative" | where OperationNameValue == "MICROSOFT.CONTAINERSERVICE/MANAGEDCLUSTERS/WRITE" | extend properties=parse_json(Properties_d) | where properties.message == "Upgrade Succeeded" | order by TimeGenerated desc
Řešení potíží
- V případě scénářů řešení potíží můžete přistupovat k protokolům kubeletu pomocí procesu popsaného v tématu Získání protokolů kubeletu z uzlů clusteru Azure Kubernetes Service (AKS).
Monitorování úrovně 4 – objekty a úlohy Kubernetes
Úroveň objektů a úloh Kubernetes zahrnuje následující komponenty:
Komponenta | Požadavky na monitorování |
---|---|
Nasazení | Monitorujte skutečný stav vs. požadovaný stav nasazení a stav a využití prostředků podů spuštěných na nich. |
Pody | Monitorujte stav a využití prostředků, včetně procesoru a paměti, podů spuštěných v clusteru AKS. |
Kontejnery | Monitorujte využití prostředků, včetně procesoru a paměti, kontejnerů spuštěných v clusteru AKS. |
Následují běžné scénáře monitorování objektů a úloh Kubernetes.
Přehledy kontejnerů
- Pomocí zobrazení Uzly a kontrolery můžete zobrazit stav a výkon podů spuštěných na nich a přejít k podrobnostem o stavu a výkonu jejich kontejnerů.
- Zobrazení Kontejnery slouží k zobrazení stavu a výkonu kontejnerů. Další informace o analýze stavu a výkonu kontejneru najdete v tématu Monitorování výkonu clusteru Kubernetes pomocí Container Insights.
- V části Sestavy zobrazte metriky nasazení pomocí sešitu Nasazení. Další informace najdete v tématu Metriky nasazení a HPA pomocí Container Insights.
Řídicí panely Grafana
- Pomocí předem připravených řídicích panelů ve spravované grafaně Grafana pro uzly a pody můžete zobrazit jejich stav a výkon.
- K dispozici je několik řídicích panelů Kubernetes, které vizualizují výkon a stav uzlů na základě dat uložených v systému Prometheus.
Živá data
- Ve scénářích řešení potíží poskytuje Container Insights přístup k živým protokolům kontejnerů AKS (stdout nebo stderror), událostem a metrikám podů. Další informace o této funkci najdete v tématu Zobrazení protokolů, událostí a metrik podů Kubernetes v reálném čase.
Upozornění pro inženýra platformy
Výstrahy ve službě Azure Monitor proaktivně upozorňují na zajímavá data a vzory v datech monitorování. Umožňují vám identifikovat a řešit problémy ve vašem systému předtím, než si jich zákazníci všimnou. Pokud máte existující řešení ITSM pro upozorňování, můžete ho integrovat se službou Azure Monitor. Data pracovního prostoru můžete také exportovat a odesílat data z pracovního prostoru služby Log Analytics do jiného umístění, které podporuje vaše aktuální řešení upozornění.
Typy výstrah
Následující tabulka popisuje různé typy vlastních pravidel upozornění, která můžete vytvořit na základě dat shromážděných službami popsanými výše.
Typ upozornění | Popis |
---|---|
Upozornění Prometheus | Výstrahy prometheus jsou napsané v dotazovacím jazyku Prometheus (Prom QL) a používají se na metriky Prometheus uložené ve spravovaných službách Azure Monitoru pro Prometheus. Doporučená upozornění už obsahují nejběžnější výstrahy Prometheus a podle potřeby můžete vytvořit další pravidla upozornění. |
Pravidla upozornění metrik | Pravidla upozornění na metriky používají stejné hodnoty metrik jako průzkumník metrik. Ve skutečnosti můžete vytvořit pravidlo upozornění přímo z Průzkumníka metrik s daty, která právě analyzujete. Pravidla upozornění na metriky můžou být užitečná pro upozorňování na výkon AKS pomocí libovolné hodnoty v referenčních metrikách dat AKS. |
Pravidla upozornění prohledávání protokolu | Pomocí pravidel upozornění prohledávání protokolu vygenerujte upozornění z výsledků dotazu protokolu. Další informace najdete v tématu Vytváření upozornění prohledávání protokolů ze služby Container Insights a jak dotazovat protokoly z Container Insights. |
Doporučená upozornění
Začněte sadou doporučených upozornění Prometheus z pravidel upozornění na metriky v Container Insights (Preview), která zahrnují nejběžnější podmínky upozorňování pro cluster Kubernetes. Další pravidla upozornění můžete přidat později při identifikaci dalších podmínek upozorňování.
Vývojář
Vývojář kromě vývoje aplikace udržuje aplikaci spuštěnou v clusteru. Zodpovídají za provoz specifický pro aplikace, včetně výkonu aplikací a selhání a zachování spolehlivosti aplikace podle smluv SLA definovaných společností.
Služby Azure pro vývojáře
Následující tabulka uvádí služby, které vývojář běžně používá ke sledování stavu a výkonu aplikace spuštěné v clusteru.
Služba | Popis |
---|---|
Application Insights | Funkce služby Azure Monitor, která poskytuje monitorování výkonu aplikací (APM) pro monitorování aplikací spuštěných v clusteru Kubernetes od vývoje, prostřednictvím testování a do produkčního prostředí. Pomocí distribuovaných trasování můžete rychle identifikovat a zmírnit problémy s latencí a spolehlivostí. Podporuje OpenTelemetry pro instrumentaci neutrální dodavatele. |
Informace o konfiguraci shromažďování dat z aplikace spuštěné v clusteru a rozhodovacích kritérií pro nejlepší metodu pro konkrétní požadavky najdete v tématu Základy shromažďování dat služby Azure Monitor Application Insights .
Monitorování úrovně 5 – aplikace
Následují běžné scénáře monitorování aplikace.
Výkon aplikace
- Pomocí zobrazení Výkon v Application Insights můžete zobrazit výkon různých operací ve vaší aplikaci.
- Pomocí profileru .NET můžete zachytit a zobrazit trasování výkonu pro vaši aplikaci.
- Pomocí mapy aplikace můžete zobrazit závislosti mezi komponentami aplikace a identifikovat případné kritické body.
- Povolte distribuované trasování, které poskytuje profiler výkonu, který funguje jako zásobníky volání pro architektury cloudových a mikroslužeb, aby bylo možné dosáhnout lepší pozorovatelnosti interakce mezi službami.
Selhání aplikace
- Na kartě Selhání v Application Insights můžete zobrazit počet neúspěšných požadavků a nejčastější výjimky.
- Ujistěte se, že jsou správně nakonfigurovaná upozornění na anomálie selhání identifikované inteligentním zjišťováním.
Monitorování stavu
- Vytvořte test dostupnosti v Application Insights, abyste vytvořili opakovaný test pro monitorování dostupnosti a odezvy aplikace.
- Sestava SMLOUVY SLA slouží k výpočtu a hlášení smlouvy SLA pro webové testy.
- Pomocí poznámek můžete zjistit, kdy se nasadí nové sestavení, abyste mohli vizuálně zkontrolovat všechny změny výkonu po aktualizaci.
Protokoly aplikací
- Container Insights odesílá protokoly stdout/stderr do pracovního prostoru služby Log Analytics. V protokolech prostředků najdete popis různých protokolů a služeb Kubernetes, kde najdete seznam tabulek, do nichž se jednotlivé tabulky odesílají.
Síť služeb
- V případě clusterů AKS nasaďte doplněk istio-based service mesh, který poskytuje pozorovatelnost architektury mikroslužeb. Istio je opensourcová síť služeb, která transparentně vrství do existujících distribuovaných aplikací. Doplněk pomáhá při nasazení a správě istio pro AKS.