Doporučení pro shromažďování údajů o výkonu
Platí pro toto doporučení kontrolního seznamu efektivity výkonu pro Power Platform Well-Architected:
PE:04 | Shromažďujte údaje o výkonu. Komponenty a toky úlohy by měly poskytovat automatické, průběžné a srozumitelné metriky a protokoly. Shromažďujte údaje na různých úrovních úlohy, jako je aplikace, platforma, data a operační systém. |
---|
Shromažďování údajů o výkonu je proces shromažďování metrik a protokolů, které poskytují informace o výkonu úlohy. Tato data zahrnují číselné hodnoty, které jsou známé jako metriky. Metriky popisují stav systému v určitém okamžiku. Údaje o výkonu také zahrnují protokoly, které obsahují různé typy dat uspořádaných do záznamů.
Shromažďováním údajů o výkonu můžete sledovat a analyzovat výkon úlohy. Tyto informace můžete použít k identifikaci problémových míst výkonu, odstraňování problémů a k rozhodování na základě dat s cílem zlepšit celkovou efektivitu výkonu úlohy.
Bez přehledů založených na datech si možná nebudete vědomi základních problémů s výkonem nebo příležitostí k optimalizaci. Mezi potenciální výsledky patří pomalejší doba odezvy, snížená propustnost a v konečném důsledku neoptimální uživatelská zkušenost. Nedostatek údajů o výkonu navíc ztěžuje včasnou diagnostiku a odstraňování problémů, což vede k prodlouženým prostojům a snížené produktivitě.
Definice
Pojem | definice |
---|---|
Protokoly aktivit | Protokoly, které sledují operace správy prostředků, například odstranění prostředku. |
Protokoly aplikací | Protokoly, které sledují informace o událostech, chybách a dalších aktivitách aplikace, například přihlášení nebo selhání připojení k databázi. |
Nástroj pro monitorování výkonu aplikací (APM) | Nástroj, který monitoruje a vykazuje výkon aplikace. |
Instrumentace kódu | Přímé nebo nepřímé zaznamenání metrik výkonu z perspektivy kódu aplikace. Zaznamenané metriky zahrnují metriky toku, využití prostředků a metriky specifické pro jazyk nebo běhové prostředí. |
Distribuované trasování | Shromažďování a korelace metrik napříč komponentami distribuované úlohy. |
Jímka metrik | Cílové úložiště pro vaše metriky, které koreluje data časových řad pro analýzu. |
Protokoly platformy | Diagnostická a auditní data, která zahrnují protokoly prostředků, protokoly aktivit a protokoly auditu. |
Metriky platformy | Číselné hodnoty, které zaznamenávají výkon úlohy v konkrétním čase. |
Protokoly zdrojů | Data, která systém generuje. Poskytují informace o stavu systému. |
Strukturované protokolování | Definování srozumitelného formátu pro protokolování zpráv, obvykle jako páry klíč–hodnota. |
Klíčové strategie návrhu
Optimalizace výkonu vyžaduje data k měření aktuálního výkonu úlohy nebo toku vzhledem k jejich výkonnostním cílům. Potřebujete shromáždit správné množství dat s dostatečnou rozmanitostí, abyste mohli měřit výkon kódu a infrastruktury v souvislosti s výkonnostními cíli. Zajistěte, aby každá komponenta a tok v rámci úlohy automaticky generovaly nepřetržité a srozumitelné metriky a protokoly. Tato data potřebujete získávat z různých úrovní, jako je aplikace, platforma, úložiště a operační systém. Komplexní shromažďování údajů o výkonu umožňuje holistické pochopení výkonu, umožňuje přesnou identifikaci neefektivnosti a cesty ke zlepšení.
Centralizace údajů o výkonnosti
Centralizace výkonnostních metrik a protokolů je proces shromažďování výkonnostních metrik a protokolů z různých zdrojů a jejich ukládání na centrální místo. Vytvořte centrální jímku metrik a centrální jímku protokolů. Tato centralizace umožňuje snadný přístup, analýzu a monitorování výkonnostních metrik a protokolů napříč různými systémy a komponentami. Centralizací metrik a protokolů získáte přehled o výkonu vaší úlohy. Zvolte vhodnou platformu nebo nástroj, který dokáže agregovat a ukládat metriky a protokoly výkonu úlohy.
Kompromis: Buďte obeznámeni s náklady na shromažďování metrik a protokolů. Obecně platí, že čím více metrik a protokolů shromáždíte, tím vyšší budou náklady.
Segmentace údajů o výkonu
Segmentace údajů o výkonu zahrnuje třídění a kategorizaci metrik a protokolů na základě jejich původu, účelu nebo prostředí. Měli byste například oddělit provozní data od neprovozních nebo rozlišovat mezi výkonnostními cíli a obchodními metrikami. Segmentace dat pomáhá s optimalizací konkrétních prostředí, usnadňuje odstraňování problémů a omezuje nepřesnosti při monitorování výkonu. Zachováním jasného rozlišení mezi různými typy dat můžete efektivněji zachytit, analyzovat a reagovat na relevantní metriky a lépe sladit stav úlohy s jejími cíli. K segmentaci údajů o výkonu zvažte následující doporučení:
Udržujte oddělena provozní a neprovozní data. Oddělením dat podle prostředí můžete zajistit cílené monitorování a optimalizaci každého prostředí. V provozních prostředích můžete lépe identifikovat a řešit problémy s výkonem, které přímo ovlivňují uživatele a obchodní operace. V neprovozních prostředích usnadňuje oddělení dat efektivní odstraňování problémů a dolaďování během testovací fáze před nasazením do provozního prostředí.
V každém prostředí použijte jednu sadu dat. Nepoužívejte jednu sadu dat pro výkonnostní cíle a druhou sadu dat pro výstrahy ohledně výkonnostních cílů. Používání různých sad dat vede k nepřesným výstrahám, které podkopávají efektivitu monitorování výkonu.
Oddělte výkonnostní cíle a obchodní metriky. Provozní a vývojové týmy používají výkonnostní cíle k monitorování stavu úlohy a plnění obchodních cílů. Obchodní metriky se týkají obchodních cílů nebo výkazů zákazníků. Zaznamenejte obchodní metriky do samostatného toku dat, i když se data přímo překrývají. Toto oddělení poskytuje flexibilitu pro zachycení správných dat a nezávislou analýzu dat.
Definování zásad uchovávání informací
Zásady uchovávání informací určují, jak dlouho by měly být uchovávány údaje o výkonu. Zavedení těchto zásad pomáhá efektivně spravovat úložiště a zajišťuje, že pro analýzu budou přístupná pouze nezbytná data. Tyto zásady podporují lepší výkon a splňují standardy dodržování předpisů. Zásady uchovávání dat protokolů a metrik byste měli nakonfigurovat, abyste umožnili efektivní odstraňování problémů a monitorování ve všech prostředích. Protokoly a metriky může být například potřeba uchovávat delší dobu v provozním než testovacím prostředí. Doba uchovávání by měla odpovídat požadavkům a předpisům vaší organizace. Rozhodněte se, jak dlouho budete data uchovávat pro účely analýzy a auditu. Archivujte data, která nepotřebujete pro okamžitou analýzu.
Shromažďování údajů o výkonu
Shromažďování dat zahrnuje monitorování a analýzu metrik výkonu úlohy, jako je propustnost, latence a časy dokončení, primárně shromážděné prostřednictvím instrumentačního kódu. Údaje o výkonu úlohy poskytují cenné informace o stavu a výkonu aplikace. Monitorováním a analýzou údajů o výkonu můžete identifikovat a odstraňovat problémy, optimalizovat výkon a činit informovaná rozhodnutí pro vaši úlohu.
Kód instrumentace
Instrumentace označuje proces vkládání fragmentů kódu nebo akcí do kódu úlohy; například vytváření vlastních událostí trasování v aplikaci plátna. Účelem instrumentace je zachytit údaje o výkonu během spuštění úlohy. Je nezbytné shromáždit metriky, které zdůrazňují kritické operace úlohy. Zaměřte se na metriky, jako je propustnost, latence a doba dokončení. Je důležité odlišit obchodní operace od ostatních operací. U dat obchodních operací se ujistěte, že jejich metadata jsou strukturována způsobem, který umožňuje samostatné sledování a uchovávání. Instrumentace kódu poskytuje následující výhody:
Identifikace problémových míst výkonu: Sledováním metrik, jako je uplynulý čas, můžete identifikovat problémová místa a podle toho optimalizovat kód.
Vyhodnocení chování systému při zatížení: Můžete vidět, jak si úloha vede v různých zátěžových scénářích. Tato data vám mohou pomoci identifikovat problémy související se škálovatelností, souběžností a využíváním prostředků.
Sledovánístavu a dostupnostiúlohy: Protože jsou klíčové ukazatele výkonu monitorovány v reálném čase, můžete dostávat výstrahy na potenciální problémy, které ovlivňují výkon a dostupnost aplikace.
Zlepšení uživatelského prostředí: Můžete získat přehled, jak uživatelé interagují s úlohou. Tyto informace použijte k optimalizaci uživatelského prostředí a identifikaci oblastí pro zlepšení.
Plánování kapacity a přidělování prostředků: Údaje o výkonu, které instrumentace shromažďuje, mohou poskytnout cenné informace o požadavcích na prostředky úlohy. Tyto informace vám mohou pomoci s rozhodnutím o plánování kapacity a přidělování prostředků.
Při instrumentaci kódu pro monitorování výkonu zvažte následující strategie:
Použití nástrojů APM: Nástroje pro monitorování výkonu aplikací (APM) shromažďují a analyzují data o výkonu, včetně metrik, trasování a protokolů. Nástroje APM nabízejí funkce, jako je instrumentace na úrovni kódu, sledování transakcí a profilování výkonu.
Vlastní instrumentace: Vývojáři mohou přidat vlastní kód ke shromažďování metrik výkonu, které jsou jedinečné pro jejich aplikaci a úlohu. Vlastní instrumentace může měřit doby běhu, sledovat využití prostředků nebo zaznamenávat konkrétní události.
Zaznamenání časů transakcí. Zaznamenávání časů transakcí souvisí s měřením kompletních časů pro klíčové technické funkce jako součást monitorování výkonu. Metriky na úrovni aplikace by měly zahrnovat kompletní časy transakcí. Tyto časy transakcí by měly pokrývat klíčové technické funkce, jako jsou databázové dotazy, doby odezvy pro externí volání rozhraní API a míru selhání kroků zpracování.
Použití telemetrických standardů. Zvažte použití knihoven instrumentace nástroje APM a nástrojů, které jsou založeny na standardu telemetrie, jako je OpenTelemetry.
Shromažďování údajů o výkonu prostředků
Shromažďováním údajů o výkonu prostředků můžete získat přehled o stavu a chování vaší úlohy. Údaje o výkonu prostředků poskytují informace o využití prostředků, což je klíčové pro plánování kapacity. Tyto údaje také poskytují přehled o stavu úlohy a mohou vám pomoci odhalit problémy a odstraňovat je. Zvažte následující doporučení:
Shromažďování metrik a protokolů pro každý prostředek. Každá služba má sadu metrik, které jsou jedinečné pro funkčnost prostředku. Tyto metriky vám pomohou porozumět stavu a výkonu prostředku.
Použití nástrojů platformy. Získejte inspiraci z vestavěných a integrovaných řešení monitorování, jako je Azure Monitor Insights. Tento nástroj zjednodušuje operace výkonu. Při výběru platformy zvažte nástroje platformy a investujte do vlastních nástrojů nebo sestav.
Monitorování provozu sítě. Monitorování síťového provozu znamená sledovat a analyzovat tok a vzorce dat při jejich pohybu po síťových cestách. Shromažďujte analýzy provozu a monitorujte provoz, který překračuje hranice podsítě. Vaším cílem je analyzovat a optimalizovat výkon sítě.
Shromažďování dat databáze a úložiště
Mnoho databázových a úložných systémů poskytuje své vlastní monitorovací nástroje. Tyto nástroje shromažďují údaje o výkonu specifické pro tyto systémy. Databázové a úložné systémy často generují protokoly, které obsahují události a indikátory související s výkonem. Shromažďujte data databáze a údaje o výkonu úložiště, abyste mohli identifikovat problémová místa, diagnostikovat problémy a činit informovaná rozhodnutí s cílem zlepšit celkový výkon a spolehlivost vaší úlohy. Zvažte shromažďování následujících typů údajů o výkonu:
Propustnost: Propustnost měří množství dat přečtených nebo zapsaných do úložného systému za určité časové období. Údaje o propustnosti udávají možnosti přenosu dat.
Latence: Latence měří, jak dlouho trvá operace ukládání. Údaje o latenci označují odezvu úložného systému.
IOPS (operace I/O za sekundu): Údaje o počtu operací čtení nebo zápisu, které může úložný systém provést za sekundu. Údaje I/O za sekundu označují odezvu a propustnost úložného systému.
Využití kapacity: Využití kapacity je množství využité úložné kapacity a kolik je k dispozici. Data o využití kapacity pomáhají organizacím plánovat budoucí potřeby úložiště.
Shromažďování údajů o výkonu konektoru
Čas strávený čekáním na dokončení operací integrovaných služeb může přispět k celkově špatnému výkonu úlohy. Pokud úloha používá konektory k integraci služeb, zvažte měření času stráveného každou operací konektoru, abyste vyhodnotili její dopad a rozhodli se, zda optimalizovat návrh úlohy. V závislosti na službě můžete použít historii spouštění nebo vlastní logiku k zachycení času stráveného operacemi konektoru.
Ověření a analýza dat
Vaše údaje o výkonu by měly být v souladu s cíli výkonu. Údaje musí zcela a přesně reprezentovat výkon úlohy nebo toku, protože jsou navázána na výkonnostní cíle. Například doba odezvy webové služby má výkonnostní cíl 500 milisekund. Učiňte z analýzy dat rutinu, protože častá vyhodnocení umožňují včasnou detekci a zmírnění problémů s výkonem.
Vytvoření výstrah. Je dobré vytvořit výstrahy, které umožňují provádět akce a rychlou identifikaci a nápravu problémů s výkonem. Tyto výstrahy by měly jasně uvádět prahovou hodnotu, kdy došlo k narušení výkonu, potenciální efekt na podnikání a dotyčné komponenty. Začněte nastavením běžné a doporučené výstrahy. Postupem času můžete tato kritéria upravit podle konkrétních potřeb. Primárním cílem těchto výstrah by mělo být předvídání potenciálních poklesů výkonu dříve, než přerostou ve významné problémy. Pokud nemůžete nastavit výstrahu pro externí závislost, zvažte navržení metody pro shromažďování nepřímých měření, jako je doba trvání pro volání závislosti.
Nastavení omezení shromažďování dat Určete a nastavte logické limity pro objem shromažďovaných dat a dobu jejich uchovávání. Telemetrie může někdy produkovat ohromující množství dat. Je nezbytné zaměřit se na zaznamenání pouze nejdůležitějších ukazatelů výkonu nebo mít účinný systém, který z údajů o výkonu získá srozumitelné poznatky.
Usnadnění díky Power Platform
Shromažďování dat o výkonu aplikací: Application Insights je funkce Azure Monitor, která pomáhá sledovat výkon a dostupnost aplikace. Data jsou službou Application Insights ukládána v protokolech Azure Monitor a vizualizována v panelech Výkon a Selhání. Data se exportují do vašeho prostředí Application Insights ve standardním schématu definovaném službou Application Insights. Můžete exportovat data Dataverse a Power Automate do Application Insights, připojit své aplikace plátna do Application Insights a zachytit telemetrická data z vašeho agenta Microsoft Copilot Studio pro použití v Azure Application Insights.
Služba Application Insights umožňuje zvolit zobrazení dat Serveru a Prohlížeče. Identifikací těchto operací s nejdelší dobou trvání můžete diagnostikovat potenciální problémy.
K analýze výkonu používejte nativní funkce platformy:Analýza v aplikaci Copilot Studio poskytuje komplexní přehled o výkonu agenta. Využívá technologii umělé inteligence (AI) k identifikaci toho, která témata mají největší dopad na míru eskalace, míru opuštění a míru řešení. Přehledy výkonu pro Power Apps analyzují uživatelská data modulu runtime a poskytují prioritní seznam doporučení, která tvůrcům pomohou zlepšit výkon modelem řízených aplikací.
Centralizace, segmentace a uchovávání údajů o výkonu: Microsoft již shromažďuje rozsáhlou telemetrii o cloudových tocích Dataverse a Power Automate a modelem řízených aplikacích. S integrací Application Insights platí, že správce klientů nebo prostředí poskytuje službě Application Insights instrumentační klíč a nastavuje proces exportu dat v centru pro správu Power Platform. Jakmile je nastavení dokončeno, telemetrie, kterou Microsoft shromáždí o vašem prostředí, jsou odeslány do vašeho prostředí Application Insights. Když používáte integraci Application Insights, obdržíte standardizovanou sadu telemetrie, která navazuje na Application Insights telemetrický datový model. Kromě této integrace můžete také připojit své aplikace plátna do Application Insights a zachytit telemetrická data z vašeho agenta Microsoft Copilot Studio pro použití v Azure Application Insights.
Shromažďování dat o výkonu prostředků Azure: Většina služeb Azure generuje protokoly a metriky platformy, které poskytují diagnostické a auditní informace. Povolením nastavení diagnostiky můžete určit protokoly a metriky platformy, které se mají shromažďovat a ukládat. Pro účely korelace povolte diagnostiku pro všechny podporované služby a odešlete protokoly do stejného cíle jako protokoly vaší aplikace.
Shromažďování dat o výkonu databáze:Microsoft Dataverse se integruje s Application Insights. Datový tok aktuálně poskytuje údaje o výkonu související s příchozími voláními rozhraní API systému Dataverse, voláními spuštění modulu plug-in systému Dataverse a volání SDK systému Dataverse. Chcete-li být informováni o problémech, nastavte výstrahy na základě prahových hodnot výkonu.
Ověřování a analýza údajů o výkonu: V rámci Azure Monitor můžete pomocí Azure Monitor Logs shromažďovat, analyzovat a vizualizovat data protokolů z vašich aplikací a systémů. Agregací protokolů můžete křížově dotazovat události a získat přehled o výkonu vaší aplikace. Další informace najdete v článcích Výpočty a možnosti nákladů Azure Monitor Logs** a Ceny pro Azure Monitor.
V Azure Monitor můžete definovat pravidla výstrah pro monitorování konkrétních metrik výkonu a aktivaci výstrah na základě předdefinovaných podmínek. Můžete například vytvořit pravidlo výstrahy, které vás upozorní, když doba odezvy překročí zadaný limit. Nakonfigurujte pravidlo výstrahy pro zasílání oznámení požadovaným příjemcům.
Když vytváříte pravidlo výstrahy, můžete definovat kritéria určující podmínky, kdy má být výstraha aktivována. Můžete nastavit prahové hodnoty, metody agregace, časové intervaly a frekvenci vyhodnocování. Definujte kritéria na základě vašich požadavků na monitorování výkonu. Kromě odesílání oznámení můžete určit akce, které se mají provést, když se aktivuje výstraha. Akce mohou zahrnovat odesílání e-mailů, volání webhooků nebo spouštění funkcí Azure. Vyberte příslušné akce, které budou reagovat na konkrétní scénář výstrahy.
Příklady
- Podnikové monitorování pomocí Azure Monitor
- Vytváření vlastních události trasování v aplikacích plátna
- Vytváření vlastních výstrah pro cloudové toky
- Analýza výkonu a využití agentů v Copilot Studio
Kontrolní seznam efektivity výkonu
Podívejte se na úplný soubor doporučení.