Rekommendationer för att utforma och skapa av ett övervakningssystem
Gäller för den här Power Platform checklisterekommendationen för driftförutsättningar för välstrukturerat ramverk:
OE:06 | Utforma och implementera ett övervakningssystem för att validera designval och fatta beslut om framtida design och affärsbeslut. Det här systemet samlar in och exponerar drifttelemetri, mått och loggar som genereras från arbetsbelastningen. |
---|
I den här guiden beskrivs rekommendationer för hur du utformar och skapar ett övervakningssystem. För att du effektivt ska kunna övervaka arbetsbelastningen avseende säkerhet, prestanda och tillförlitlighet behöver du ett omfattande system med en egen stack som utgör grunden för alla övervaknings-, identifierings- och aviseringsfunktioner.
Definitioner
Begrepp | Definition |
---|---|
Loggar | Registrerade systemhändelser. Loggar kan innehålla olika typer av data i ett strukturerat format eller textformat i friform. De innehåller en tidsstämpel. |
Mått | Numeriska värden som samlas in med regelbundna intervaller. Mått beskriver vissa aspekter av ett system vid en viss tidpunkt. |
Viktiga designstrategier
Om du vill implementera en design för ett omfattande övervakningssystem för arbetsbelastningen följer du de här huvudsatserna:
När det är praktiskt möjligt kan du dra nytta av övervakningsverktyg som tillhandahålls av plattformen, som vanligtvis kräver lite konfiguration och kan ge djupgående insikter om din arbetsbelastning som annars kan vara svåra att få.
Samla in loggar och mått från arbetsbelastningens hela stack. Alla lågkods eller kodbaserade komponenter och resurser bör konfigureras så att de ger standardiserade och meningsfulla data, och så att data måste samlas in.
Lagra insamlade data i en standardiserad, tillförlitlig och säker lagringslösning.
Bearbeta lagrade data så att de kan hanteras med hjälp av analys- och visualiseringslösningar.
Analysera bearbetade data för att noggrant fastställa tillståndet för arbetsbelastningen.
Visualisera tillståndet för arbetsbelastningen i meningsfulla instrumentpaneler eller rapporter för arbetsbelastningsteam och andra intressenter.
Konfigurera användbara aviseringar och andra automatiska svar till intelligent definierade tröskelvärden som meddelar arbetsbelastningsteamen när problem uppstår.
Inkludera övervaknings- och aviseringssystem i de övergripande testmetoderna för arbetsbelastningen.
Se till att det finns utrymme för kontinuerliga förbättringar av övervaknings- och aviseringssystemen. App- och konfigurationsbeteendet i produktion ger möjligheter till kontinuerliga inlärning. Införliva dessa erfarenheter i övervaknings- och aviseringsdesignen.
Koppla övervakningsdata som du samlar in och analyserar tillbaka till ditt system och dina användarflöden för att korrelera flödenas hälsotillstånd med data samt arbetsbelastningens övergripande hälsa. Genom att analysera dessa data när det gäller flödena kan du anpassa din observerbarhetsstrategi till din hälsomodell.
Minimera lagringen av identifierbar information för att säkerställa att du följer lagar och regler. Om du behöver lagra identifierbar information måste du ta hänsyn till krav som gör det möjligt för enskilda personer att begära att deras information tas bort när du utformar din lösning.
Registrera aldrig användarlösenord eller annan information som kan användas för identitetsbedrägeri. Rensa bort den informationen innan den lagras. Regelkrav kan bestämma att information som samlas in för granskning och säkerhet måste arkiveras och sparas. Dessa data är också känsliga och kan behöva krypteras eller på annat sätt skyddas för att förhindra manipulering.
Du bör automatisera alla funktioner i övervakningssystemet så mycket som möjligt, och allt ska köras kontinuerligt, hela dagen, varje dag.
Denna arbetsflödespipeline illustrerar övervakningssystemet:
Samling
Du bör konfigurera alla arbetsbelastningskomponenter, oavsett om de är lågkods- eller kodbaserade komponenter eller plattformsinställningar som miljöer och principer, för att samla in telemetri och händelser som loggar och mått.
Loggar är i första hand användbara för att identifiera och undersöka avvikelser. Vanligtvis skapas loggar av arbetsbelastningskomponenten och skickas sedan till övervakningsplattformen eller hämtas av övervakningsplattformen med automatisering.
Mått är framför allt användbara om du vill skapa en hälsomodell och identifiera trender i arbetsbelastningens prestanda och tillförlitlighet. Mått är också användbara om du vill identifiera trender i användarnas användningsbeteende. Dessa trender kan underlätta beslut om förbättringar ur ett kundperspektiv. Vanligtvis definieras mått på övervakningsplattformen, och övervakningsplattformen och andra verktyg avsöks av arbetsbelastningen för att samla in mått.
Arbetsbelastningsdata
Använd den fördefinierade integrationen med Application Insights när du vill samla in data. När Application Insights har aktiverats kan du få tydlig insyn i viktiga händelser, både i realtid och historiskt.
Programloggar stöder programmets livscykel från slutpunkt till slutpunkt. Loggning är nödvändigt för att förstå hur appen fungerar i olika miljöer, vilka händelser som inträffar och under vilka förhållanden de inträffar.
Vi rekommenderar att du samlar in apploggar och händelser i alla större miljöer. Avgränsa data i så stor utsträckning som möjligt mellan miljöer genom att använda olika dataarkiv för varje miljö, om det är praktiskt möjligt. Med filter kan du se till att icke-kritiska miljöer inte komplicerar tolkningen av produktionsloggarna. Slutligen bör motsvarande loggposter i appen registrera ett korrelations-ID för sina respektive transaktioner.
Infrastruktur- och konfigurationsdata
Se till att du samlar in både loggar och mått för infrastrukturresurser i arbetsbelastningen. Eftersom Power Platform är ett PaaS-erbjudande (plattform som en tjänst) kan du vara begränsad i din möjlighet att samla in loggar som är relaterade till underliggande infrastruktur. Du kan emellertid samla in loggar och analyser över konfigurations- och principändringar som är relaterade till hälsa och incidenter i arbetsbelastningen.
Samla in loggar från din molnplattform så mycket som möjligt. Du kanske kan samla in aktivitetsloggar för prenumerations- och diagnostikloggar för hanteringsplanen.
Prestandaöverväganden
En komplex och mycket skalbar app kan skapa enorma mängder data. Mängden data kan orsaka prestandaproblem beroende på hur omfattande spårningen är på appnivå. Telemetrilösningen får inte fungera som en flaskhals och måste vara skalbar när systemet expanderar.
Analys
När du har samlat in data från olika källor analyserar du dem för att bedöma systemets övergripande välbefinnande. För den här analysen har du en tydlig förståelse av:
- Så här strukturerar du data baserat på KPI:er (Key Performance Indicators) och andra prestandamått som du har definierat.
- Korrelera data som samlas in i olika mått och loggfiler. Den här korrelationen är viktig när du spårar händelseförloppet och gör det enklare att diagnostisera problem.
I de flesta fall har arbetsbelastningen olika komponenter, och loggar eller händelser samlas in i olika format eller tabeller. Du måste kombinera data korrekt för att kunna skapa en förståelse för arbetsbelastningens övergripande hälsa.
Din Power Platform-lösning kan till exempel bestå av följande komponenter:
- En arbetsyteapp där användarna kan interagera med data
- En modellbaserad app som låter administratörer konfigurera inställningar för appen
- Ett molnflöde som utför dataåtgärder
- En Dataverse-instans som lagrar data som är associerade med åtgärden
- En Azure-funktion som hämtar data från Azure-tabellens lagring och anropas från appen
Användningsdata för en enskild affärsåtgärd kan omfatta alla komponenter i arbetsbelastningen. Informationen måste korreleras så att den ger en övergripande vy över resursen och bearbetningsanvändningen för åtgärden.
Rekommendationer för analys av data
Korrelera loggar på appnivå och resursnivå. Utvärdera data på båda nivåerna för att optimera identifiering och felsökning av problem.
Ange tydliga kvarhållningstider för lagring för kall analys. Vi rekommenderar att du aktiverar historisk analys under en viss period. Det kan också hjälpa dig att få kontroll över lagringskostnaderna. Implementera processer som säkerställer att data arkiveras om du vill få billigare lagring och aggregera data för analyser av långsiktiga trender.
Analysera långsiktiga trender om du vill förutse operativa problem. Utvärdera data på lång sikt om du vill skapa verksamhetsstrategier och för att förutse vilka operativa problem som troligen kommer att uppstå och när. Du kan till exempel märka att den genomsnittliga svarstiden långsamt ökar med tiden och närmar sig maxmålet.
Visualisering
Visualisering av hälsoövervakning är mycket viktigt för att förstå arbetsbelastningens tillstånd. Visualisering kan hjälpa dig att snabbt identifiera problem och trender, och kan också hjälpa dig att förstå effekten av ändringar du gör i arbetsbelastningen.
Instrumentpaneler
Det vanligaste sättet att visualisera data är att använda instrumentpaneler som kan visa information i form av diagram eller grafer. Objekten kan parameteriseras och en analytiker kan välja viktiga parametrar, till exempel tidsperioden, i en specifik situation.
Justera instrumentpanelerna mot din hälsomodell så att de visar när arbetsbelastningen eller komponenterna i arbetsbelastningen är felfria, försämrade eller inte felfria.
För att ett instrumentpanelssystem ska fungera måste det vara meningsfullt för arbetsbelastningsteamet. Visualisera information som relaterar till arbetsbelastningens hälsa och som också är användbar. När arbetsbelastningen eller en komponent försämras eller inte längre är felfri, bör medlemmarna i arbetsbelastningsteamet enkelt kunna identifiera var i arbetsbelastningen problemet har sitt ursprung och börja vidta korrigeringsåtgärder eller vidta lämpliga undersökningar. Omvänt, om du inkluderar information som inte kan åtgärdas eller som inte är relaterad till arbetsbelastningens hälsa kan instrumentpanelen bli onödigt komplex och frustrerande för teammedlemmar som försöker skilja bakgrundsbrus från användbara data.
Det kan finnas instrumentpaneler för intressenter eller utvecklare som är anpassade till att bara visa data om den arbetsbelastning de tycker är relevant. Se till att arbetsbelastningsteamet förstår vilka typer av datapunkter andra team är intresserade av att visa, och förhandsgranskar instrumentpanelerna innan de delas för att kontrollera tydligheten. Att tillhandahålla instrumentpaneler om din arbetsbelastning för intressenter är ett bra sätt att hålla dem informerade om arbetsbelastningens hälsa, men medför en risk för att det blir kontraproduktivt om intressenterna inte tydligt förstår data.
Begränsa åtkomsten till instrumentpanelen till behörig personal. Informationen på instrumentpanelerna kan vara känslig. Du bör också skydda underliggande data för att förhindra användare från att ändra dem.
Rapportering
Rapportering används för att skapa en övergripande vy av systemet. Den kan innehålla tidigare data och aktuell information. Rapporteringskraven finns i två kategorier: verksamhetsrapportering och säkerhetsrapportering.
Verksamhetsrapportering omfattar vanligtvis:
- Aggregeringsstatistik som du kan använda för att förstå resursutnyttjandet av det övergripande systemet eller angivna undersystem under ett angivet tidsfönster.
- Identifiera trender i resursanvändningen för det övergripande systemet eller angivna undersystem under en angiven period.
- Övervaka undantag som har inträffat i hela systemet eller i angivna undersystem under en angiven period.
- Fastställa effektiviteten i appen för de distribuerade resurserna och förstå om resursvolym och tillhörande kostnader kan minskas utan att prestanda försämras.
Säkerhetsrapportering spårar kundens användning av systemet. Den kan omfatta:
- Granskning av användaråtgärder. För den här uppgiften krävs det att du registrerar de enskilda förfrågningar som varje användare utför, samt datum och tid. Informationen bör vara strukturerad så att en administratör snabbt kan rekonstruera en sekvens av åtgärder som en användare utför under en angiven period.
- Spårning resursanvändning efter användare. Den här uppgiften kräver att du registrerar hur varje begäran från en användare får åtkomst till de olika resurserna i systemet och hur länge. En administratör kan använda dessa data för att generera en användningsrapport per användare för en angiven period, möjligen för fakturering.
Varningar
För att säkerställa att systemet förblir felfritt, responsivt och säkert kan du ställa in aviseringar så att operatörer snabbt kan reagera på dem. En avisering kan innehålla tillräckligt med sammanhangsbaserad information så att de snabbt kommer i gång med diagnostikaktiviteter.
Rekommendationer för avisering
- Definiera en process för aviseringssvar som identifierar de ansvariga ägarna och åtgärderna.
- Konfigurera aviseringar för ett väldefinierat omfång och justera omfattningen för att minimera bruset.
- Använd en automatiserad aviseringslösning, som Splunk eller Azure Monitor, i stället för att kräva att personer aktivt söker efter problem.
- Använd aviseringar för att operationalisera reparationsprocesser. Du kan till exempel automatiskt skapa ärenden för att spåra problem och lösningar.
Tröskelvärden
Aviseringar genereras när till exempel tröskelvärden överskrids, vilket övervakningssystemet har identifierat. Se till att de tröskelvärden du anger ger dig tillräckligt med tid för att implementera de nödvändiga ändringarna i arbetsbelastningen för att undvika försämringar eller avbrott. Du bör också implementera den felhantering som behövs och fånga upp kända fel i arbetsbelastningen för att minska antalet aviseringar. Du kan till exempel konfigurera återförsöksprinciper för dina åtgärder i molnflöden så att ett nytt försök görs som en del av flödeskörningen, och endast om upprepade återförsök misslyckas och flödesfel registreras och en avisering skickas. Läs mer i Rekommendationer för att utforma en tillförlitlig övervaknings- och aviseringsstrategi.
Underlätta Power Platform
Power Platform integreras med Application Insights, som ingår i Azure Monitor-ekosystemet. Använd integreringen för att:
Ta emot telemetri om diagnostik och prestanda som samlats in av Dataverse-plattformen i Application Insights. Du kan prenumerera på mottagning av telemetri om åtgärder som applikationer utför på din Dataverse databas och inom modellbaserade program. Denna telemetri innehåller information som du kan använda för att diagnostisera och felsöka problem relaterade till fel och prestanda.
Anslut dina arbetsyteappar till Application Insights. Med hjälp av dessa analyser kan du diagnostisera problem och förstå vad användarna gör med dina appar. Du kan samla in information som hjälper dig att fatta bättre affärsbeslut och förbättra kvaliteten på dina appar.
Konfigurera Power Automate-telemetri så att den flödar in i Application Insights. Du kan till exempel övervaka körningar av molnflöden och skapa aviseringar för körningsfel i molnflöden.
Samla in telemetridata från din Microsoft Copilot Studio agent för användning i Azure Application Insights. Du kan använda den här telemetrin för att övervaka loggade meddelanden och händelser som skickas till och från din agent, ämnen som ska utlösas under användarkonversationer och anpassade telemetrihändelser som kan skickas från dina ämnen.
Power Platform-resurser loggar aktiviteter i Microsoft Purview-portalen för regelefterlevnad. De flesta händelser är tillgängliga inom 24 timmar efter aktiviteten. Använd inte den här informationen för övervakning i realtid. Mer information om loggningsaktiviteter i Power Platform finns i:
- Power Apps
- Power Automate
- Copilot Studio
- Power Pages
- Power Platform-anslutningsprogram
- Dataförlustskydd
- Administrativa Power Platform-loggar
- Dataverse granskning
Din Power Platform arbetsbelastning kan innehålla Azure resurser. Läs mer i Rekommendationer för att designa och skapa ett övervakningssystem.
CoE-startpaketet för Power Platform är en referensimplementering som innehåller en samling komponenter och verktyg som har utformats för att hjälpa dig att komma igång med utveckling av en strategi för att implementera och stödja Power Platform. I startpaketet för CoE ingår en omfattande uppsättning instrumentpaneler. Läs mer i Få djupare insikter i din Microsoft Power Platform-implementering med CoE Power BI-instrumentpanelen.
Power Platform Automation Kit är en uppsättning verktyg som ökar hastigheten på användning och support för Power Automate för dator för automatiseringsprojekt. Paketet innehåller verktyg som hjälper dig att hantera automatiseringsprojekt och övervaka dem för att uppskatta sparade pengar och avkastning på investering (ROI). En del av automationspaketet är kontrollcentret, som kompletterar funktionen Övervaka datorflödeskörningar. Fokus för Kontrollcenter är en initierarvy för supportanalytiker och organisationer för att övervaka, vidta åtgärder och vara alerta vid behov.
Relaterad information
- Rekommendationer för utformning av en tillförlitlig övervakningsstrategi och aviseringsstrategi
- Rekommendationer för övervakning och hotidentifiering