Anbefalinger til design og oprettelse af et overvågningssystem
Dette gælder for denne Power Platform kontrolliste til velarkitekt driftsmæssige kontrollister:
OE:06 | Design og implementer et overvågningssystem, der validerer designvalg og giver grundlag for fremtidige design- og forretningsbeslutninger. Dette system registrerer og viser driftstelemetri, målepunkter og logfiler, der udsendes fra arbejdsbelastningen. |
---|
Denne vejledning beskriver anbefalinger til design og oprettelse af et overvågningssystem. Hvis du vil overvåge arbejdsbelastningen på en effektiv måde med hensyn til sikkerhed, ydeevne og pålidelighed, skal du have et omfattende system med sin egen stak, der giver grundlaget for alle overvågnings-, registrerings- og advarselsfunktioner.
Definitioner
Begreb | Definition |
---|---|
Logfiler | Registrerede systemhændelser. Logge kan indeholde forskellige typer data i et struktureret tekstformat eller fritekstformat. De indeholder et tidsstempel. |
Målepunkter | Numeriske værdier, der indsamles med regelmæssige intervaller. Metrikværdier beskriver nogle aspekter af et system på et bestemt tidspunkt. |
Vigtigste designstrategier
Hvis du vil implementere et omfattende systemdesign til overvågning af arbejdsbelastningen, skal du følge disse kernesætninger:
Når det er praktisk muligt, kan du drage fordel af overvågningsværktøjer, der leveres af platformen, som typisk kræver lidt konfiguration og kan give dyb indsigt i din arbejdsbyrde, som ellers kan være vanskelig at opnå.
Indhent logge og metrikværdier fra hele arbejdsbelastningsstakke. Alle første komponenter og ressourcer med lav kode og kode skal konfigureres til at producere standardiserede, meningsfulde data, og at data skal indsamles.
Lagring af de indsamlede data i en standardiseret, pålidelig og sikker lagerløsning.
Behandle lagrede data, så de kan håndteres af analyse- og visualiseringsløsninger.
Analysere de behandlet data for at fastlægge arbejdsbelastningens tilstand nøjagtigt.
Visualiser arbejdsbelastningens tilstand i meningsfulde dashboards eller rapporter for arbejdsbelastningsteams og andre interessenter.
Konfigurer vigtige beskeder, der kan bruges, og andre automatiske svar på intelligent definerede tærskelværdier for at give arbejdsbelastningsteam besked, når der opstår problemer.
Medtag overvågning og vigtige beskeder i den overordnede praksis for test af arbejdsbelastning.
Sikre, at der løbende kan foretages forbedringer af overvågnings- og advarselssystemer. Program- og konfigurationsfunktionsmåden i produktionen giver løbende læringsmuligheder. Indarbejde disse lektioner i overvågnings- og advarselsdesign.
Knyt de overvågningsdata, du indsamler og analyserer, til dit system og dine brugerflows for at korrelere flowenes tilstand med dataene samt arbejdsbelastningens overordnede tilstand. Hvis du analyserer disse data i forhold til flowene, hjælper det med at tilpasse din strategi for observerbarhed til din sundhedsmodel.
Minimer opbevaringen af identificerbare oplysninger for at sikre, at du overholder love og regler. Hvis du har brug for at gemme identificerbare oplysninger, skal du sørge for, at du, når du designer løsningen, tager højde for krav, der giver enkeltpersoner mulighed for at anmode om, at deres oplysninger slettes.
Registrer aldrig brugeradgangskoder eller andre oplysninger, der kan bruges til at oprette identitetssvindel. Fjern disse detaljer fra dataene, før de gemmes. Lovgivningskrav kan bestemme, at oplysninger, der indsamles med henblik på overvågning og sikkerhed, skal arkiveres og gemmes. Disse data er også følsomme og skal måske krypteres eller på anden måde beskyttes for at forhindre uautoriseret adgang.
Du skal automatisere alle funktioner i overvågningssystemet så meget som muligt, og de skal alle køre konstant hele dagen og hver dag.
Denne arbejdsprocespipeline illustrerer overvågningssystemet:
Samling
Du skal konfigurere alle komponenter i arbejdsbelastninger, uanset om de er komponenter med lav kode eller komponenter, hvor koden kommer først, eller platformsindstillinger, f.eks. miljøer og politikker, til at registrere telemetri og hændelser som logfiler og metrikværdier.
Logge er primært nyttige til registrering og registrering af modtagelige data. Logfiler oprettes typisk af arbejdsbelastningskomponenten og sendes derefter til overvågningsplatformen eller trækkes af overvågningsplatformen med automatisering.
Metrikværdier er primært nyttige til opbygning af en tilstandsmodel og identifikation af tendenser med hensyn til arbejdsbelastning og pålidelighed. Metrikværdier kan også bruges til at identificere tendenser i brugernes brugsfunktionsmåde. Disse tendenser kan hjælpe dig med at træffe beslutninger om forbedringer fra et kundesynspunkt. Metrikværdier defineres typisk på overvågningsplatformen, og overvågningsplatformen og andre værktøjer forespørger arbejdsbelastningen for at registrere metrikværdier.
Arbejdsbelastningsdata
Brug standardiseret integration med Application Insights til at indsamle data. Når Application Insights er aktiveret, kan du få et tydeligt overblik over vigtige begivenheder både i realtid og historisk.
Programlogge understøtter programmets livscyklus fra slutpunkt til slutpunkt. Logføring er vigtig for at forstå, hvordan programmet fungerer i forskellige miljøer, hvilke hændelser der indtræffer, og de betingelser, de opstår under.
Det anbefales, at du indsamler programlogfiler og hændelser på tværs af alle større miljøer. Adskil dataene så meget som muligt mellem miljøer ved at bruge forskellige datalagre for de enkelte miljøer, hvis det er praktisk. Brug filtre for at sikre, at ikke-kritiske miljøer ikke komplicerer de eksisterende produktionslogge. Til sidst skal de tilsvarende logposter i hele programmet registrere et korrelations-id for deres respektive transaktioner.
Infrastruktur og konfigurationsdata
I forbindelse med infrastrukturressourcer i din arbejdsbelastning skal du sikre, at du indsamler både logge og metrikværdier. Da Power Platform det er et PaaS-tilbud (Platform as a Service), kan du være begrænset i din mulighed for at registrere logfiler, der er relateret til den underliggende infrastruktur. Du kan dog hente logge og analyser om konfiguration og politikændringer i forbindelse med arbejdsbelastning og hændelser.
Du kan så vidt muligt indsamle logge fra din skyplatform. Du kan muligvis indsamle aktivitetslogfiler til dit abonnement samt diagnosticeringslogfiler for administrationen.
Ydelsesovervejelser
Et komplekst og skalerbart program kan generere omfattende mængder data. Mængden af data kan give ydeevneproblemer, afhængigt af hvor detaljeret sporingen er på programniveau. Telemetriløsningen må ikke fungere som en flaskehals og skal være skalerbar, efterhånden som systemet udvides.
Analyse
Når du har indsamlet data fra forskellige kilder, skal du analysere dem for at vurdere systemets generelle trivsel. Til denne analyse skal du have en klar forståelse af:
- Sådan struktureres data baseret på nøgletal (KPI'er) og andre præstationsmålinger, du har defineret.
- Sådan korrelerer du de data, der hentes i forskellige metrikværdier og logfiler. Denne korrelation er vigtig, når du sporer en række hændelser og kan hjælpe dig med at diagnosticere problemer.
I de fleste tilfælde har arbejdsbelastningen forskellige komponenter, og logfiler eller hændelser hentes i forskellige formater eller tabeller. Du skal kombinere dataene nøjagtigt for at få en forståelse af arbejdsbelastningens overordnede tilstand.
Din Power Platform løsning kan f.eks. bestå af følgende komponenter:
- En lærredsapp, der giver brugerne mulighed for at arbejde med dataene
- En modelbaseret app, der giver administratorer mulighed for at konfigurere indstillinger for programmet
- Et cloudflow, der udfører datahandlinger
- En Dataverse-forekomst, hvor der gemmes data, som er knyttet til handlingen
- En Azure-funktion, der henter data fra Azure-tabellager og kaldes fra programmet
Brugsdataene for en enkelt virksomhedsdrift kan strække sig over alle komponenter i arbejdsbelastningen. Disse oplysninger skal være korreleret for at give en overordnet visning af ressourcen og behandling af brugen af handlingen.
Anbefalinger til dataanalyse
Korrelere logfiler på programniveau og ressourceniveau. Evaluer data på begge niveauer for at optimere registrering og fejlfinding af problemer.
Definer tydelige opbevaringstider på lager til kold analyse Denne praksis anbefales, hvis du vil aktivere historisk analyse over en bestemt periode. Det kan også hjælpe dig med at styre lageromkostningerne. Implementer processer, der sikrer, at data arkiveres til lagring og aggregere data til analyse af en lang udvikling.
Analysere langsigtede tendenser for at løse driftsproblemer. Evaluer langsigtede data for at danne driftsstrategier og for at undersøge, hvilke driftsmæssige problemer der sandsynligvis vil opstå, og hvornår. Du kan f.eks. bemærke, at de gennemsnitlige svartider langsomt øges over tid og nærmer sig maksimummålet.
Visualisering
Visualisering i overvågning af tilstand er vigtig for at forstå arbejdsbelastningens tilstand. Visualisering kan hjælpe dig med hurtigt at identificere problemer og tendenser og kan også hjælpe dig med at forstå effekten af de ændringer, du foretager i arbejdsbelastningen.
Dashboards
Den mest almindelige måde at visualisere data på er at bruge dashboards, der kan vise oplysninger i form af diagrammer eller grafer. Disse elementer kan parameteriseres, og en analytiker kan vælge de vigtige parametre, f.eks. tidsperioden, for en bestemt situation.
Tilpas dine dashboards med din tilstandsmodel, så de angiver, hvornår arbejdsbelastningen eller komponenterne i arbejdsbelastningen er sunde, forringet eller uskadelige.
Hvis et dashboardsystem skal fungere effektivt, skal det give mening for arbejdsbelastningsgruppen. Visualiser oplysninger, der vedrører arbejdsbelastningens tilstand, og som også kan bruges. Når arbejdsbelastningen eller en komponent forringes eller ikke forringes, kan medlemmer af arbejdsbelastningsgruppen let identificere, hvor i arbejdsbelastningen problemet stammer fra, og begynde at udføre de rette handlinger eller undersøgelser. Hvis du derimod inkluderer oplysninger, der ikke kan handles på, eller som ikke er relateret til arbejdsbelastningens tilstand, kan dashboardet blive unødigt komplekst og frustrerende for teammedlemmer, der forsøger at skelne baggrundsstøj fra data, der kan handles på.
Du kan have dashboards til interessenter eller udviklere, der er tilpasset til kun at vise data om den arbejdsbelastning, de finder relevante. Sørg for, at arbejdsbelastningsgruppen forstår de typer datapunkter, som andre team er interesseret i at se, og få vist eksempler på dashboards, før de deles for at sikre, at de er tydelige. Hvis du stiller dashboards om din arbejdsbelastning til rådighed for interessenter, er det en god måde at holde dem orienteret om arbejdsbelastningens tilstand på, men der er risiko for, at det virker mod hensigten, hvis interessenterne ikke forstår dataene tydeligt.
Begræns adgang til dashboards til autoriserede medarbejdere. Oplysninger på dashboards kan være følsomme. Du skal også beskytte de underliggende data for at forhindre brugere i at ændre dem.
Rapportering
Rapportering bruges til at oprette en overordnet visning af systemet. Det kan indeholde historiske data og aktuelle oplysninger. Rapporteringskravene er opdelt i to brede kategorier: driftsmæssig rapportering og sikkerhedsrapportering.
Driftsrapportering omfatter typisk:
- Aggregering af statistiske data, som du kan bruge til at forstå ressourceforbruget for det overordnede system eller de angivne undersystemer i løbet af et angivet tidsrum.
- Identifikation af tendenser i ressourceforbrug for det overordnede system eller de angivne undersystemer i løbet af en bestemt periode.
- Overvågning af undtagelser, der er forekommet i hele systemet eller i angivne undersystemer i løbet af en bestemt periode.
- Fastlægge effektiviteten af programmet for de installerede ressourcer og finde ud af, om mængden af ressourcer og de tilknyttede omkostninger kan reduceres, uden at det påvirker ydeevnen uden problemer.
Sikkerhedsrapportering sporer kundens brug af systemet. Det kan omfatte:
- Overvågning af brugerhandlinger. Denne opgave kræver, at du registrerer de enkelte forespørgsler, som hver bruger fuldfører, sammen med datoer og klokkeslæt. Dataene skal være struktureret, så en administrator hurtigt kan angive rækkefølgen af handlinger, som en bruger fuldfører i løbet af en bestemt periode.
- Sporing af brugers ressourceforbrug. Denne opgave kræver, at det registreres, hvordan hver anmodning fra en bruger får adgang til de forskellige ressourcer i systemet og hvor længe. En administrator kan bruge disse data til at oprette en rapport over anvendelse efter bruger for en bestemt periode, muligvis til fakturering.
Beskeder
Som hjælp til at sikre, at systemet forbliver sundt, responsivt og sikkert, skal du angive vigtige beskeder, så operatorerne kan reagere på dem i god tid. En vigtig besked kan indeholde tilstrækkeligt kontekstafhængige oplysninger til at hjælpe dem til hurtigt at komme i gang med diagnosticeringsaktiviteter.
Anbefalinger til vigtige advarsler
- Definer en proces til respons på vigtige beskeder, der identificerer de ansvarlige ejere og handlinger.
- Konfigurer vigtige beskeder for et veldefineret omfang, og juster omfanget for at minimere omfanget.
- Brug en automatiseret advarselsløsning, f.eks. Splunk eller Azure Monitor, i stedet for at kræve, at brugere aktivt skal søge efter problemer.
- Brug vigtige beskeder til at udnytte processerne. Du kan f.eks. automatisk oprette billetter for at spore problemer og løsninger.
Tærskler
Der oprettes advarsler, når tærskelværdier overskrides, som det registreres af overvågningssystemet. Sørg for, at de tærskelværdier, du angiver generelt, giver dig tilstrækkelig tid til at implementere de nødvendige ændringer af arbejdsbelastningen for at undgå forringelser eller udfald. Du skal også implementere den nødvendige fejlbehandling og gribe kendte fejl i arbejdsbelastningen for at reducere antallet af vigtige beskeder. Du kan f.eks. konfigurere politikker for nye forsøg for dine handlinger i cloudflows, så der forsøges nyt som en del af kørslen af flowet, og kun hvis gentagne forsøg mislykkes, og flowfejl registreres, og der sendes en advarsel. Få mere at vide i Anbefalinger til design af en pålidelig anbefaling af overvågnings- og advarselsstrategi.
Power Platform-processtyring
Power Platform integreres med Application Insights, som er en del af Azure Monitor-økosystemet. Brug denne integration til at:
Modtage telemetri på diagnose og ydeevne, der registreres af Dataverse-platformen i Application Insights. Du kan abonnere på telemetri om handlinger, som programmer udfører Dataverse på din database og i modelbaserede apps. Denne telemetri kan bruges til at diagnosticere og foretage fejlfinding af problemer, der vedrører fejl og ydeevne.
Oprette forbindelse mellem dine lærredapps og Application Insights. Du kan bruge disse analyser til at diagnosticere problemer og forstå, hvad brugerne gør med dine apps. Du kan indsamle oplysninger, der kan hjælpe dig med at træffe bedre beslutninger i virksomheden og forbedre kvaliteten af dine apps.
Konfigurer Power Automate-telemetri til at flyde ind i Application Insights. Du kan f.eks. overvåge kørsel af cloudflow og oprette beskeder om fejl under kørsel af cloudflow.
Registrer telemetridata fra din Microsoft Copilot Studio agent til brug i Azure Application Insights. Du kan bruge denne telemetri til at overvåge logførte meddelelser og hændelser, der sendes til og fra din agent, emner, der skal udløses under brugersamtaler, og brugerdefinerede telemetrihændelser, der kan sendes fra dine emner.
Power Platform-ressourcer logfører aktiviteter i Microsoft Purview-overholdelsesportalen. De fleste hændelser er tilgængelige inden for 24 timer efter aktiviteten. Brug ikke disse oplysninger til overvågning i realtid. Du kan finde flere oplysninger om logføring af aktiviteter i Power Platform i:
- Power Apps
- Power Automate
- Copilot Studio
- Power Pages
- Power Platform-connectorer
- Forebyggelse af datatab
- Power Platform-administrative logge
- Dataverse-overvågning
Arbejdsbelastningen Power Platform kan omfatte Azure ressourcer. Få mere at vide i Anbefalinger til design og oprettelse af overvågningssystem.
Power Platform CoE-startpakken er en samling af komponenter og værktøjer, der er udviklet til at hjælpe dig med at komme i gang med at udvikle en strategi for indføring og understøttelse af Power Platform. CoE-startpakken indeholder et omfattende sæt dashboards. Flere oplysninger i Få dybdegående indsigt i din Microsoft Power Platform-indføring med CoE Power BI-dashboardet.
Power Platform Automatiseringspakken er et sæt værktøjer, der fremmer brugen og understøttelsen af Power Automate til skrivebord til automatiseringsprojekter. Pakken indeholder værktøjer, der kan hjælpe dig med at administrere automatisering af projekter og overvåge dem for at estimere de penge, der gemmes, og ROI (Return On Investment). En del af automatiseringspakken er kontrolcenteret, som supplerer funktionen Overvåg kørsler af skrivebordsflow. Hovedfokus i kontrolcenteret er en orkestreringsvisning, som supportanalytikere og organisationer kan overvåge, handle i og være opmærksom på, når det er nødvendigt.
Relaterede oplysninger
- Anbefalinger til udvikling af en pålidelig overvågnings- og advarselsstrategi
- Anbefalinger til overvågning og registrering af trusler