Aanbevelingen voor het ontwerpen en creëren van een bewakingssysteem
Van toepassing op deze aanbeveling voor de Well-Architected Operational Excellence-checklist: Power Platform
OE:06 | Een bewakingssysteem ontwerpen en implementeren om ontwerpkeuzes te valideren en toekomstige ontwerp- en zakelijke beslissingen te onderbouwen. Dit systeem legt operationele telemetrie, statistieken en logboeken vast die door de werklast worden gegenereerd en stelt deze beschikbaar. |
---|
In deze guide worden de aanbevelingen voor het ontwerpen en maken van een bewakingssysteem beschreven. Om uw workload effectief te monitoren op het gebied van beveiliging, prestaties en betrouwbaarheid hebt u een uitgebreid systeem nodig met een eigen stack die de basis vormt voor alle bewakings-, detectie- en waarschuwingsfuncties.
Definities
Term | Definitie |
---|---|
Logbestanden | Vastgelegde systeemgebeurtenissen. Logboeken kunnen verschillende soorten gegevens bevatten in een gestructureerd of vrije tekstindeling. Ze bevatten een tijdstempel. |
Metrische gegevens voor | Numerieke waarden die met regelmatige intervallen worden verzameld. Metrische gegevens beschrijven enkele aspecten van een systeem op een bepaald moment. |
Belangrijke ontwerpstrategieën
Volg deze kernprincipes om een uitgebreid bewakingssysteemontwerp voor uw workload te implementeren:
Maak indien mogelijk gebruik van de monitoringtools die door het platform worden aangeboden. Deze vereisen doorgaans weinig configuratie en kunnen diepgaande inzichten in uw werklast bieden die anders moeilijk te verkrijgen zijn.
Verzamel logboeken en metrische gegevens vanuit de gehele workloadstack. Alle weinig code- en code-first-componenten en -bronnen moeten worden geconfigureerd om gestandaardiseerde, zinvolle gegevens te produceren. En die gegevens moeten worden verzameld.
Bewaar de verzamelde gegevens in een gestandaardiseerde, betrouwbare en veilige opslagoplossing.
Verwerk opgeslagen gegevens op zodanige wijze dat deze kunnen worden verwerkt door analyse- en visualisatieoplossingen.
Analyseer verwerkte gegevens om nauwkeurig de status van de workload te bepalen.
Visualiseer de status van de workload in betekenisvolle dashboards of rapporten voor workloadteams en andere belanghebbenden.
Configureer bruikbare waarschuwingen en andere automatische reacties op op intelligente wijze gedefinieerde drempels om workloadteams op de hoogte te stellen wanneer zich problemen voordoen.
Neem bewakings- en waarschuwingssystemen op in uw algemene testprocedures voor workloads.
Zorg ervoor dat bewakings- en waarschuwingssystemen voortdurend verbeterd kunnen worden. Toepassings- en configuratiegedrag in productie biedt mogelijkheden voor continu leren. Verwerk die lessen in de ontwerpen voor bewakings- en waarschuwingssystemen.
Koppel de verzamelde en geanalyseerde monitoringgegevens terug aan uw systeem en gebruikersstromen om de status van de stromen te correleren met de gegevens en de algemene status van de werklast. ... Door die gegevens te analyseren in termen van de stromen, helpt uitlijnen u bij het uitvoeren van uw observatiestrategie met uw gezondheidsmodel.
Minimaliseer de opslag van persoonsgegevens om ervoor te zorgen dat u aan wet- en regelgeving voldoet. Als u identificeerbare informatie moet opslaan, zorg er dan bij het ontwerpen van uw oplossing voor dat u rekening houdt met vereisten waarmee personen kunnen verzoeken om verwijdering van hun informatie.
Registreer nooit gebruikerswachtwoorden of andere informatie die kan worden gebruikt om identiteitsfraude te plegen. Verwijder deze details uit de gegevens voordat die worden opgeslagen. Mogelijk moet informatie die is verzameld voor controle en beveiliging op grond van wettelijke vereisten worden gearchiveerd en opgeslagen. Deze gegevens zijn ook gevoelig en moeten mogelijk worden versleuteld of op een andere manier worden beschermd om manipulatie te voorkomen.
U moet alle functies van het bewakingssysteem zoveel mogelijk automatiseren. Bovendien moeten ze allemaal continu draaien, de hele dag, elke dag.
Deze werkstroompijplijn is een afspiegeling van het bewakingssysteem:
Verzameling
U moet alle workloadcomponenten configureren, of het nu weinig code of code-first componenten of platforminstellingen zoals omgevingen en beleid zijn, om telemetrie en gebeurtenissen zoals logboeken en statistieken vast te leggen.
Logboeken zijn vooral nuttig voor het detecteren en onderzoeken van afwijkingen. Normaal gesproken worden logs door de workloadcomponent gegenereerd en vervolgens naar het monitoringplatform verzonden of door het monitoringplatform automatisch opgehaald.
Metrische gegevens zijn vooral nuttig voor het bouwen van een gezondheidsmodel en het identificeren van trends in de prestaties en betrouwbaarheid van de workload. Metrische gegevens zijn ook nuttig voor het identificeren van trends in het gebruiksgedrag van uw gebruikers. Deze trends kunnen helpen bij het nemen van beslissingen over verbeteringen vanuit het perspectief van de klant. Doorgaans worden de metrische gegevens gedefinieerd in het bewakingsplatform en peilen het bewakingsplatform en andere tools de workload om de meetgegevens vast te leggen.
Workloadgegevens
Gebruik de kant-en-klare integratie met Application Insights om gegevens te verzamelen. Nadat Application Insights is ingeschakeld, krijgt u duidelijk inzicht in belangrijke gebeurtenissen, zowel in realtime als historisch.
Toepassingslogboeken ondersteunen de end-to-endlevenscyclus van de toepassing. Logboekregistratie is essentieel om inzicht te krijgen in hoe de toepassing in verschillende omgevingen werkt, welke gebeurtenissen plaatsvinden en de omstandigheden waaronder deze plaatsvinden.
We raden u aan toepassingslogboeken en gebeurtenissen in alle belangrijke omgevingen te verzamelen. Scheid de gegevens zoveel mogelijk tussen omgevingen door voor elke omgeving verschillende gegevensopslagplaatsen te gebruiken, mits dat praktisch haalbaar is. Gebruik filters om ervoor te zorgen dat niet-kritieke omgevingen de interpretatie van productielogboeken niet bemoeilijken. Tot slot moeten bijbehorende logboekvermeldingen in de toepassing een correlatie-id vastleggen voor hun respectievelijke transacties.
Infrastructuur- en configuratiegegevens
Zorg ervoor dat u voor infrastructuurresources in uw workload zowel logboeken als metrische gegevens verzamelt. Omdat het een PaaS-aanbod (Platform as a Service) is, kunt u mogelijk beperkt logboeken vastleggen die betrekking hebben op de onderliggende infrastructuur. Power Platform U kunt echter wel logboeken en analyses vastleggen over configuratie- en beleidswijzigingen met betrekking tot de status van de workload en incidenten.
Verzamel zoveel mogelijk logboeken van uw cloudplatform. Mogelijk kunt u activiteitenlogboeken voor uw abonnement en diagnostische logboeken voor het beheervlak verzamelen.
Prestatieoverwegingen
Een complexe en zeer schaalbare toepassing kan enorme hoeveelheden gegevens genereren. De hoeveelheid gegevens kan prestatieproblemen veroorzaken, afhankelijk van hoe uitgebreid de tracering op toepassingsniveau is. De telemetrieoplossing mag geen knelpunt vormen en moet schaalbaar zijn naarmate het systeem groeit.
Analyse
Nadat u gegevens uit verschillende bronnen hebt verzameld, analyseert u deze om de algemene gezondheid van het systeem te beoordelen. Zorg dat u voor deze analyse goed weet:
- Hoe u gegevens structureert op basis van de belangrijkste prestatie-indicatoren (KPI's) en andere prestatiemetingen die u hebt gedefinieerd.
- Hoe u de gegevens kunt correleren die zijn vastgelegd in verschillende metrische gegevens en logboekbestanden. Deze correlatie is belangrijk wanneer u een reeks gebeurtenissen bijhoudt en kan u helpen bij het diagnosticeren van problemen.
In de meeste gevallen zal uw workload uit verschillende onderdelen bestaan en worden logboeken of gebeurtenissen in verschillende indelingen of tabellen vastgelegd. U moet de gegevens nauwkeurig combineren om inzicht te krijgen in de algehele status van de workload.
Uw oplossing kan bijvoorbeeld uit de volgende componenten bestaan: Power Platform
- Een canvas-app waarmee gebruikers met de gegevens kunnen interacteren
- Een modelgestuurde app waarmee beheerders instellingen voor de applicatie kunnen configureren
- Een cloudstroom die databewerkingen uitvoert
- Een exemplaar dat gegevens opslaat die verband houden met de bewerking Dataverse
- Een Azure-functie die gegevens ophaalt uit Azure-tabelopslag en wordt aangeroepen vanuit de toepassing
De gebruiksgegevens voor één enkele bedrijfsactiviteit kunnen alle onderdelen van de workload omvatten. Deze informatie moet worden gecorreleerd om een algemeen beeld te krijgen van het resource- en verwerkingsgebruik voor de bewerking.
Aanbevelingen voor analyse van gegevens
Correleer logboeken op toepassingsniveau en resourceniveau. Evalueer gegevens op beide niveaus om het detecteren en oplossen van problemen te optimaliseren.
Definieer duidelijke bewaartijden bij opslag voor niet-dynamische analyse. We raden dit altijd aan om historische analyse over een specifieke periode mogelijk te maken. Het kan ook helpen om de opslagkosten in de hand te houden. Implementeer processen die ervoor zorgen dat gegevens worden gearchiveerd naar goedkopere opslag en combineer gegevens voor trendanalyse op de lange termijn.
Analyseer langetermijntrends om operationele problemen te voorspellen. Evalueer langetermijngegevens om operationele strategieën te creëren en ook om te voorspellen welke operationele problemen zich waarschijnlijk zullen voordoen, en wanneer. U merkt bijvoorbeeld dat de gemiddelde reactietijden in de loop der tijd langzaam oplopen en het maximale doel naderen.
Visualisatie
Visualisatie bij statusbewaking is van cruciaal belang om inzicht te krijgen in de status van de workload. Met visualisatie kunt u snel problemen en trends identificeren. Ook krijgt u inzicht in de effecten van wijzigingen die u in de werklast aanbrengt.
Dashboards
De meestgebruikte manier om gegevens te visualiseren is door gebruik te maken van dashboards. Deze kunnen informatie weergeven in de vorm van diagrammen of grafieken. Deze items kunnen worden geparametriseerd en een analist kan voor elke specifieke situatie de belangrijke parameters selecteren, zoals de tijdsperiode.
Stem uw dashboards af op uw statusmodel, zodat ze aangeven wanneer de workload of onderdelen van de workload in orde, verslechterd of beschadigd zijn.
Om een dashboardsysteem effectief te laten werken, moet het betekenisvol zijn voor het workloadteam. Visualiseer informatie die betrekking heeft op de status van de workload en die ook actiegericht is. Wanneer de workload of een onderdeel ervan verslechterd of beschadigd is, moeten leden van het workloadteam gemakkelijk kunnen vaststellen waar in de workload het probleem is ontstaan en met corrigerende maatregelen of onderzoeken kunnen beginnen. Omgekeerd kan het toevoegen van informatie die niet bruikbaar is of die niet gerelateerd is aan de gezondheid van de werklast, het dashboard onnodig complex en frustrerend maken voor teamleden die proberen achtergrondruis te onderscheiden van bruikbare gegevens.
Mogelijk hebt u dashboards voor belanghebbenden of ontwikkelaars die zo zijn aangepast dat ze alleen gegevens weergeven over de workload die zij relevant vinden. Zorg ervoor dat het workloadteam begrijpt welke soorten gegevenspunten die andere teams willen zien en een voorbeeld van de dashboards bekijkt voordat ze deze delen om te controleren of ze duidelijk zijn. Het aanbieden van dashboards over uw werklast aan belanghebbenden is een goede manier om hen op de hoogte te houden van de status van de werklast. Het kan echter averechts werken als belanghebbenden de gegevens niet goed begrijpen.
Beperk de toegang tot het dashboard tot geautoriseerd personeel. Dashboards kunnen gevoelige informatie bevatten. U moet ook de onderliggende gegevens beschermen om te voorkomen dat gebruikers deze wijzigen.
Rapportage
Rapportage wordt gebruikt om een totaalbeeld van het systeem te genereren. Hierin kunnen historische gegevens en actuele informatie worden meegenomen. Rapportagevereisten vallen in twee brede categorieën: operationele rapportage en beveiligingsrapportage.
Operationele rapportage omvat doorgaans:
- Het samenvoegen van metrische gegevens die u kunt gebruiken om inzicht te krijgen in het gebruik van resources van het volledige systeem of opgegeven subsystemen tijdens een opgegeven tijdsbestek.
- Het identificeren van trends in het resourcegebruik voor het gehele systeem of bepaalde subsystemen gedurende een bepaalde periode.
- Het bijhouden van uitzonderingen die zich gedurende een bepaalde periode in het hele systeem of in specifieke subsystemen hebben voorgedaan.
- Bepalen hoe efficiënt de applicatie is voor de geïmplementeerde resources en nagaan of het volume van de resources en de bijbehorende kosten kunnen worden verminderd zonder dat dit onnodig ten koste gaat van de prestaties.
Beveiligingsrapportage volgt het gebruik van het systeem door klanten. Het kan het volgende omvatten:
- Het controleren van bewerkingen van gebruikers. Deze taak vereist het vastleggen van de individuele aanvragen die elke gebruiker voltooit, samen met datums en tijden. De gegevens moeten zo worden gestructureerd dat een beheerder snel de reeks bewerkingen kan reconstrueren die een gebruiker gedurende een bepaalde periode voltooit.
- Het bijhouden van het gebruik van resources op gebruiker. Voor deze taak moet worden vastgelegd hoe elk verzoek van een gebruiker toegang krijgt tot de verschillende bronnen in het systeem en hoe lang. Een beheerder kan deze gegevens gebruiken om per gebruiker een gebruiksrapport te genereren voor een bepaalde periode, eventueel voor facturering.
Waarschuwingen
Om ervoor te zorgen dat het systeem in orde, responsief en veilig blijft, kunt u waarschuwingen instellen zodat operators er tijdig op kunnen reageren. Een waarschuwing kan voldoende contextgebonden informatie bevatten om hen te helpen snel aan de slag te gaan met diagnostische activiteiten.
Aanbevelingen voor waarschuwingen
- Definieer een proces voor waarschuwingsreacties waarmee de verantwoordelijke eigenaren en acties worden geïdentificeerd.
- Configureer waarschuwingen voor een goed gedefinieerd bereik en pas de uitgebreidheid aan om ruis te minimaliseren.
- Gebruik een geautomatiseerde waarschuwingsoplossing, zoals Splunk of Azure Monitor, in plaats van dat mensen actief naar problemen moeten zoeken.
- Gebruik waarschuwingen om herstelprocessen operationeel te maken. Maak bijvoorbeeld automatisch tickets aan om problemen en oplossingen bij te houden.
Drempelwaarden
Er worden waarschuwingen gegenereerd wanneer drempelwaarden worden overschreden, zoals gedetecteerd door uw bewakingssysteem. Zorg ervoor dat de drempelwaarden die u instelt u doorgaans voldoende tijd geven om de noodzakelijke wijzigingen in uw workload door te voeren om verslechtering of uitval te voorkomen. U moet ook de noodzakelijke foutafhandeling implementeren en bekende fouten in uw workload opsporen om het aantal waarschuwingen te beperken. Configureer bijvoorbeeld beleid voor opnieuw proberen voor uw acties in cloudstromen, zodat een nieuwe poging wordt gedaan als onderdeel van de stroomuitvoering, en alleen als herhaalde pogingen mislukken en er een stroomfout wordt geregistreerd en er een waarschuwing wordt verzonden. Meer informatie vindt u in Aanbevelingen voor het ontwerpen van een betrouwbare bewakings- en waarschuwingsstrategie.
Power Platform-facilitering
Power Platform integreert met Application Insights, dat onderdeel is van het Azure Monitor-ecosysteem. Gebruik deze integratie voor:
Ontvang telemetrie over diagnostiek en prestaties die zijn vastgelegd door het Dataverse-platform in Application Insights. U kunt zich abonneren op het ontvangen van telemetrie over bewerkingen die toepassingen uitvoeren op uw Dataverse-database en binnen modelgestuurde apps. Deze telemetrie biedt informatie die u kunt gebruiken om problemen met betrekking tot fouten en prestaties te diagnosticeren en op te lossen.
Verbinden je canvas-apps naar Application Insights. U kunt deze analyses gebruiken om problemen te diagnosticeren en inzicht te krijgen in wat gebruikers met uw apps doen. U kunt informatie verzamelen om u te helpen betere zakelijke beslissingen te nemen en de kwaliteit van uw apps te verbeteren.
Configureer Power Automate telemetrie zodat deze naar Application Insights stroomt. U kunt bijvoorbeeld cloudstroom-uitvoeringen bewaken en waarschuwingen maken voor mislukte cloud-flow-uitvoeringen.
Leg telemetriegegevens van uw Microsoft Copilot Studio copiloot vast voor gebruik in Azure Application Insights. Met deze telemetrie kunt u geregistreerde berichten en gebeurtenissen bewaken die naar en van uw copiloot worden verzonden, onderwerpen die tijdens gebruikersgesprekken moeten worden geactiveerd en aangepaste telemetriegebeurtenissen die vanuit uw onderwerpen kunnen worden verzonden.
Power Platform bronnen loggen activiteiten in de Microsoft Purview compliance portal. De meeste gebeurtenissen zijn beschikbaar binnen 24 uur na de activiteit. Gebruik deze informatie niet voor realtime bewaking. Voor meer informatie over het loggen van activiteiten in Power Platform raadpleegt u:
- Power Apps
- Power Automate
- Copilot Studio
- Power Pages
- Power Platform connectoren
- Gegevens verliespreventie
- Power Platform administratieve logs
- Dataverse auditeren
Uw Power Platform werklast kan Azure-resources omvatten. Meer informatie vindt u in Aanbevelingen voor het ontwerpen en maken van een monitoringsysteem.
De Power Platform CoE Starter Kit is een referentie-implementatie die een verzameling onderdelen en hulpmiddelen omvat die zijn ontworpen om u op weg te helpen met het ontwikkelen van een strategie voor het invoeren en ondersteunen van Power Platform. De CoE Starter Kit bevat een uitgebreide set dashboards. Meer informatie vindt u in Krijg diepgaand inzicht in uw Microsoft Power Platform adoptie met het CoE Power BI dashboard.
De Power Platform-kit voor automatisering is een set tools die het gebruik en de ondersteuning van Power Automate voor bureaublad versnelt bij automatiseringsprojecten. De kit biedt tools waarmee u automatiseringsprojecten kunt beheren en bewaken om het bespaarde geld en het investeringsrendement te schatten. Een onderdeel van de Automation Kit is het controlecentrum, dat de functie Monitor bureaubladstroom runs aanvult. De belangrijkste focus van het controlecentrum is een orkestratievisie voor ondersteuningsanalisten en organisaties om te monitoren, actie te ondernemen en te waarschuwen wanneer dat nodig is.
Gerelateerde informatie
- Aanbevelingen voor het ontwerpen van een betrouwbare monitoring- en waarschuwingsstrategie
- Aanbevelingen voor monitoring en detectie van bedreigingen