Driftöverväganden för Azure VMware Solution-arbetsbelastningar
I den här artikeln beskrivs designområdet för åtgärder för Azure VMware Solution. Syftet med den här artikeln är att skapa en driftsmodell för Azure VMware Solution och programmen i det VMware-programvarudefinierade datacentret (SDDC). Standardrutiner (SOP) är dokumenterade processer för att hantera en arbetsbelastning. Varje Azure VMware Solution-arbetsbelastning bör ha SOP:er för att styra åtgärder. Om du vill hålla dig i linje med affärsmålen och för att förhindra att metodtipsen används använder du SOP:er i en kontinuerlig cykel av utvärderings- och hälsokontroller som du kör på din Azure VMware Solution-arbetsbelastning.
Spåra programberoenden
Effekt: Driftsmässig excellens
IT-teamen ser kontinuerligt till att optimera distribution, hantering och underhåll av program, platser och tjänster. Den här metoden hjälper till att säkerställa höga prestanda, tillförlitlighet, skalbarhet och säkerhet. Optimering innebär att förstå hur program flödar i Azure VMware Solution-plattformen. Det handlar också om att undersöka externa beroenden och relationer som ligger utanför det privata molnet. En beroendekarta är ett värdefullt verktyg för utvecklare, programarkitekter och IT-team när de försöker förstå programstrukturen och beteendet. Att ha insikt i programkomponenter som programvara och infrastruktur, tjänster och externa beroenden ger ett visuellt sätt att förstå dataflöden, funktioner och API-anrop.
Rekommendationer
- Använd Application Insights för att spåra beroenden som databaser, API-anrop och externa tjänster.
- Använd funktionen tjänstkarta i Azure Monitor för att automatiskt identifiera och visualisera olika program- och infrastrukturkomponenter.
- Använd verktyg från tredje part som New Relic och Datadog för att identifiera och mappa beroenden.
- Använd anpassade skript eller konfigurationshanteringsverktyg från tredje part som spårar automatisering och distribution av beroenden.
Använda automatisering, versionskontrollsystem och blågröna distributioner
Effekt: Driftsmässig excellens
Organisationer kan minska tiden till marknaden och dra nytta av bättre samarbete och programvarukvalitet genom att använda DevOps-metoder. Automatisering kan till exempel påskynda distributionen och underhållet av program.
När du använder infrastruktur som kod (IaC) för att organisera infrastrukturdistributioner kan du dra nytta av förbättrad effektivitet i infrastrukturetablering. IaC kan också underlätta implementeringen av DevOps-principer i infrastrukturhantering.
- Du kan använda IaC för att skapa flera resurser i Azure VMware Solution. Exempel är hela det privata molnet eller enskilda komponenter som kluster, nätverksinstallationer och lagring. Verktyg som Azure Resource Manager, Bicep, Terraform, Azure CLI och PowerShell automatiserar etableringen och konfigurationen av resurser i Azure VMware Solution.
- När du använder IaC kan du uppdatera infrastrukturen genom att ändra kod. Den här metoden minskar den tid och det arbete som krävs för manuell konfiguration och etablering.
- Utdata som returneras från distributionen av IaC kan fungera som dokumentation för att underhålla och ge extra insyn i tillståndet och konfigurationen av etablerade resurser.
Versionskontrollsystem ger dig ett sätt att hantera din kod och använda versionshantering för att spåra och återställa ändringar efter behov.
När du behöver uppdatera programkod mellan servrar kan blågröna distributioner vara till hjälp på många sätt:
- De hjälper dig att hantera livscykeln för ett program från utveckling till produktion.
- De hjälper kunderna att få en konsekvent webbupplevelse när uppdateringar och korrigeringar tillämpas.
- De använder viktade algoritmer för att endast distribuera trafik till felfria servrar under underhåll.
Azure VMware Solution erbjuder inte metoder som ett molnbaserat program erbjuder för att uppnå blågröna distributioner. Men dessa distributioner är fortfarande möjliga i Azure VMware Solution:
- Innan du gör ändringar i programkonfigurationen ska du ta ögonblicksbilder av din miljö.
- Använd versionskontroll för att säkerställa att du kan återgå till ett senast känt bra tillstånd.
- Överväg att skapa en mellanlagringsmiljö som speglar produktion och distribuerar uppdateringar innan du går live.
- Från mellanlagringsmiljön utför du löpande uppdateringar till en delmängd servrar och testar ditt program.
Du kan minska manuellt arbete, minimera fel och förbättra resursanvändningen genom att automatisera rutinuppgifter som etablering, skalning och korrigering. DevOps-metoder är en viktig del av en välkonstruerad lösning för att effektivisera åtgärder, spara tid och hjälpa team att fokusera på mervärdesaktiviteter.
Rekommendationer
- Använd IaC för att distribuera och etablera infrastruktur på ett sätt som är repeterbart, granskningsbart och konsekvent.
- Automatisera expansion och kontraktion med hjälp av IaC.
- Använd versionskontrollsystem för att spåra ändringar, samarbeta och återställa kod till tidigare versioner efter behov.
- Dra nytta av det blågröna konceptet genom att skapa en mellanlagringsmiljö som speglar produktions- och testmiljöer innan du går live.
- Behåll det sista goda tillståndet för ditt program med hjälp av ögonblicksbilder, kloning av diskar och versionskontrollerad kod.
Definiera roller och processer
Effekt: Driftsmässig excellens
Väldefinierade roller och ansvarsområden bidrar till att säkerställa tydlighet, ansvarsskyldighet och effektiv hantering av en välkonstruerad Azure VMware Solution-arbetsbelastning. Att ha en definierad uppsättning standarder och strukturerade processer och veta vem som kör dem leder till effektiv drift och hjälper IT-organisationer att anpassa sina tekniska erbjudanden efter affärsmål och strategier. I takt med att Azure VMware Solution-miljön växer och utvecklas leder väldefinierade roller och ansvarsområden till enklare uppgiftsdelegering och möjligheten att skala lösningen utan avbrott. Resultatet är en bättre upplevelse för programmets användare.
Det är viktigt att ha en kultur av kontinuerlig förbättring som fokuserar på effektiva dagliga åtgärder för program i det privata molnet. Exempel på åtgärder är att underhålla serviceavtal (SLA), upprätthålla tillgänglighet, ha kapacitet för att minimera tjänststörningar och ha en smidig leverans. Azure VMware Solution gör det till exempel möjligt att utöka en miljö med minimala användarindata. Om du expanderar kontraktet manuellt bör du dokumentera vem som utför de associerade aktiviteterna och hur du utför dem. Azure VMware Solution-operatörer bör se till att nodreservationen är tillgänglig för att expandera miljön efter behov. Du kan till exempel utse personer som ansvarar för att identifiera underutnyttjade eller inaktiva resurser. Ge dessa personer en process för rätt storleksändring av virtuella datorer (VM) för att minska onödiga kostnader.
Programteam och utvecklare bör definiera kodningsriktlinjer för kodstruktur, undantag och felhantering. Du bör också ha metoder för att spåra ändringar, till exempel regelbundna kodgranskningar, API-dokumentation och regelbunden kodrefaktorisering. När du använder versionskontroll tillämpar du metodtips som förgrening, incheckningsmeddelanden och arbetsflöden för godkännande. De här metoderna kan göra koden konsekvent, enkel att felsöka och underhålla.
Rekommendationer
- Arbeta med CCoE-teamet (Cloud Center of Excellence) för att förstå standarder och riktlinjer för efterlevnad, säkerhet, programarkitektur och driftsprocesser.
- Ha ett säkerhets- och efterlevnadsteam som fokuserar på säkerhetsprinciper som är specifika för Azure VMware Solution. Låt också teamet utföra riskbedömningar och säkerställa efterlevnad av regelkrav.
- Anta ett ramverk som ITIL (Information Technology Infrastructure Library). Eller använd ISO-metoder (International Organization for Standardization) för att mappa dagliga åtgärder, processer och aktiviteter. Dessa metoder kan leda till snabbare kunskapsöverföringar, kontinuerliga förbättringar och förbättrad ändringshantering.
- Definiera kodningsstandarder och implementera säkerhetsrutiner under programutvecklingen.
Använda taggningsstrategier och metodtips
Effekt: Driftsmässig excellens
Du kan använda en taggningsstrategi för återbetalning och resursspårning. Taggar är nyckelparvärden som du definierar på resursnivå och som tillämpas under etableringen. Du kan använda IaC för att skapa, uppdatera och förstöra virtuella gästdatorer. Taggar och IaC fungerar tillsammans med konfigurationshanteringsverktyg. Du kan använda taggar i följande områden:
- Miljöer. Du kan använda taggar som produktion, QA eller utvecklingstest för att identifiera resurser.
- Kostnadsställen för att spåra resurskostnader och utgifter.
- Serviceavtal för att prioritera SLA-krav för resurser.
- Livscykeler. Du kan märka program som aktiva, arkiverade eller tillbakadragna.
- Kritiskhet, genom att märka resurser baserat på deras affärspåverkan och betydelse.
Som en del av din styrnings- och efterlevnadsstrategi bör en grupp ansvara för att identifiera resurser utan taggar. Den gruppen kan kombinera automatisering, granskning och processer för att identifiera och åtgärda resurser som inte uppfyller efterlevnadsprinciper för taggning.
De här taggningsövervägandena är allmänna. Det är viktigt att taggningsstrategin stöder effektiv resurskategorisering, hantering av resurslivscykel och rapportering i Azure VMware Solution.
Rekommendationer
- Använd taggar för resurshantering med hjälp av en organisationstaxonomi för att identifiera arbetsbelastningar och infrastruktur. Taxonomi bör innehålla värd, företag, ägare och miljö.
- Använd lämpliga verktyg för att underhålla och tillämpa taggar programmatiskt under etableringen.
- Använd taggar som överensstämmer med organisationens efterlevnads- och styrningsinitiativ, till exempel serviceavtal, principer för återbetalning och metoder för livscykelhantering.
- Ha processer på plats för att identifiera och åtgärda resurser som inte följer taggningskraven.
Upprätta incidenthanteringsteam
Effekt: Driftsmässig excellens
För att spåra arbetsbelastningsstatus i ett privat moln är det viktigt att övervaka mått som CPU-användning, operativsystemloggar och säkerhetsaviseringar. För att säkerställa effektiviteten i aviseringssystemet måste du utvärdera flera viktiga operativa aspekter. Mer specifikt kontrollerar du att:
- Alla kritiska komponenter identifieras, till exempel databaser, nätverksenheter och lagring.
- Tröskelvärden anges på rätt sätt.
- Aviseringar är specifika och åtgärdsbara.
- Rätt personer får aviseringar.
- Det finns inte en betydande mängd brus och falska positiva identifieringar.
- Lämpliga eskaleringsprocedurer finns på plats.
Innan en incident eller ett avbrott är det viktigt att upprätta en väldefinierad meddelandeprocess för att säkerställa kommunikation i tid. Det är mycket viktigt att identifiera relevant personal som ansvarar för lösningen. Ett dedikerat reparationsteam kan omfatta driftpersonal, programägare och DevOps-experter som har den expertis som behövs för att lösa problem snabbt. Driftteamet måste vara medvetna om vilka personer som är lämpliga att ta med vid triaging av varje problem.
Ett incidenthanteringsteam kan effektivt samordna svar genom att underhålla en omfattande distributionslista. Den här listan bör innehålla viktiga intressenter från affärskritiska avdelningar och utsedda eskaleringskontakter. Affärsintressenter måste informeras om eventuella effekter på åtgärder som uppstår till följd av en incident. De tilldelade eskaleringskontakterna bör vara individer som kan fatta beslut eller eskalera problem till högre nivåer för vägledning.
Det är viktigt att regelbundet granska distributionslistan för att säkerställa att den är korrekt och anpassad till aktuella roller och ansvarsområden. Granskningar säkerställer att viktiga intressenter snabbt informeras om viktiga händelser som inträffar i Azure VMware Solution.
En IT-tjänsthanteringslösning (ITSM) kan mappa händelser till uppgifter. En azure-inbyggd ITSM kan till exempel använda Azure DevOps för att hantera uppgifter. Den kan använda Azure Automation för att automatisera IT-processer och Azure Logic Apps för att skapa arbetsflöden. Resultatet är en anpassad lösning för problemhantering i Azure VMware Solution.
Rekommendationer
- Definiera lämpliga mottagare för Azure VMware Solution-aviseringar och incidenter.
- Definiera tydligt eskaleringskontakter som ska kunna nås och ha behörighet att fatta beslut eller eskalera problem.
- Identifiera viktiga affärsintressenter eller representanter för att säkerställa insyn i eventuella effekter och för att ge vägledning.
- Ha ett reparationsteam på plats som består av administratörer, infrastrukturtekniker och personal som har den expertis som behövs för att åtgärda och lösa problem.
- Integrera aviseringar med en ITSM som Azure DevOps, JIRA eller ServiceNow.
Dokumentprocedurer
Effekt: Tillförlitlighet
Det är viktigt att ha en tydlig förståelse för den infrastruktur för säkerhetskopiering och återställning som finns i din miljö. För att konfigurera en säkerhetskopieringslösning måste du först definiera säkerhetskopieringsmål för infrastrukturen. Du bör säkerhetskopiera dina program, databaser och tillgångar i Blob Storage eller ett Azure Backup-valv. Du bör också utse ägare som ansvarar för att säkerhetskopiera och återställa ditt program.
Rekommendationer
- Dokumentera din infrastruktur för säkerhetskopiering och återställning.
- Dokumentera dina säkerhetskopierings- och återställningsprocedurer.
Implementera lösningar för säkerhetskopiering och återställning
Effekt: Tillförlitlighet
Det privata molnet bör skydda mot dataförlust, minimera stilleståndstid och upprätthålla kontinuiteten i åtgärderna när det uppstår oväntade störningar eller katastrofer.
För affärskontinuitet måste du implementera robust dataskydd för att säkerställa tillgänglighet, integritet och återställning av dina virtuella datorer och kritiska data i Azure VMware Solution-miljön. Säkerhetskopieringsverktygen måste vara på plats och du måste också bekräfta att de fungerar. En viktig princip för Azure VMware Solution är att tillhandahålla oberoende stöd för programvaruleverantörer (ISV) som verifieras med Azure VMware Solution. Att förstå de partner och alternativ som är tillgängliga för dig är avgörande för att säkerhetskopieringen ska lyckas.
Rekommendationer
- Använd säkerhetskopieringslösningar som Microsoft stöder, till exempel Microsoft Azure Backup Server eller godkända tredjepartsleverantörer.
Varning
Kontrollera att de virtuella datorerna i din säkerhetskopieringsmiljö kör operativsystem som har support. Lär dig mer om operativsystem som stöds.
Använd Azure Site Recovery
Effekt: Tillförlitlighet
Azure Site Recovery är en haveriberedskapslösning som är utformad för att minimera stilleståndstiden för de virtuella datorerna i en Azure VMware Solution-miljö när det uppstår en katastrof. Azure Site Recovery automatiserar och samordnar redundans och återställning efter fel. Inbyggd icke-avbrottstestning hjälper till att säkerställa att dina mål för återställningstid (RTO) uppfylls. Azure Site Recovery förenklar hanteringen genom automatisering och säkerställer snabba och mycket förutsägbara återställningstider.
Rekommendationer
- I ett långvarigt regionalt avbrott skyddar du dina arbetsbelastningar genom att replikera dem till en alternativ Azure-region.
- Konfigurera Azure Site Recovery för att skicka säkerhetskopior till en alternativ region.
Rotera hemligheter
Effekt: Säkerhet
Det är svårare för angripare att komma åt eller missbruka krypterade data om de inte har åtkomst till krypteringsnycklar. Du bör lagra nycklar, hemligheter och certifikat på ett säkert sätt, och du bör rotera dem ofta. Omfattande steg för att skydda och upprätthålla dataintegritet är:
- Kryptera data.
- Lagra nycklar på ett säkert sätt.
- Kryptera data på programnivå innan du överför data.
Rekommendationer
- Använd Azure Key Vault för att lagra krypteringsnycklar.
Nästa steg
Nu när du har tittat på procedurer för driftshantering kan du se hur du integrerar en Azure VMware Solution-arbetsbelastning med Azure-landningszoner.
Använd utvärderingsverktyget för att utvärdera dina designval.