Considerazioni sulle operazioni per i carichi di lavoro di soluzione Azure VMware

Articolo
08/24/2024

Questo articolo illustra l'area di progettazione delle operazioni per soluzione Azure VMware. L'obiettivo di questo articolo è creare un modello operativo per soluzione Azure VMware e le applicazioni all'interno del data center software-defined (SDDC) VMware. Le procedure operative standard (SOP) sono processi documentati per la gestione di un carico di lavoro. Ogni carico di lavoro soluzione Azure VMware deve avere SOP per gestire le operazioni. Per rimanere allineati agli obiettivi aziendali e per evitare la deriva dalle procedure consigliate, usare sop in un ciclo continuo di controlli di valutazione e integrità eseguiti nel carico di lavoro soluzione Azure VMware.

Tenere traccia delle dipendenze dell'applicazione

Impatto: Eccellenza operativa

I team IT cercano continuamente di ottimizzare la distribuzione, la gestione e la manutenzione di applicazioni, siti e servizi. Questa procedura consente di garantire prestazioni elevate, affidabilità, scalabilità e sicurezza. L'ottimizzazione implica la comprensione del flusso delle applicazioni all'interno della piattaforma soluzione Azure VMware. Implica anche l'analisi delle dipendenze esterne e delle relazioni esterne esterne al cloud privato. Una mappa delle dipendenze è uno strumento prezioso per sviluppatori, architetti di applicazioni e team IT che cercano di comprendere la struttura e il comportamento delle applicazioni. Avere informazioni dettagliate sui componenti dell'applicazione, ad esempio software e infrastruttura, servizi e dipendenze esterne, offre un modo visivo per comprendere i flussi di dati, le funzionalità e le chiamate API.

Consigli

Usare Application Insights per tenere traccia delle dipendenze, ad esempio database, chiamate API e servizi esterni.
Usare la funzionalità mapping dei servizi di Monitoraggio di Azure per individuare e visualizzare automaticamente i diversi componenti dell'applicazione e dell'infrastruttura.
Usare strumenti di terze parti come New Relic e Datadog per individuare e mappare le dipendenze.
Usare script personalizzati o strumenti di gestione della configurazione di terze parti che tengono traccia dell'automazione e della distribuzione delle dipendenze.

Usare l'automazione, i sistemi di controllo della versione e le distribuzioni blu-verde

Impatto: Eccellenza operativa

Le organizzazioni possono ridurre i tempi di commercializzazione e trarre vantaggio da una migliore collaborazione e qualità del software adottando procedure DevOps. Ad esempio, l'automazione può accelerare la distribuzione e la manutenzione delle applicazioni.

Quando si usa l'infrastruttura come codice (IaC) per organizzare le distribuzioni dell'infrastruttura, è possibile trarre vantaggio da una migliore efficienza nel provisioning dell'infrastruttura. IaC può anche facilitare l'adozione dei principi DevOps nella gestione dell'infrastruttura.

È possibile usare IaC per creare diverse risorse in soluzione Azure VMware. Gli esempi includono l'intero cloud privato o singoli componenti, ad esempio cluster, appliance di rete e archiviazione. Strumenti come Azure Resource Manager, Bicep, Terraform, l'interfaccia della riga di comando di Azure e PowerShell automatizzano il provisioning e la configurazione delle risorse in soluzione Azure VMware.
Quando si usa IaC, è possibile aggiornare l'infrastruttura modificando il codice. Questo approccio riduce il tempo e il lavoro necessari per la configurazione manuale e il provisioning.
L'output restituito dalla distribuzione di IaC può fungere da documentazione per mantenere e fornire visibilità aggiuntiva sullo stato e sulla configurazione delle risorse di cui è stato effettuato il provisioning.

I sistemi di controllo della versione consentono di gestire il codice e di usare il controllo delle versioni per tenere traccia e eseguire il rollback delle modifiche in base alle esigenze.

Quando è necessario aggiornare il codice dell'applicazione tra server, le distribuzioni blu-verde possono essere utili in molti modi:

Consentono di gestire il ciclo di vita di un'applicazione dallo sviluppo alla produzione.
Consentono ai clienti di offrire ai clienti un'esperienza Web coerente quando vengono applicati aggiornamenti e patch.
Usano algoritmi ponderati per distribuire il traffico solo ai server integri durante la manutenzione.

soluzione Azure VMware non offre metodi offerti da un'applicazione nativa del cloud per ottenere distribuzioni blu-verde. Tuttavia, queste distribuzioni sono ancora possibili in soluzione Azure VMware:

Prima di apportare modifiche alla configurazione dell'applicazione, creare snapshot dell'ambiente.
Usare il controllo della versione per assicurarsi che sia possibile tornare a uno stato valido noto.
Prendere in considerazione la creazione di un ambiente di staging che rispecchia la produzione e distribuisce gli aggiornamenti prima di passare in tempo reale.
Dall'ambiente di gestione temporanea eseguire aggiornamenti in sequenza a un subset di server e testare l'applicazione.

È possibile ridurre il lavoro manuale, ridurre al minimo gli errori e migliorare l'utilizzo delle risorse automatizzando attività di routine come provisioning, ridimensionamento e applicazione di patch. Le metodologie DevOps sono un elemento importante di una soluzione ben progettata per facilitare le operazioni, risparmiare tempo e aiutare i team a concentrarsi sulle attività a valore aggiunto.

Consigli

Usare IaC per distribuire e effettuare il provisioning dell'infrastruttura in modo ripetibile, controllabile e coerente.
Automatizzare l'espansione e la contrazione usando IaC.
Usare i sistemi di controllo della versione per tenere traccia delle modifiche, collaborare ed eseguire il rollback del codice alle versioni precedenti in base alle esigenze.
Sfruttare il concetto blu-verde creando un ambiente di gestione temporanea che rispecchia gli ambienti di produzione e test prima di passare in tempo reale.
Mantenere l'ultimo stato valido dell'applicazione tramite snapshot, clonazione dei dischi e codice controllato dalla versione.

Definire ruoli e processi

Impatto: Eccellenza operativa

Ruoli e responsabilità ben definiti consentono di garantire chiarezza, responsabilità ed efficace gestione di un carico di lavoro ben progettato soluzione Azure VMware. Avere un set definito di standard e processi strutturati e sapere chi li gestisce conduce a operazioni efficienti e aiuta le organizzazioni IT a allineare le proprie offerte tecniche con obiettivi e strategie aziendali. Man mano che l'ambiente soluzione Azure VMware cresce e si evolve, ruoli e responsabilità ben definiti portano a una delega più semplice delle attività e al potenziale di ridimensionare la soluzione senza interruzioni. Il risultato è un'esperienza migliore per gli utenti dell'applicazione.

È importante avere una cultura del miglioramento continuo che si concentra sulle operazioni quotidiane efficienti per le applicazioni nel cloud privato. Esempi di operazioni includono la gestione dei contratti di servizio, la gestione della disponibilità, la capacità di ridurre al minimo le interruzioni del servizio e la distribuzione senza problemi. Ad esempio, soluzione Azure VMware consente di espandere un ambiente con input utente minimo. Se si espande manualmente il contratto, è necessario documentare chi esegue le attività associate e come eseguirle. soluzione Azure VMware operatori devono assicurarsi che la prenotazione del nodo sia disponibile per espandere l'ambiente in base alle esigenze. Ad esempio, designare individui responsabili dell'identificazione di risorse sottoutilizzate o inattive. Fornire a tali utenti un processo per il ridimensionamento corretto delle macchine virtuali (VM) per ridurre i costi non necessari.

I team delle applicazioni e gli sviluppatori devono definire linee guida per la codifica per la struttura del codice, le eccezioni e la gestione degli errori. È anche necessario disporre di metodi per tenere traccia delle modifiche, ad esempio revisioni regolari del codice, documentazione dell'API e refactoring regolare del codice. Quando si usa il controllo della versione, applicare procedure consigliate, ad esempio diramazione, messaggi di commit e flussi di lavoro di approvazione. Queste procedure consentono di rendere il codice coerente, facile da eseguire e gestibile.

Consigli

Collaborare con il team CCoE (Cloud Center of Excellence) per comprendere gli standard e le linee guida per la conformità, la sicurezza, l'architettura delle applicazioni e i processi operativi.
Avere un team di sicurezza e conformità incentrato sui criteri di sicurezza specifici per soluzione Azure VMware. Inoltre, il team esegue valutazioni dei rischi e garantisce la conformità ai requisiti normativi.
Adottare un framework come la libreria ITIL (Information Technology Infrastructure Library). In alternativa, usare procedure ISO (International Organization for Standardization) per eseguire il mapping di operazioni, processi e attività quotidiane. Queste procedure possono comportare trasferimenti di conoscenze più rapidi, miglioramenti continui e una migliore gestione delle modifiche.
Definire gli standard di codifica e implementare procedure di sicurezza durante lo sviluppo di applicazioni.

Usare strategie di assegnazione di tag e procedure consigliate

Impatto: Eccellenza operativa

È possibile usare una strategia di assegnazione di tag per il chargeback e il rilevamento delle risorse. I tag sono valori di coppia chiave definiti a livello di risorsa e applicati durante il provisioning. È possibile usare IaC per creare, aggiornare ed eliminare definitivamente le macchine virtuali guest. I tag e IaC interagiscono con gli strumenti di gestione della configurazione. È possibile usare tag nelle aree seguenti:

Ambienti. È possibile applicare tag come produzione, controllo di qualità o test di sviluppo per identificare le risorse.
Centri di costo, per tenere traccia dei costi e delle spese delle risorse.
Contratti di servizio, per classificare in ordine di priorità i requisiti del contratto di servizio delle risorse.
Cicli di vita. È possibile etichettare le applicazioni come attive, archiviate o ritirate.
Criticità, etichettando le risorse in base all'impatto e al significato dell'azienda.

Come parte della strategia di governance e conformità, un gruppo deve essere responsabile dell'identificazione delle risorse senza tag. Tale gruppo può combinare automazione, controllo e processi per identificare e correggere le risorse che non soddisfano i criteri di conformità di assegnazione di tag.

Queste considerazioni sull'assegnazione di tag sono generali. È importante che la strategia di assegnazione di tag supporti la categorizzazione efficace delle risorse, la gestione del ciclo di vita delle risorse e la creazione di report all'interno di soluzione Azure VMware.

Consigli

Applicare tag per la gestione delle risorse usando una tassonomia organizzativa per identificare i carichi di lavoro e l'infrastruttura. La tassonomia deve includere l'host, l'azienda, il proprietario e l'ambiente.
Usare gli strumenti appropriati per gestire e applicare tag a livello di codice durante il provisioning.
Usare tag allineati alle iniziative di conformità e governance dell'organizzazione, ad esempio contratti di servizio, criteri di chargeback e procedure di gestione del ciclo di vita.
Disporre di processi per identificare e risolvere le risorse che non rispettano i requisiti di assegnazione di tag.

Stabilire i team di risposta agli eventi imprevisti

Impatto: Eccellenza operativa

Per tenere traccia dello stato del carico di lavoro in un cloud privato, è essenziale monitorare le metriche, ad esempio l'utilizzo della CPU, i log del sistema operativo e gli avvisi di sicurezza. Per garantire l'efficacia del sistema di avvisi, è necessario valutare diversi aspetti operativi chiave. In particolare, verificare che:

Tutti i componenti critici vengono identificati, ad esempio database, dispositivi di rete e archiviazione.
Le soglie vengono impostate in modo appropriato.
Gli avvisi sono specifici e interattivi.
Le persone giuste ricevono avvisi.
Non c'è una notevole quantità di rumore e falsi positivi.
Sono in vigore procedure di escalation adeguate.

Prima di un evento imprevisto o di un'interruzione, è fondamentale stabilire un processo di notifica ben definito per garantire una comunicazione tempestiva. L'identificazione del personale pertinente responsabile della risoluzione è fondamentale. Un team di correzione dedicato può includere personale operativo, proprietari di applicazioni e esperti DevOps che possiedono le competenze necessarie per risolvere rapidamente i problemi. Il team operativo deve essere a conoscenza delle persone appropriate da coinvolgere nella valutazione di ogni problema.

Un team di risposta agli eventi imprevisti può coordinare efficacemente le risposte mantenendo una lista di distribuzione completa. Questo elenco deve includere gli stakeholder chiave dei reparti critici aziendali e i contatti di escalation designati. Gli stakeholder aziendali devono essere informati di qualsiasi potenziale impatto sulle operazioni risultanti da un evento imprevisto. I contatti di escalation assegnati devono essere persone in grado di prendere decisioni o inoltrare problemi a livelli più elevati per indicazioni.

Esaminare regolarmente la lista di distribuzione è essenziale per garantire la precisione e l'allineamento con i ruoli e le responsabilità correnti. Le revisioni assicurano che gli stakeholder chiave siano informati tempestivamente sugli eventi significativi che si verificano in soluzione Azure VMware.

Una soluzione di gestione dei servizi IT (ITSM) può eseguire il mapping degli eventi alle attività. Ad esempio, un itsm nativo di Azure può usare Azure DevOps per gestire le attività. Può usare Automazione di Azure per automatizzare i processi IT e App per la logica di Azure per la creazione di flussi di lavoro. Il risultato è una soluzione personalizzata per la gestione dei problemi in soluzione Azure VMware.

Consigli

Definire i destinatari appropriati per gli avvisi e gli eventi imprevisti della soluzione Azure VMware.
Definire chiaramente i contatti di escalation che devono essere raggiungibili e autorizzati a prendere decisioni o inoltrare i problemi.
Identificare le principali parti interessate o rappresentanti aziendali per garantire visibilità su qualsiasi potenziale impatto e fornire indicazioni.
Disporre di un team di correzione costituito da amministratori, tecnici dell'infrastruttura e personale che hanno le competenze necessarie per risolvere i problemi.
Integrare gli avvisi con un itsm come Azure DevOps, JIRA o ServiceNow.

Procedure documento

Impatto: affidabilità

È importante avere una conoscenza chiara dell'infrastruttura di backup e ripristino presente nell'ambiente in uso. Per configurare una soluzione di backup, è prima necessario definire le destinazioni di backup per l'infrastruttura. È consigliabile eseguire il backup di applicazioni, database e asset nell'archiviazione BLOB o in un insieme di credenziali di backup di Azure. È anche necessario designare i proprietari responsabili del backup e del ripristino dell'applicazione.

Consigli

Documentare chiaramente l'infrastruttura di backup e ripristino.
Documentare chiaramente le procedure di backup e ripristino.

Implementare soluzioni di backup e ripristino

Impatto: affidabilità

Il cloud privato deve proteggersi dalla perdita di dati, ridurre al minimo i tempi di inattività e mantenere la continuità delle operazioni in caso di interruzioni o emergenze impreviste.

Per garantire la continuità aziendale, è necessario implementare una solida protezione dei dati per garantire la disponibilità, l'integrità e la recuperabilità delle macchine virtuali e dei dati critici all'interno dell'ambiente soluzione Azure VMware. Gli strumenti di backup devono essere applicati ed è anche necessario verificare che funzionino. Un principio fondamentale di soluzione Azure VMware consiste nel fornire supporto tecnologico indipendente del fornitore di software (ISV) convalidato con soluzione Azure VMware. Comprendere i partner e le opzioni disponibili è fondamentale per il completamento del backup.

Consigli

Usare soluzioni di backup supportate da Microsoft, ad esempio Microsoft Backup di Azure Server o fornitori di terze parti approvati.

Attenzione

Assicurarsi che le macchine virtuali nell'ambiente di backup eseguano sistemi operativi con supporto. Informazioni sui sistemi operativi supportati.

Usare Azure Site Recovery

Impatto: affidabilità

Azure Site Recovery è una soluzione di ripristino di emergenza progettata per ridurre al minimo i tempi di inattività delle macchine virtuali in un ambiente soluzione Azure VMware in caso di emergenza. Azure Site Recovery automatizza e orchestra il failover e il failback. I test predefiniti non dirupi consentono di garantire che gli obiettivi del tempo di ripristino (RTO) siano soddisfatti. Azure Site Recovery semplifica la gestione tramite l'automazione e garantisce tempi di ripristino rapidi e altamente prevedibili.

Consigli

In un'interruzione a livello di area prolungata, proteggere i carichi di lavoro replicandoli in un'area di Azure alternativa.
Configurare Azure Site Recovery per inviare backup a un'area alternativa.

Ruotare i segreti

Impatto: sicurezza

È più difficile per gli utenti malintenzionati accedere o usare in modo improprio i dati crittografati se non hanno accesso alle chiavi di crittografia. È consigliabile archiviare in modo sicuro chiavi, segreti e certificati e ruotarli di frequente. I passaggi completi per la protezione e la gestione dell'integrità dei dati includono:

Crittografia dei dati.
Archiviazione sicura delle chiavi.
Crittografare i dati a livello di applicazione prima di trasmettere i dati.

Consigli

Usare Azure Key Vault per archiviare le chiavi di crittografia.

Passaggi successivi

Dopo aver esaminato le procedure di gestione operativa, vedere come integrare un carico di lavoro soluzione Azure VMware con le zone di destinazione di Azure.

Integrazione della zona di destinazione

Usare lo strumento di valutazione per valutare le scelte di progettazione.

Valutazione

Condividi tramite

Considerazioni sulle operazioni per i carichi di lavoro di soluzione Azure VMware

Tenere traccia delle dipendenze dell'applicazione

Consigli

Usare l'automazione, i sistemi di controllo della versione e le distribuzioni blu-verde

Consigli

Definire ruoli e processi

Consigli

Usare strategie di assegnazione di tag e procedure consigliate

Consigli

Stabilire i team di risposta agli eventi imprevisti

Consigli

Procedure documento

Consigli

Implementare soluzioni di backup e ripristino

Consigli

Usare Azure Site Recovery

Consigli

Ruotare i segreti

Consigli

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive