Partilhar via


Considerações de operações para cargas de trabalho da Solução VMware do Azure

Este artigo discute a área de design de operações para a Solução VMware do Azure. O objetivo deste artigo é criar um modelo operacional para o Azure VMware Solution e os aplicativos dentro do VMware software-defined datacenter (SDDC). Os procedimentos operacionais padrão (POPs) são processos documentados para gerenciar uma carga de trabalho. Cada carga de trabalho da Solução VMware do Azure deve ter POPs para controlar as operações. Para se manter alinhado com os objetivos de negócios e ajudar a evitar desvios das práticas recomendadas, use POPs em um ciclo contínuo de avaliação e verificações de integridade que você executa em sua carga de trabalho da Solução VMware do Azure.

Rastreie dependências de aplicativos

Impacto: Excelência operacional

As equipes de TI procuram continuamente otimizar a implantação, o gerenciamento e a manutenção de aplicativos, sites e serviços. Essa prática ajuda a garantir alto desempenho, confiabilidade, escalabilidade e segurança. A otimização envolve entender como os aplicativos fluem dentro da plataforma Azure VMware Solution. Também envolve examinar dependências externas e relacionamentos que estão fora da nuvem privada. Um mapa de dependência é uma ferramenta valiosa para desenvolvedores, arquitetos de aplicativos e equipes de TI à medida que procuram entender a estrutura e o comportamento dos aplicativos. Ter informações sobre componentes de aplicativos, como software e infraestrutura, serviços e dependências externas, fornece uma maneira visual de entender fluxos de dados, funcionalidade e chamadas de API.

Recomendações
  • Use o Application Insights para rastrear dependências, como bancos de dados, chamadas de API e serviços externos.
  • Use o recurso de mapa de serviço do Azure Monitor para descobrir e visualizar automaticamente diferentes componentes de aplicativo e infraestrutura.
  • Use ferramentas de terceiros como New Relic e Datadog para descobrir e mapear dependências.
  • Use scripts personalizados ou ferramentas de gerenciamento de configuração de terceiros que rastreiam a automação e a implantação de dependências.

Use automação, sistemas de controle de versão e implantações azul-verde

Impacto: Excelência operacional

As organizações podem diminuir o tempo de comercialização e se beneficiar da melhoria da colaboração e da qualidade do software adotando práticas de DevOps. Por exemplo, a automação pode agilizar a implantação e a manutenção de aplicativos.

Ao usar a infraestrutura como código (IaC) para organizar implantações de infraestrutura, você pode se beneficiar da eficiência aprimorada no provisionamento de infraestrutura. O IaC também pode facilitar a adoção de princípios de DevOps no gerenciamento de infraestrutura.

  • Você pode usar o IaC para criar vários recursos no Azure VMware Solution. Os exemplos incluem toda a nuvem privada ou componentes individuais, como clusters, dispositivos de rede e armazenamento. Ferramentas como o Azure Resource Manager, Bicep, Terraform, a CLI do Azure e o PowerShell automatizam o provisionamento e a configuração de recursos na Solução VMware do Azure.
  • Ao usar o IaC, você pode atualizar sua infraestrutura modificando o código. Essa abordagem reduz o tempo e o esforço necessários para a configuração manual e o provisionamento.
  • A saída retornada da implantação do IaC pode servir como documentação para ajudar a manter e fornecer visibilidade extra sobre o estado e a configuração dos recursos provisionados.

Os sistemas de controle de versão fornecem uma maneira de gerenciar seu código e usar o controle de versão para controlar e reverter as alterações, conforme necessário.

Quando você precisa atualizar o código do aplicativo entre servidores, as implantações azul-verde podem ser úteis de várias maneiras:

  • Eles ajudam a gerenciar o ciclo de vida de um aplicativo, desde o desenvolvimento até a produção.
  • Eles ajudam a oferecer aos clientes uma experiência consistente na Web quando atualizações e patches estão sendo aplicados.
  • Eles usam algoritmos ponderados para distribuir o tráfego apenas para servidores íntegros durante a manutenção.

A Solução VMware do Azure não oferece métodos que um aplicativo nativo da nuvem oferece para alcançar implantações azul-verde. Mas essas implantações ainda são possíveis no Azure VMware Solution:

  • Antes de fazer alterações na configuração do aplicativo, tire instantâneos do ambiente.
  • Use o controle de versão para garantir que você possa retornar a um último estado válido.
  • Considere a criação de um ambiente de preparo que espelhe a produção e implante atualizações antes de entrar em operação.
  • No ambiente de preparação, execute atualizações contínuas em um subconjunto de servidores e teste seu aplicativo.

Você pode reduzir o esforço manual, minimizar erros e melhorar o uso de recursos automatizando tarefas de rotina, como provisionamento, dimensionamento e aplicação de patches. As metodologias de DevOps são um elemento importante de uma solução bem arquitetada para simplificar as operações, economizar tempo e ajudar as equipes a se concentrarem em atividades de valor agregado.

Recomendações
  • Use o IaC para implantar e provisionar a infraestrutura de forma repetível, auditável e consistente.
  • Automatize a expansão e a contração usando o IaC.
  • Use sistemas de controle de versão para controlar alterações, colaborar e reverter código para versões anteriores, conforme necessário.
  • Aproveite o conceito azul-verde criando um ambiente de preparação que espelha os ambientes de produção e teste antes de entrar em operação.
  • Mantenha o último bom estado do seu aplicativo usando instantâneos, clonando seus discos e tendo código controlado por versão.

Definir funções e processos

Impacto: Excelência operacional

Funções e responsabilidades bem definidas ajudam a garantir clareza, responsabilidade e gerenciamento eficaz de uma carga de trabalho da Solução VMware do Azure bem arquitetada. Ter um conjunto definido de padrões e processos estruturados e saber quem os executa leva a operações eficientes e ajuda as organizações de TI a alinhar suas ofertas técnicas com os objetivos e estratégias de negócios. À medida que o ambiente da Solução VMware do Azure cresce e evolui, funções e responsabilidades bem definidas levam a uma delegação de tarefas mais fácil e ao potencial de dimensionar a solução sem interrupções. O resultado é uma melhor experiência para os usuários do aplicativo.

É importante ter uma cultura de melhoria contínua que se concentre em operações diárias eficientes para aplicativos na nuvem privada. Exemplos de operações incluem a manutenção de contratos de nível de serviço (SLAs), a manutenção da disponibilidade, a capacidade de minimizar interrupções de serviço e uma entrega sem problemas. Por exemplo, a Solução VMware do Azure torna possível expandir um ambiente com o mínimo de entrada do usuário. Se expandir manualmente o seu contrato, deve documentar quem executa as atividades associadas e como realizá-las. Os operadores da Solução VMware do Azure devem garantir que a reserva de nó esteja disponível para expandir o ambiente, conforme necessário. Por exemplo, designe indivíduos responsáveis por identificar recursos subutilizados ou ociosos. Forneça a esses indivíduos um processo para dimensionar corretamente máquinas virtuais (VMs) para reduzir custos desnecessários.

As equipes de aplicativos e desenvolvedores devem definir diretrizes de codificação para estrutura de código, exceções e tratamento de erros. Você também deve ter métodos para controlar alterações, como revisões regulares de código, documentação de API e refatoração de código regular. Ao usar o controle de versão, imponha práticas recomendadas, como ramificação, mensagens de confirmação e fluxos de trabalho de aprovação. Essas práticas podem ajudar a tornar seu código consistente, fácil de depurar e sustentável.

Recomendações
  • Trabalhe com a equipe do centro de excelência em nuvem (CCoE) para entender os padrões e diretrizes de conformidade, segurança, arquitetura de aplicativos e processos operacionais.
  • Tenha uma equipe de segurança e conformidade focada em políticas de segurança específicas da Solução VMware do Azure. Além disso, fazer com que a equipe realize avaliações de risco e garanta a conformidade com os requisitos regulamentares.
  • Adote uma estrutura como a Information Technology Infrastructure Library (ITIL). Ou use as práticas da Organização Internacional de Normalização (ISO) para mapear operações, processos e atividades do dia-a-dia. Essas práticas podem resultar em transferências de conhecimento mais rápidas, melhorias contínuas e melhor gerenciamento de mudanças.
  • Defina padrões de codificação e implemente práticas de segurança durante o desenvolvimento de aplicativos.

Use estratégias de marcação e práticas recomendadas

Impacto: Excelência operacional

Você pode usar uma estratégia de marcação para estorno e rastreamento de recursos. As tags são valores de pares de chaves que você define no nível do recurso e aplica durante o provisionamento. Você pode usar o IaC para criar, atualizar e destruir VMs convidadas. Tags e IaC trabalham em conjunto com ferramentas de gerenciamento de configuração. Você pode usar tags nas seguintes áreas:

  • Ambientes. Você pode aplicar tags como produção, controle de qualidade ou teste de desenvolvimento para identificar recursos.
  • Centros de custo, para acompanhamento de custos e despesas de recursos.
  • SLAs, para priorizar os requisitos de SLA de recursos.
  • Ciclos de vida. Você pode rotular aplicativos como ativos, arquivados ou desativados.
  • Criticidade, rotulando os recursos com base no seu impacto e significado nos negócios.

Como parte de sua estratégia de governança e conformidade, um grupo deve ser responsável por identificar recursos sem tags. Esse grupo pode combinar automação, auditoria e processos para ajudar a identificar e corrigir recursos que não atendem às políticas de conformidade de marcação.

Essas considerações de marcação são gerais. É importante que sua estratégia de marcação ofereça suporte à categorização eficaz de recursos, ao gerenciamento do ciclo de vida dos recursos e à geração de relatórios na Solução VMware do Azure.

Recomendações
  • Aplique tags para gerenciamento de recursos usando uma taxonomia organizacional para identificar cargas de trabalho e infraestrutura. A taxonomia deve incluir o anfitrião, a empresa, o proprietário e o ambiente.
  • Use ferramentas apropriadas para manter e aplicar tags programaticamente durante o provisionamento.
  • Use tags que se alinhem com as iniciativas de conformidade e governança da sua organização, como SLAs, políticas de chargeback e práticas de gerenciamento do ciclo de vida.
  • Tenha processos implementados para identificar e corrigir recursos que não atendem aos requisitos de marcação.

Estabelecer equipas de resposta a incidentes

Impacto: Excelência operacional

Para acompanhar o status da carga de trabalho em uma nuvem privada, é essencial monitorar métricas como uso da CPU, logs do sistema operacional e alertas de segurança. Para garantir a eficácia do seu sistema de alerta, você precisa avaliar vários aspetos operacionais importantes. Especificamente, verifique se:

  • Todos os componentes críticos são identificados, como bancos de dados, dispositivos de rede e armazenamento.
  • Os limiares são fixados de forma adequada.
  • Os alertas são específicos e acionáveis.
  • As pessoas certas recebem alertas.
  • Não há uma quantidade substancial de ruído e falsos positivos.
  • Estão em vigor procedimentos de escalonamento adequados.

Antes de um incidente ou interrupção, é crucial estabelecer um processo de notificação bem definido para garantir uma comunicação oportuna. A identificação do pessoal relevante responsável pela resolução é vital. Uma equipe de remediação dedicada pode incluir pessoal de operações, proprietários de aplicativos e especialistas em DevOps que possuem a experiência necessária para resolver problemas rapidamente. A equipe de operações deve estar ciente dos indivíduos apropriados para envolver na triagem de cada problema.

Uma equipe de resposta a incidentes pode coordenar respostas de forma eficaz mantendo uma lista de distribuição abrangente. Essa lista deve incluir as principais partes interessadas de departamentos críticos para os negócios e contatos de escalonamento designados. As partes interessadas do negócio devem ser informadas de qualquer impacto potencial nas operações que resulte de um incidente. Os contatos de escalonamento atribuídos devem ser indivíduos capazes de tomar decisões ou escalar problemas para níveis mais altos para orientação.

A revisão regular da lista de distribuição é essencial para garantir a sua precisão e alinhamento com as funções e responsabilidades atuais. As análises garantem que as principais partes interessadas sejam prontamente informadas sobre eventos significativos que ocorrem na Solução VMware do Azure.

Uma solução de gerenciamento de serviços de TI (ITSM) pode mapear eventos para tarefas. Por exemplo, um ITSM nativo do Azure pode usar o Azure DevOps para gerenciar tarefas. Ele pode usar a Automação do Azure para automatizar processos de TI e os Aplicativos Lógicos do Azure para criar fluxos de trabalho. O resultado é uma solução personalizada para gerenciamento de problemas no Azure VMware Solution.

Recomendações
  • Defina os destinatários apropriados para alertas e incidentes da Solução VMware do Azure.
  • Defina claramente os contatos de escalonamento que devem ser acessíveis e autorizados a tomar decisões ou escalar problemas.
  • Identificar as principais partes interessadas ou representantes do negócio para garantir a visibilidade de qualquer impacto potencial e fornecer orientação.
  • Tenha uma equipe de remediação composta por administradores, engenheiros de infraestrutura e pessoal com a experiência necessária para resolver problemas.
  • Integre alertas com um ITSM como Azure DevOps, JIRA ou ServiceNow.

Procedimentos documentais

Impacto: Fiabilidade

É importante ter uma compreensão clara da infraestrutura de backup e recuperação existente em seu ambiente. Para configurar uma solução de backup, primeiro você precisa definir destinos de backup para sua infraestrutura. Você deve fazer backup de seus aplicativos, bancos de dados e ativos no armazenamento de blob ou em um cofre de backup do Azure. Você também deve designar proprietários que são responsáveis por fazer backup e restaurar seu aplicativo.

Recomendações
  • Documente claramente sua infraestrutura de backup e recuperação.
  • Documente claramente seus procedimentos de backup e recuperação.

Implementar soluções de backup e restauração

Impacto: Fiabilidade

A nuvem privada deve proteger contra perda de dados, minimizar o tempo de inatividade e manter a continuidade das operações quando há interrupções ou desastres inesperados.

Para a continuidade dos negócios, você precisa implementar uma proteção de dados robusta para ajudar a garantir a disponibilidade, a integridade e a capacidade de recuperação de suas VMs e dos dados críticos no ambiente da Solução VMware do Azure. As ferramentas de backup precisam estar instaladas e você também deve confirmar se elas funcionam. Um princípio fundamental da Solução VMware do Azure é fornecer suporte à tecnologia de fornecedor independente de software (ISV) que é validado com a Solução VMware do Azure. Compreender os parceiros e as opções disponíveis é fundamental para o sucesso do backup.

Recomendações
  • Use soluções de backup suportadas pela Microsoft, como o Servidor de Backup do Microsoft Azure, ou fornecedores de terceiros aprovados.

Atenção

Verifique se as VMs em seu ambiente de backup estão executando SOs que têm capacidade de suporte. Saiba mais sobre os SOs suportados.

Utilizar o Azure Site Recovery (Use Azure Site Recovery)

Impacto: Fiabilidade

O Azure Site Recovery é uma solução de recuperação de desastres projetada para minimizar o tempo de inatividade das VMs em um ambiente da Solução VMware do Azure quando há um desastre. O Azure Site Recovery automatiza e orquestra failover e failback. Os testes internos sem interrupções ajudam a garantir que seus RTOs (Recovery Time Objetives, objetivos de tempo de recuperação) sejam atingidos. O Azure Site Recovery simplifica o gerenciamento por meio da automação e ajuda a garantir tempos de recuperação rápidos e altamente previsíveis.

Recomendações
  • Em uma interrupção regional prolongada, proteja suas cargas de trabalho replicando-as para uma região alternativa do Azure.
  • Configure o Azure Site Recovery para enviar backups para uma região alternativa.

Girar segredos

Impacto: Segurança

É mais desafiador para os invasores acessar ou abusar de dados criptografados se não tiverem acesso a chaves de criptografia. Você deve armazenar chaves, segredos e certificados com segurança, e deve rodá-los com frequência. As etapas abrangentes para proteger e manter a integridade dos dados incluem:

  • Encriptação de dados.
  • Armazenando chaves de forma segura.
  • Criptografar dados no nível do aplicativo antes de transmitir dados.
Recomendações
  • Use o Azure Key Vault para armazenar chaves de criptografia.

Próximos passos

Agora que você analisou os procedimentos de gerenciamento operacional, veja como integrar uma carga de trabalho da Solução VMware do Azure às zonas de aterrissagem do Azure.

Use a ferramenta de avaliação para avaliar suas escolhas de design.