Compartilhar via


Considerações de operações para cargas de trabalho da Solução VMware no Azure

Este artigo discute a área de design de operações da Solução VMware no Azure. O objetivo deste artigo é criar um modelo operacional para a Solução VMware no Azure e os aplicativos no SDDC (datacenter definido por software) da VMware. Os procedimentos operacionais padrão (SOPs) são processos documentados para gerenciar uma carga de trabalho. Cada carga de trabalho da Solução VMware no Azure deve ter SOPs para controlar as operações. Para se manter alinhado com os objetivos de negócios e ajudar a evitar o desvio das práticas recomendadas, use SOPs em um ciclo contínuo de avaliação e verificações de integridade que você executa em sua carga de trabalho da Solução VMware no Azure.

Rastrear dependências de aplicativos

Impacto: Excelência operacional

As equipes de TI procuram continuamente otimizar a implantação, o gerenciamento e a manutenção de aplicativos, sites e serviços. Essa prática ajuda a garantir alto desempenho, confiabilidade, escalabilidade e segurança. A otimização envolve entender como os aplicativos fluem dentro da plataforma da Solução VMware no Azure. Também envolve examinar dependências e relacionamentos externos que estão fora da nuvem privada. Um mapa de dependência é uma ferramenta valiosa para desenvolvedores, arquitetos de aplicativos e equipes de TI que buscam entender a estrutura e o comportamento dos aplicativos. Ter insights sobre os componentes do aplicativo, como software e infraestrutura, serviços e dependências externas, fornece uma maneira visual de entender os fluxos de dados, a funcionalidade e as chamadas de API.

Recomendações
  • Use o Application Insights para acompanhar dependências, como bancos de dados, chamadas à API e serviços externos.
  • Use o recurso de mapa do serviço do Azure Monitor para descobrir e visualizar automaticamente diferentes componentes de aplicativo e infraestrutura.
  • Use ferramentas de terceiros, como New Relic e Datadog, para descobrir e mapear as dependências.
  • Use scripts personalizados ou ferramentas de gerenciamento de configuração de terceiros que acompanham a automação e a implantação de dependências.

Use automação, sistemas de controle de versão e implantações azul-verde

Impacto: Excelência operacional

As organizações podem diminuir o tempo de lançamento no mercado e se beneficiar da colaboração aprimorada e da qualidade do software adotando práticas de DevOps. Por exemplo, a automação pode agilizar a implantação e a manutenção de aplicativos.

Ao usar a infraestrutura como código (IaC) para organizar implantações de infraestrutura, você pode se beneficiar da eficiência aprimorada no provisionamento de infraestrutura. A IaC também pode facilitar a adoção de princípios de DevOps no gerenciamento de infraestrutura.

  • Você pode usar a IaC para criar vários recursos na Solução VMware no Azure. Os exemplos incluem toda a nuvem privada ou componentes individuais, como clusters, dispositivos de rede e armazenamento. Ferramentas como Azure Resource Manager, Bicep, Terraform, CLI do Azure e PowerShell automatizam o provisionamento e a configuração de recursos na Solução VMware no Azure.
  • Ao usar a IaC, você pode atualizar sua infraestrutura modificando o código. Essa abordagem reduz o tempo e o esforço necessários para configuração e provisionamento manuais.
  • A saída retornada da implantação da IaC pode servir como documentação para ajudar a manter e fornecer visibilidade extra do estado e da configuração dos recursos provisionados.

Os sistemas de controle de versão fornecem uma maneira de gerenciar seu código e usar o controle de versão para rastrear e reverter as alterações conforme necessário.

Quando você precisa atualizar o código do aplicativo entre servidores, as implantações azul-verde podem ser úteis de várias maneiras:

  • Eles ajudam a gerenciar o ciclo de vida de um aplicativo, desde o desenvolvimento até a produção.
  • Eles ajudam a oferecer aos clientes uma experiência consistente na Web quando atualizações e patches estão sendo aplicados.
  • Eles usam algoritmos ponderados para distribuir o tráfego apenas para servidores íntegros durante a manutenção.

A Solução VMware no Azure não oferece métodos que um aplicativo nativo de nuvem oferece para obter implantações azul-verde. Mas essas implantações ainda são possíveis na Solução VMware no Azure:

  • Antes de fazer alterações na configuração do aplicativo, tire instantâneos do ambiente.
  • Use o controle de versão para garantir que você possa retornar a um último estado válido conhecido.
  • Considere criar um ambiente de preparo que espelhe a produção e implante atualizações antes de entrar em operação.
  • No ambiente de preparo, execute atualizações contínuas em um subconjunto de servidores e teste seu aplicativo.

Você pode reduzir o esforço manual, minimizar erros e melhorar o uso de recursos automatizando tarefas rotineiras como provisionamento, dimensionamento e aplicação de patches. As metodologias de DevOps são um elemento importante de uma solução bem arquitetada para simplificar as operações, economizar tempo e ajudar as equipes a se concentrarem em atividades de valor agregado.

Recomendações
  • Use a IaC para implantar e provisionar a infraestrutura de maneira repetível, auditável e consistente.
  • Automatize a expansão e a contração usando a IaC.
  • Use sistemas de controle de versão para acompanhar as alterações, colaborar e reverter o código para versões anteriores, conforme necessário.
  • Use o conceito azul-verde criando um ambiente de preparo que espelha ambientes de produção e teste antes da implementação.
  • Mantenha o último bom estado do aplicativo usando instantâneos, clonando discos e tendo o código controlado por versão.

Definir funções e processos

Impacto: Excelência operacional

Funções e responsabilidades bem definidas ajudam a garantir clareza, responsabilidade e gerenciamento eficaz de uma carga de trabalho da Solução VMware no Azure bem arquitetada. Ter um conjunto definido de padrões e processos estruturados e saber quem os executa leva a operações eficientes e ajuda as organizações de TI a alinhar suas ofertas técnicas com os objetivos e estratégias de negócios. À medida que o ambiente da Solução VMware no Azure cresce e evolui, funções e responsabilidades bem definidas facilitam a delegação de tarefas e o potencial de dimensionar a solução sem interrupções. O resultado é uma melhor experiência para os usuários do aplicativo.

É importante ter uma cultura de melhoria contínua que se concentre em operações diárias eficientes para aplicativos na nuvem privada. Exemplos de operações incluem manter acordos de nível de serviço (SLAs), manter a disponibilidade, ter a capacidade de minimizar interrupções de serviço e ter uma entrega tranquila. Por exemplo, a Solução VMware no Azure possibilita expandir um ambiente com o mínimo de entrada do usuário. Se você expandir manualmente seu contrato, deverá documentar quem executa as atividades associadas e como executá-las. Os operadores da Solução VMware no Azure devem garantir que a reserva de nó esteja disponível para expandir o ambiente conforme necessário. Por exemplo, designe indivíduos responsáveis por identificar recursos subutilizados ou ociosos. Forneça a esses indivíduos um processo para dimensionar corretamente as VMs (máquinas virtuais) para reduzir custos desnecessários.

As equipes de aplicativos e desenvolvedores devem definir diretrizes de codificação para estrutura de código, exceções e tratamento de erros. Você também deve ter métodos para rastrear alterações, como revisões regulares de código, documentação de API e refatoração regular de código. Ao usar o controle de versão, aplique as práticas recomendadas, como ramificação, mensagens de confirmação e fluxos de trabalho de aprovação. Essas práticas podem ajudar a tornar seu código consistente, fácil de depurar e sustentável.

Recomendações
  • Trabalhe com a equipe do CCoE (centro de excelência em nuvem) para entender os padrões e diretrizes de conformidade, segurança, arquitetura de aplicativos e processos operacionais.
  • Faça com que uma equipe de segurança e conformidade se concentre nas políticas de segurança específicas da Solução VMware no Azure. Além disso, faça com que a equipe realize avaliações de risco e garanta a conformidade com os requisitos regulatórios.
  • Adote uma estrutura como a ITIL (Information Technology Infrastructure Library). Ou use as práticas da International Organization for Standardization (ISO) para mapear operações, processos e atividades do dia-a-dia. Essas práticas podem resultar em transferências de conhecimento mais rápidas, melhorias contínuas e melhor gerenciamento de mudanças.
  • Defina padrões de codificação e implemente práticas de segurança durante o desenvolvimento de aplicativos.

Use estratégias de marcação e práticas recomendadas

Impacto: Excelência operacional

Você pode usar uma estratégia de marcação para estorno e rastreamento de recursos. As tags são valores de par de chaves que você define no nível do recurso e aplica durante o provisionamento. Você pode usar a IaC para criar, atualizar e destruir VMs convidadas. Tags e IaC trabalham em conjunto com ferramentas de gerenciamento de configuração. Você pode usar tags nas seguintes áreas:

  • Ambientes. Você pode aplicar tags como produção, controle de qualidade ou teste de desenvolvimento para identificar recursos.
  • Centros de custo, para rastrear custos e despesas de recursos.
  • SLAs, para priorizar os requisitos de SLA dos recursos.
  • Ciclos de vida. Você pode rotular aplicativos como ativos, arquivados ou desativados.
  • Criticidade, rotulando recursos com base em seu impacto e importância nos negócios.

Como parte de sua estratégia de governança e conformidade, um grupo deve ser responsável por identificar recursos sem marcas. Esse grupo pode combinar automação, auditoria e processos para ajudar a identificar e corrigir recursos que não atendem às políticas de conformidade de marcação.

Essas considerações de marcação são gerais. É importante que sua estratégia de marcação dê suporte à categorização eficaz de recursos, ao gerenciamento do ciclo de vida do recurso e aos relatórios na Solução VMware no Azure.

Recomendações
  • Aplique marcas para o gerenciamento de recursos usando uma taxonomia organizacional para identificar cargas de trabalho e infraestrutura. A taxonomia deve incluir o host, a empresa, o proprietário e o ambiente.
  • Use ferramentas apropriadas para manter e aplicar marcas de forma programática durante o provisionamento.
  • Use tags que se alinhem às iniciativas de conformidade e governança da sua organização, como SLAs, políticas de estorno e práticas de gerenciamento do ciclo de vida.
  • Tenha processos em vigor para identificar e corrigir recursos que não cumpram os requisitos de marcação.

Estabeleça equipes de resposta a incidentes

Impacto: Excelência operacional

Para rastrear o status da carga de trabalho em uma nuvem privada, é essencial monitorar métricas como uso da CPU, logs do sistema operacional e alertas de segurança. Para garantir a eficácia do seu sistema de alertas, você precisa avaliar vários aspectos operacionais importantes. Especificamente, verifique se:

  • Todos os componentes críticos são identificados, como bancos de dados, dispositivos de rede e armazenamento.
  • Os limites são definidos adequadamente.
  • Os alertas são específicos e acionáveis.
  • As pessoas certas recebem alertas.
  • Não há uma quantidade substancial de ruído e falsos positivos.
  • Procedimentos adequados de escalonamento estão em vigor.

Antes de um incidente ou interrupção, é crucial estabelecer um processo de notificação bem definido para garantir uma comunicação oportuna. Identificar o pessoal relevante responsável pela resolução é vital. Uma equipe de correção dedicada pode incluir a equipe de operações, proprietários de aplicativos e especialistas em DevOps que possuem a experiência necessária para resolver problemas rapidamente. A equipe de operações deve estar ciente dos indivíduos apropriados para envolver na triagem de cada problema.

Uma equipe de resposta a incidentes pode coordenar efetivamente as respostas, mantendo uma lista de distribuição abrangente. Essa lista deve incluir as principais partes interessadas de departamentos críticos para os negócios e contatos de escalonamento designados. As partes interessadas do negócio devem ser informadas sobre qualquer impacto potencial nas operações resultante de um incidente. Os contatos de escalonamento designados devem ser indivíduos capazes de tomar decisões ou escalar problemas para níveis mais altos para orientação.

A revisão regular da lista de distribuição é essencial para garantir sua precisão e alinhamento com as funções e responsabilidades atuais. As revisões garantem que os principais stakeholders sejam prontamente informados sobre eventos significativos que ocorrem na Solução VMware no Azure.

Uma solução de gerenciamento de serviços de TI (ITSM) pode mapear eventos para tarefas. Por exemplo, um ITSM nativo do Azure pode usar o Azure DevOps para gerenciar tarefas. Ele pode usar a Automação do Azure para automatizar processos de TI e os Aplicativos Lógicos do Azure para criar fluxos de trabalho. O resultado é uma solução personalizada para gerenciamento de problemas na Solução VMware no Azure.

Recomendações
  • Defina os destinatários apropriados para alertas e incidentes da Solução VMware no Azure.
  • Defina claramente os contatos de escalonamento que devem estar acessíveis e autorizados a tomar decisões ou encaminhar problemas.
  • Identifique os principais stakeholders ou representantes de negócios para garantir a visibilidade de qualquer impacto potencial e fornecer diretrizes.
  • Tenha uma equipe de correção composta por administradores, engenheiros de infraestrutura e pessoal com a experiência necessária para resolver problemas.
  • Integre alertas a um ITSM como Azure DevOps, JIRA ou ServiceNow.

Procedimentos de documentação

Impacto: Confiabilidade

É importante ter uma compreensão clara da infra-estrutura de backup e recuperação existente em seu ambiente. Para configurar uma solução de backup, primeiro você precisa definir destinos de backup para sua infraestrutura. Você deve fazer backup de seus aplicativos, bancos de dados e ativos no armazenamento de blobs ou em um cofre de backup do Azure. Você também deve designar proprietários responsáveis por fazer backup e restaurar seu aplicativo.

Recomendações
  • Documente claramente sua infraestrutura de backup e recuperação.
  • Documente claramente seus procedimentos de backup e recuperação.

Implemente soluções de backup e restauração

Impacto: Confiabilidade

A nuvem privada deve proteger contra perda de dados, minimizar o tempo de inatividade e manter a continuidade das operações quando houver interrupções ou desastres inesperados.

Para continuidade dos negócios, você precisa implementar uma proteção de dados robusta para ajudar a garantir a disponibilidade, a integridade e a capacidade de recuperação de suas VMs e dos dados críticos no ambiente da Solução VMware no Azure. As ferramentas de backup precisam estar em vigor e você também deve confirmar se elas funcionam. Um princípio fundamental da Solução VMware no Azure é fornecer suporte à tecnologia ISV (fornecedor independente de software) validado com a Solução VMware no Azure. Compreender os parceiros e as opções disponíveis é fundamental para o sucesso do backup.

Recomendações
  • Use soluções de backup compatíveis com a Microsoft, como o Servidor de Backup do Microsoft Azure ou fornecedores de terceiros aprovados.

Cuidado

Verifique se as VMs em seu ambiente de backup estão executando sistemas operacionais com capacidade de suporte. Saiba mais sobre os sistemas operacionais compatíveis.

Como usar o Azure Site Recovery

Impacto: Confiabilidade

O Azure Site Recovery é uma solução de recuperação de desastre projetada para minimizar o tempo de inatividade das VMs em um ambiente de Solução VMware no Azure quando há um desastre. O Azure Site Recovery automatiza e orquestra o failover e o failback. O teste integrado sem interrupções ajuda a garantir que seus objetivos de tempo de recuperação (RTOs) sejam atendidos. O Azure Site Recovery simplifica o gerenciamento por meio da automação e ajuda a garantir tempos de recuperação rápidos e altamente previsíveis.

Recomendações
  • Em uma interrupção regional prolongada, proteja suas cargas de trabalho replicando-as em uma região alternativa do Azure.
  • Configure o Azure Site Recovery para enviar backups para uma região alternativa.

Alternar segredos

Impacto: segurança

É mais desafiador para os invasores acessar ou usar indevidamente dados criptografados se eles não tiverem acesso às chaves de criptografia. Você deve armazenar chaves, segredos e certificados com segurança e girá-los com frequência. As etapas abrangentes para proteger e manter a integridade dos dados incluem:

  • Criptografando dados.
  • Armazenando chaves com segurança.
  • Criptografar dados no nível do aplicativo antes de transmitir dados.
Recomendações
  • Use o Azure Key Vault para armazenar chaves de criptografia.

Próximas etapas

Agora que você examinou os procedimentos de gerenciamento operacional, veja como integrar uma carga de trabalho da Solução VMware no Azure às zonas de destino do Azure.

Use a ferramenta de avaliação para avaliar suas escolhas de design.