Compartilhar via


Princípios de design de confiabilidade

Uma carga de trabalho confiável deve ser resiliente para que possa detectar e se recuperar de interrupções e mau funcionamento e fornecer funcionalidade de forma consistente. Ele deve ser capaz de se recuperar de falhas dentro de um prazo razoável. Ele também deve estar disponível para que os usuários possam acessar a carga de trabalho de forma consistente e confiável durante o prazo acordado e no nível de qualidade acordado.

Use os seguintes princípios de design do Microsoft Azure Well-Architected Framework para ajudar a garantir a confiabilidade durante todo o ciclo de vida. Comece com as melhores práticas recomendadas e justifique os benefícios de cada princípio de confiabilidade. Depois de definir sua estratégia, use a Lista de verificação de confiabilidade como seu próximo etapa.

Se você não aplicar esses princípios ao seu design, a carga de trabalho provavelmente não estará preparada para antecipar ou lidar com problemas na produção. O resultado pode ser interrupções no serviço que levam a perdas financeiras. No caso de cargas de trabalho críticas, a não aplicação desses princípios pode comprometer a segurança.

Design para requisitos de negócios

Ícone de metaColete e entenda as necessidades do negócio com foco no uso esperado da carga de trabalho.

Os requisitos devem incluir a experiência do usuário, fluxos de trabalho, dados e recursos específicos da carga de trabalho. As metas devem ser realistas e acordadas com todas as partes interessadas, com base em um orçamento determinado. Os requisitos devem definir claramente as expectativas da equipe e das partes interessadas. Documentar requisitos para escolhas de tecnologia, implementações e operações guia.

Saiba mais sobre como projetar para requisitos de negócios no Azure Well-Architected Framework.

Design para resiliência

Ícone de metaA carga de trabalho deve responder a falhas e continuar operando com funcionalidade total ou reduzida.

Projete sua carga de trabalho para poder identificar falhas e interrupções de componentes. Torne o sistema resiliente para que ele possa tolerar falhas e lidar com elas sem problemas. Informe os usuários sobre o estado do sistema e defina as expectativas de quais componentes não estão disponíveis e quanto tempo a recuperação esperada levará.

Saiba mais sobre como projetar para resiliência no Azure Well-Architected Framework.

Design para recuperação

Ícone de metaA carga de trabalho deve ser capaz de se recuperar de falhas com o mínimo de interrupção na experiência do usuário e nos objetivos de negócios.

Implemente planos de recuperação estruturados, testados e documentados que levem a uma recuperação rápida. Garanta que suas equipes de suporte e operações tenham acesso a esses planos e que exercícios de recuperação sejam realizados com frequência para evitar bagunça e caos durante uma interrupção real.

Saiba mais sobre design para recuperação no Azure Well-Architected Framework.

Design para operações

Ícone de metaA carga de trabalho deve ser observável, e as equipes de desenvolvimento devem ser capazes de aprender com as falhas.

Incorpore o monitoramento à sua carga de trabalho para que as equipes de desenvolvimento e suporte tenham dados suficientes para analisar quando, por que e qual componente está falhando. Crie alertas significativos para notificar as equipes de suporte em caso de falha. Use análises e insights para impulsionar melhorias.

Saiba mais sobre como projetar para operações no Azure Well-Architected Framework.

Manter simples

Ícone de metaEvite a engenharia excessiva no design da arquitetura, no código do aplicativo e nas operações.

Concentre-se nos requisitos de negócios e remova recursos e componentes que não sejam necessários. Estabeleça padrões para desenvolvimento e implantação que aumentem a consistência. Aproveite os recursos fornecidos pela plataforma e os ativos pré-criados para minimizar o tempo de desenvolvimento.

Saiba mais sobre como manter a simplicidade no Azure Well-Architected Framework.

Próximas etapas