Partilhar via


Lista de verificação de revisão de projeto para confiabilidade

Esta lista de verificação apresenta um conjunto de recomendações para você usar para avaliar a confiabilidade, resiliência e estratégias de recuperação de falhas em seu projeto de arquitetura. Para garantir a confiabilidade, identifique a melhor infraestrutura e o melhor design de aplicativos para sua carga de trabalho. Tome essas decisões com base nos seus requisitos empresariais que estão mapeados para as métricas-alvo de disponibilidade e de recuperabilidade.

Para implementar um design confiável, considere cuidadosamente os pontos de decisão em seu projeto e esteja ciente de como essas decisões afetam sua carga de trabalho. Esta lista de verificação e os guias que a acompanham fornecem recursos para ajudá-lo a tomar essas decisões. Faça da confiabilidade da carga de trabalho uma consideração central durante todo o projeto, desenvolvimento e ciclo de vida da operação da carga de trabalho.

Lista de verificação

Aborde seu projeto com foco na confiabilidade para ajudar a garantir que você projete uma carga de trabalho resiliente, gerenciável e repetível. Se você não incluir práticas de confiabilidade e considerar as compensações, seu design estará potencialmente em risco. Considere cuidadosamente todos os pontos abordados na lista de verificação para incutir confiança no sucesso do seu sistema.

  Código Recomendação
RE:01 Concentre o design da sua carga de trabalho na simplicidade e eficiência. Use uma abordagem prática para evitar complexidade desnecessária ao mesmo tempo em que atende às suas metas e requisitos de negócios.
RE:02 Identificar e avaliar fluxos de usuários e sistemas. Use uma escala de criticidade com base em seus requisitos de negócios para priorizar os fluxos.
RE:03 Use a análise de modo de falha (FMA) para identificar possíveis falhas em sua carga de trabalho. Identificar dependências e pontos de falha e desenvolver estratégias de mitigação para essas falhas.
RE:04 Defina metas de confiabilidade e recuperação para sua carga de trabalho. Use as metas para informar seu design e como a base do seu modelo de saúde.
RE:05
RE:05
RE:05
Adicione redundância em diferentes níveis, especialmente para fluxos críticos, para ajudar a atingir suas metas de confiabilidade. Considere componentes de infraestrutura redundantes, como computação e rede, e várias instâncias de sua solução.
RE:06
RE:06
Implementar uma estratégia de dimensionamento oportuna e confiável nos níveis de aplicativo, dados e infraestrutura. Baseie a estratégia de dimensionamento em padrões de uso reais ou previstos e minimize a intervenção manual.
RE:07 Fortalecer a resiliência de sua carga de trabalho implementando medidas de autopreservação e autorrecuperação. Use recursos integrados e padrões de nuvem bem estabelecidos para ajudar sua carga de trabalho a permanecer funcional durante e se recuperar de incidentes.
RE:08 Teste cenários de resiliência e disponibilidade aplicando os princípios da engenharia do caos. Certifique-se de que as suas estratégias de implementação para a degradação controlada e dimensionamento sejam eficazes, realizando testes de falhas ativas e de carga simulada.
RE:09 Implemente planos estruturados, testados e documentados de continuidade de negócios e recuperação de desastres (BCDR) alinhados com as metas de recuperação. Os planos devem abranger todos os componentes e o sistema como um todo.
RE:10 Medir e modelar os sinais de saúde da solução. Capture continuamente o tempo de atividade e outros dados de confiabilidade de toda a carga de trabalho e também de componentes individuais e fluxos-chave.

Próximos passos

Recomendamos que reveja as compensações em termos de fiabilidade para explorar outros conceitos.