Lista de verificação de revisão de projeto para confiabilidade
Esta lista de verificação apresenta um conjunto de recomendações para você usar para avaliar a confiabilidade, resiliência e estratégias de recuperação de falhas em seu projeto de arquitetura. Para garantir a confiabilidade, identifique a melhor infraestrutura e o melhor design de aplicativos para sua carga de trabalho. Tome essas decisões com base nos seus requisitos empresariais que estão mapeados para as métricas-alvo de disponibilidade e de recuperabilidade.
Para implementar um design confiável, considere cuidadosamente os pontos de decisão em seu projeto e esteja ciente de como essas decisões afetam sua carga de trabalho. Esta lista de verificação e os guias que a acompanham fornecem recursos para ajudá-lo a tomar essas decisões. Faça da confiabilidade da carga de trabalho uma consideração central durante todo o projeto, desenvolvimento e ciclo de vida da operação da carga de trabalho.
Lista de verificação
Aborde seu projeto com foco na confiabilidade para ajudar a garantir que você projete uma carga de trabalho resiliente, gerenciável e repetível. Se você não incluir práticas de confiabilidade e considerar as compensações, seu design estará potencialmente em risco. Considere cuidadosamente todos os pontos abordados na lista de verificação para incutir confiança no sucesso do seu sistema.
Código | Recomendação | |
---|---|---|
☐ | RE:01 | Concentre o design da sua carga de trabalho na simplicidade e eficiência. Use uma abordagem prática para evitar complexidade desnecessária ao mesmo tempo em que atende às suas metas e requisitos de negócios. |
☐ | RE:02 | Identificar e avaliar fluxos de usuários e sistemas. Use uma escala de criticidade com base em seus requisitos de negócios para priorizar os fluxos. |
☐ | RE:03 | Use a análise de modo de falha (FMA) para identificar possíveis falhas em sua carga de trabalho. Identificar dependências e pontos de falha e desenvolver estratégias de mitigação para essas falhas. |
☐ | RE:04 | Defina metas de confiabilidade e recuperação para sua carga de trabalho. Use as metas para informar seu design e como a base do seu modelo de saúde. |
☐ |
RE:05 RE:05 RE:05 |
Adicione redundância em diferentes níveis, especialmente para fluxos críticos, para ajudar a atingir suas metas de confiabilidade. Considere componentes de infraestrutura redundantes, como computação e rede, e várias instâncias de sua solução. |
☐ |
RE:06 RE:06 |
Implementar uma estratégia de dimensionamento oportuna e confiável nos níveis de aplicativo, dados e infraestrutura. Baseie a estratégia de dimensionamento em padrões de uso reais ou previstos e minimize a intervenção manual. |
☐ | RE:07 | Fortalecer a resiliência de sua carga de trabalho implementando medidas de autopreservação e autorrecuperação. Use recursos integrados e padrões de nuvem bem estabelecidos para ajudar sua carga de trabalho a permanecer funcional durante e se recuperar de incidentes. |
☐ | RE:08 | Teste cenários de resiliência e disponibilidade aplicando os princípios da engenharia do caos. Certifique-se de que as suas estratégias de implementação para a degradação controlada e dimensionamento sejam eficazes, realizando testes de falhas ativas e de carga simulada. |
☐ | RE:09 | Implemente planos estruturados, testados e documentados de continuidade de negócios e recuperação de desastres (BCDR) alinhados com as metas de recuperação. Os planos devem abranger todos os componentes e o sistema como um todo. |
☐ | RE:10 | Medir e modelar os sinais de saúde da solução. Capture continuamente o tempo de atividade e outros dados de confiabilidade de toda a carga de trabalho e também de componentes individuais e fluxos-chave. |
Próximos passos
Recomendamos que reveja as compensações em termos de fiabilidade para explorar outros conceitos.