Lista de verificação de revisão de projeto para Excelência Operacional
Esta lista de verificação apresenta um conjunto de recomendações para ajudá-lo a construir uma cultura de excelência operacional. Comece com uma abordagem de DevOps para integrar especializações de várias disciplinas. Esta abordagem cria uma prática rigorosa de design e desenvolvimento. Essa abordagem leva a implantações repetíveis, confiáveis e seguras de infraestrutura e código.
Priorizar a intervenção humana em áreas que dela se beneficiam e incorporar automação em outras áreas. A observabilidade serve para a excelência operacional monitorizando eventos de saúde e também para validar o projeto e a implementação da carga de trabalho atual, a fim de informar o desenvolvimento futuro de produtos.
Se você não considerar compensações e recomendações para excelência operacional, sua carga de trabalho pode estar em risco. Considere cuidadosamente os pontos abordados na lista de verificação a seguir para incutir confiança no sucesso do seu design.
Lista de verificação
Código | Recomendação | |
---|---|---|
☐ | OE:01 | Defina suas práticas padrão para desenvolver e operar sua carga de trabalho. Fomentar uma cultura irrepreensível que enfatiza a aprendizagem contínua e prioriza a melhoria contínua e a otimização. |
☐ | OE:02 | Formalize a forma como executa tarefas operacionais de rotina, conforme necessário, e de emergência. Aumente a consistência e a previsibilidade adotando práticas e abordagens comprovadas pelo setor. |
☐ | OE:03 | Formalizar processos de ideação e planeamento de software. Baseie-se em padrões estabelecidos da indústria e da organização para comunicação da equipe, requisitos e documentação de projeto e processos de desenvolvimento de software. |
☐ |
OE:04 OE:04 OE:04 |
Melhorar o desenvolvimento de software e a garantia de qualidade implementando práticas padrão do setor. Garanta definições claras de funções e processos consistentes padronizando ferramentas, controle de origem, padrões de projeto, documentação e guias de estilo. |
☐ | OE:05 | Use uma abordagem padronizada de infraestrutura como código (IaC) para preparar recursos e configurações. Use o IaC para garantir estilos consistentes, modularização e garantia de qualidade. Prefira abordagens declarativas em vez de imperativas quando for prático. |
☐ | OE:06 | Crie uma cadeia de suprimentos de carga de trabalho que impulsione mudanças por meio de pipelines previsíveis e automatizados. Garanta que esses pipelines testem e promovam mudanças em todos os ambientes e portas de qualidade. Incorpore testes abrangentes. |
☐ |
OE:07 OE:07 |
Projete e implemente um sistema de monitorização para capturar e expor telemetria, métricas e logs da sua infraestrutura e código. Use esses dados para validar as escolhas de design e orientar futuras decisões de design e negócios. |
☐ | OE:08 | Estabelecer uma prática robusta de operações de emergência. Crie um plano de resposta a incidentes que documente claramente funções, responsabilidades e todos os processos e procedimentos de resposta a emergências. Capture lições através de análises post-mortem e relatórios de incidentes para melhorar tanto o plano quanto a carga de trabalho de forma contínua. |
☐ | OE:09 | Automatize tarefas que são repetitivas, processuais e fornecem um claro retorno sobre o investimento. Prefira ferramentas de automação prontas para uso em vez de soluções personalizadas. Aplicar os pilares do Well-Architected Framework ao projeto e implementação de todos os esforços de automação. |
☐ | OE:10 | Projete e implemente automação desde o início para tarefas como gestão do ciclo de vida, inicialização e governança. Evite a instalação posterior da automação. Simplifique seu projeto adotando a funcionalidade de automação nativa da plataforma. |
☐ | OE:11 | Defina claramente as práticas de implantação em segurança da sua carga de trabalho. Concentre-se em lançamentos pequenos e incrementais com portas de qualidade. Use padrões de implantação modernos e exposição progressiva para gerenciar riscos. Planeje implantações de rotina e de emergência. |
☐ | OE:12 | Implementar uma estratégia de mitigação de falhas de implantação para lidar com problemas inesperados durante a implantação. Utilize abordagens como rollback, desativação de funcionalidades ou capacidades nativas do seu padrão de implementação para uma recuperação rápida. |
Próximos passos
Recomendamos que reavalie os trade-offs de Excelência Operacional para explorar outros conceitos.