Partilhar via


Lista de verificação de revisão de projeto para Excelência Operacional

Esta lista de verificação apresenta um conjunto de recomendações para ajudá-lo a construir uma cultura de excelência operacional. Comece com uma abordagem de DevOps para integrar especializações de várias disciplinas. Esta abordagem cria uma prática rigorosa de design e desenvolvimento. Essa abordagem leva a implantações repetíveis, confiáveis e seguras de infraestrutura e código.

Priorizar a intervenção humana em áreas que dela se beneficiam e incorporar automação em outras áreas. A observabilidade serve para a excelência operacional monitorizando eventos de saúde e também para validar o projeto e a implementação da carga de trabalho atual, a fim de informar o desenvolvimento futuro de produtos.

Se você não considerar compensações e recomendações para excelência operacional, sua carga de trabalho pode estar em risco. Considere cuidadosamente os pontos abordados na lista de verificação a seguir para incutir confiança no sucesso do seu design.

Lista de verificação

  Código Recomendação
OE:01 Defina suas práticas padrão para desenvolver e operar sua carga de trabalho. Fomentar uma cultura irrepreensível que enfatiza a aprendizagem contínua e prioriza a melhoria contínua e a otimização.
OE:02 Formalize a forma como executa tarefas operacionais de rotina, conforme necessário, e de emergência. Aumente a consistência e a previsibilidade adotando práticas e abordagens comprovadas pelo setor.
OE:03 Formalizar processos de ideação e planeamento de software. Baseie-se em padrões estabelecidos da indústria e da organização para comunicação da equipe, requisitos e documentação de projeto e processos de desenvolvimento de software.
OE:04
OE:04
OE:04
Melhorar o desenvolvimento de software e a garantia de qualidade implementando práticas padrão do setor. Garanta definições claras de funções e processos consistentes padronizando ferramentas, controle de origem, padrões de projeto, documentação e guias de estilo.
OE:05 Use uma abordagem padronizada de infraestrutura como código (IaC) para preparar recursos e configurações. Use o IaC para garantir estilos consistentes, modularização e garantia de qualidade. Prefira abordagens declarativas em vez de imperativas quando for prático.
OE:06 Crie uma cadeia de suprimentos de carga de trabalho que impulsione mudanças por meio de pipelines previsíveis e automatizados. Garanta que esses pipelines testem e promovam mudanças em todos os ambientes e portas de qualidade. Incorpore testes abrangentes.
OE:07
OE:07
Projete e implemente um sistema de monitorização para capturar e expor telemetria, métricas e logs da sua infraestrutura e código. Use esses dados para validar as escolhas de design e orientar futuras decisões de design e negócios.
OE:08 Estabelecer uma prática robusta de operações de emergência. Crie um plano de resposta a incidentes que documente claramente funções, responsabilidades e todos os processos e procedimentos de resposta a emergências. Capture lições através de análises post-mortem e relatórios de incidentes para melhorar tanto o plano quanto a carga de trabalho de forma contínua.
OE:09 Automatize tarefas que são repetitivas, processuais e fornecem um claro retorno sobre o investimento. Prefira ferramentas de automação prontas para uso em vez de soluções personalizadas. Aplicar os pilares do Well-Architected Framework ao projeto e implementação de todos os esforços de automação.
OE:10 Projete e implemente automação desde o início para tarefas como gestão do ciclo de vida, inicialização e governança. Evite a instalação posterior da automação. Simplifique seu projeto adotando a funcionalidade de automação nativa da plataforma.
OE:11 Defina claramente as práticas de implantação em segurança da sua carga de trabalho. Concentre-se em lançamentos pequenos e incrementais com portas de qualidade. Use padrões de implantação modernos e exposição progressiva para gerenciar riscos. Planeje implantações de rotina e de emergência.
OE:12 Implementar uma estratégia de mitigação de falhas de implantação para lidar com problemas inesperados durante a implantação. Utilize abordagens como rollback, desativação de funcionalidades ou capacidades nativas do seu padrão de implementação para uma recuperação rápida.

Próximos passos

Recomendamos que reavalie os trade-offs de Excelência Operacional para explorar outros conceitos.