Recomendações para formalizar tarefas rotineiras e não rotineiras
Aplica-se a esta recomendação da lista de verificação do Azure Well-Architected Framework Operational Excellence:
OE:02 | Formalize a maneira como você executa tarefas operacionais de rotina, conforme necessário e de emergência usando documentação, listas de verificação ou automação. Esforce-se para obter consistência e previsibilidade para os processos e entregas da equipe, adotando práticas e abordagens líderes do setor, como uma abordagem shift left. |
---|
Este guia descreve as recomendações para formalizar tarefas rotineiras e não rotineiras. Equipes de carga de trabalho eficientes e bem-sucedidas têm práticas de gerenciamento de carga de trabalho consistentes e previsíveis. Otimize a eficiência e a consistência adotando ferramentas e práticas comprovadas pelo setor e automatizando processos quando for prático. Ao ser consistente sobre como tarefas rotineiras, improvisadas e de emergência são tratadas, você minimiza o risco de estar despreparado quando surgirem problemas. Ao adotar uma abordagem de melhoria contínua para o gerenciamento de carga de trabalho, você aumenta a consistência e a eficiência da sua equipe em todo o ciclo de vida da carga de trabalho.
Principais estratégias de design
Processos consistentes tornam a qualidade do seu trabalho previsível e a qualidade previsível do trabalho torna o suporte à carga de trabalho mais suave. Para obter consistência em seus processos, você precisa ser intencional e explícito sobre como executar processos em padrões padrão. Use estratégias como automação e abordagens shift-left para minimizar possíveis áreas de imprevisibilidade.
Padronize processos
A padronização de processos assume muitas formas. Descrever todas as maneiras pelas quais você pode abordar a padronização está fora do escopo deste guia, mas algumas recomendações gerais incluem:
Os processos que você padroniza devem abranger todos os aspectos do gerenciamento de carga de trabalho: confiabilidade, segurança, otimização de custos, desempenho e processos operacionais. A equipe de carga de trabalho deve ter o máximo de propriedade dos processos necessária para manter e melhorar continuamente a carga de trabalho sob a governança geral da organização.
A documentação que você produz captura seus procedimentos operacionais padrão e determina como as coisas são feitas, mas a documentação nunca é final. Os procedimentos devem evoluir à medida que sua carga de trabalho e sua equipe evoluem. Revise e desafie regularmente os padrões para garantir que eles sejam os padrões certos para sua equipe no momento. Sua documentação deve ser modelada e controlada por versão para garantir a consistência nos formatos de documentação e que haja um registro de revisões e atualizações. O controle de versão também ajuda a reforçar os requisitos de que a equipe conduza revisões da documentação em intervalos programados regularmente.
Divida tarefas rotineiras, improvisadas e de emergência em itens de lista de verificação fáceis de entender. Um exemplo de tarefa de rotina é o processo de aplicação de uma atualização a uma dependência de software livre. A carga de trabalho pode precisar usar uma biblioteca de software livre, como um SDK, para usar um serviço de mensagens de terceiros. Este SDK deve ser atualizado regularmente para patches de segurança, correções de bugs e melhorias de funcionalidade.
Quando você determina que precisa de uma atualização, a equipe de carga de trabalho pode ter uma lista de verificação que inclui itens como testar a atualização em ambientes inferiores, criar uma solicitação de gerenciamento de alterações para implantar a atualização em produção e atualizar a documentação, como um wiki ou base de dados de conhecimento, para garantir que eles reflitam a versão correta. Concentre cada item da lista de verificação em uma tarefa discreta que esteja claramente definida.
Tarefas improvisadas e de emergência são específicas do cenário, mas os operadores ainda devem entender claramente suas funções e responsabilidades. Eles precisam saber como interagir com a equipe de carga de trabalho e com outras equipes da organização para trabalhar com eficiência nesses tipos de tarefas.
Por exemplo, uma tarefa improvisada pode implantar um novo tipo de recurso, como um serviço de aprendizado de máquina, que foi aprovado para aprimorar a funcionalidade da carga de trabalho. Pode não haver uma lista de verificação totalmente realizada para a implantação e o teste desse tipo de recurso. No entanto, deve haver listas de verificação gerais para adicionar novos recursos à sua infraestrutura como modelos de código e padrões que abrangem testes de infraestrutura para desempenho, segurança e confiabilidade em cada estágio da cadeia de promoção.
Da mesma forma, seu plano de resposta a emergências deve definir claramente as funções e responsabilidades e os processos e procedimentos gerais. Você deve aderir a este plano em situações de emergência para garantir que você as lide com eficiência.
Operações improvisadas e de emergência também são boas oportunidades para aprender como melhorar seus procedimentos operacionais padrão. Peça à equipe de carga de trabalho que reflita sobre como as operações poderiam ter sido mais tranquilas e determine se uma atualização dos processos existentes poderia ser benéfica no futuro.
Adote práticas comprovadas pelo setor
Adote práticas comprovadas pelo setor para minimizar o tempo que sua equipe gasta na invenção de processos e padrões. Seguir as práticas ágeis com o Scrum, organizar seu trabalho por meio de quadros Kanban e adotar um ethos shift-left são exemplos de práticas que foram desenvolvidas ao longo de muitos anos e provaram ser eficazes para organizações de qualquer tamanho. Muitas organizações maduras usam procedimentos operacionais padrão controlados por versão, wikis, manuais de novos funcionários e manuais de operações para impor a consistência.
Confie na experiência de sua equipe para decidir quais práticas se encaixam no gerenciamento do ciclo de vida da carga de trabalho. Aprenda com outras equipes sobre os padrões que elas implementaram com sucesso para entender como práticas específicas se encaixam em sua estrutura organizacional.
Nesse contexto, um ethos shift-left significa que as equipes de carga de trabalho devem ter o poder de procurar medidas que possam melhorar a segurança, a confiabilidade e a eficiência de custos da carga de trabalho. Em seguida, eles adicionam essas medidas de melhoria ao seu próprio backlog, em vez de transferir a responsabilidade para equipes externas.
Por exemplo, um teste exploratório pode descobrir uma área de melhoria na segurança que pode não ter sido descoberta até que seja exposta por verificações de segurança, que acontecem mensalmente ou até com menos frequência. Incentive a equipe de carga de trabalho a se apropriar da carga de trabalho em todos os aspectos de seu ciclo de vida e a contribuir para sua melhoria contínua de forma proativa, em vez de depender de outras equipes.
Aproveite os padrões e recursos centralizados
Incorpore requisitos organizacionais e funções transversais em seus procedimentos operacionais padrão. Sua organização pode ter padrões que você deve adotar para alguns processos. No entanto, você também pode ter o poder de desenvolver seus próprios padrões para outros processos, portanto, procure maneiras de incorporar os padrões necessários em seus processos. Os processos que você possui provavelmente se cruzarão com os processos de outras equipes, portanto, esforce-se para alinhar os padrões de forma viável.
Documente onde os processos da equipe de carga de trabalho e de outras equipes divergem para garantir que a equipe de carga de trabalho possa trabalhar melhor com outras equipes quando houver pontos de interseção. As equipes de segurança central podem usar ferramentas e procedimentos diferentes da equipe de carga de trabalho, e as equipes podem colaborar mais facilmente se estiverem cientes dessas diferenças.
Incorpore os requisitos de conformidade aos procedimentos operacionais padrão. Dependendo do setor e das regiões em que você opera, pode haver requisitos exigentes sobre como executar e documentar tarefas. Certifique-se de entender e incorporar esses requisitos ao criar seus padrões. Treine regularmente a equipe de carga de trabalho sobre esses requisitos.
Implemente a automação
Use a automação para ajudar a obter consistência. Automatize tarefas repetitivas e propensas a erros humanos para aliviar a carga de gerenciamento de sua equipe. Procure oportunidades para automatizar processos, como gerar tickets de ITSM, por exemplo. Para obter mais informações, consulte as Recomendações para implementar a automação.
Controlar o uso de código aberto
Seja intencional sobre sua abordagem para a adoção de código aberto. Padronize as regras sobre quando o uso de ferramentas de software livre é permitido e certifique-se de estar alinhado com os requisitos organizacionais e de conformidade. Talvez você queira criar padrões sobre as contribuições dos membros da equipe de carga de trabalho para projetos de software livre e decidir se deseja abrir seu código interno para outras equipes de desenvolvimento na organização.
Compensação: A codificação de procedimentos operacionais padrão pode acarretar o risco de levar à estagnação ou complacência. Os padrões devem ser seguidos, mas não devem ser rígidos ou estáticos. Esforce-se para encontrar um equilíbrio entre adesão estrita e permissão para inovação para que seus processos possam evoluir com segurança ao longo do tempo.
Facilitação do Azure
Embora não existam produtos do Azure que facilitem diretamente a formalização de processos e procedimentos, a Microsoft publica muitas orientações sobre esse tópico. Use essas diretrizes para entender as práticas recomendadas e comprovadas pelo setor e considerar como aplicá-las à sua carga de trabalho.
O Well-Architected Framework também fornece diretrizes detalhadas sobre os processos e procedimentos que devem ser codificados para garantir que sua carga de trabalho e equipe de carga de trabalho sejam executadas de acordo com os padrões do setor.
Links relacionados
- Recomendações para implementar a automação
- Recomendações para habilitar a automação em sua carga de trabalho
- Recomendações para formalizar práticas de gerenciamento de desenvolvimento de software
Lista de verificação de Excelência Operacional
Consulte o conjunto completo de recomendações.