Operações modernas

Concluído

Anteriormente neste módulo, afirmamos que as práticas de operações modernas podem ajudar. No entanto, não dissemos muito sobre o que eram essas práticas ou porque faz sentido procurá-las para obter ajuda. Vamos discutir isso agora como um prelúdio para o mapa que usamos para navegar em nosso trabalho de confiabilidade.

Neste módulo e ao longo do roteiro de aprendizado Operações Modernas, usamos o termo as práticas de operações modernas como um contêiner para duas práticas diferentes:

  • DevOps
  • SRE (engenharia de confiabilidade de site)

Vamos dar uma olhada rápida em ambos e no que eles têm para nos oferecer neste contexto.

DevOps

O DevOps é uma ferramenta maravilhosa que diferentes pessoas compreenderam e interpretaram de diferentes maneiras. Há muitas boas definições para isso. Vamos examinar algumas delas para dar a você uma visão completa:

Entrega contínua de valor

O DevOps é a união de pessoas, processos e produtos para habilitar a entrega contínua de valor para nossos usuários finais. A contração de "Dev" e "Ops" refere-se à substituição de desenvolvimento e operações em silos para criar as equipes multidisciplinares que agora trabalham em conjunto com práticas e ferramentas compartilhadas e eficientes. As práticas essenciais de DevOps incluem planejamento ágil, integração contínua, entrega contínua e monitoramento de aplicativos.

--Sam Guckenheimer, "O que é DevOps?"

Cultura de colaboração, propriedade e aprendizado

DevOps é uma cultura de engenharia de colaboração, propriedade e aprendizado com a finalidade de acelerar o ciclo de vida do desenvolvimento de software da idealização à produção.

--Emily Freeman, "DevOps para leigos"

Trabalhar em conjunto para imaginar, desenvolver, implantar e operar um sistema

DevOps: uma cultura em que as pessoas, independentemente do título ou formação, trabalham juntas para imaginar, desenvolver, implantar e operar um sistema.

--Ken Murage

Engenharia de Confiabilidade de Site

Se a palavra-chave no realm do DevOps é entrega, a palavra-chave para a engenharia de confiabilidade de site é confiabilidade. Embora existam algumas definições para SRE que foram discutidas no campo, parece haver mais consenso sobre esse tópico. Aqui está nossa definição que captura os principais aspectos desse consenso:

A engenharia de confiabilidade de site é uma disciplina de engenharia dedicada a ajudar uma organização a alcançar de maneira sustentável o nível de confiabilidade apropriado em sistemas, serviços e produtos.

Por que essas práticas? Por que agora?

Os profissionais de operações criaram DevOps e SRE nos últimos 15 anos para responder a um conjunto específico de desafios no espaço de operações. Eles identificaram vários fatores que requereriam novas abordagens, incluindo:

  • A crescente complexidade dos ambientes de produção.
  • A dependência cada vez maior das empresas pelo funcionamento contínuo desses ambientes.
  • A incapacidade de dimensionar a força de trabalho de maneira linear ao tamanho desses ambientes.

Embora sejam práticas diferentes com focos diferentes (por exemplo, entrega versus confiabilidade, como mencionado anteriormente), o DevOps e a SRE desenvolveram princípios e práticas que são fundamentais para o trabalho de confiabilidade. Isso inclui monitoramento/observabilidade, resposta a incidente apropriada, automação e colaboração. Todas essas coisas desempenham um papel importante no material que discutiremos no roteiro de aprendizagem Aprimore sua confiabilidade.

Então, mãos à obra. Vamos começar com um modelo que pode nos ajudar a estruturar e planejar nossos esforços de confiabilidade.