Responsabilidade compartilhada para resiliência
Na plataforma de nuvem pública do Azure, a resiliência é uma responsabilidade compartilhada entre a Microsoft e você. Como há diferentes níveis de resiliência em cada carga de trabalho que você projeta e implanta, é importante entender quem tem a responsabilidade principal por cada um desses níveis de perspectiva de resiliência.
Para ajudar você a entender melhor como funciona a responsabilidade compartilhada, especialmente ao enfrentar uma interrupção ou desastre, esse artigo descreve o modelo de responsabilidade compartilhada para resiliência. Para obter mais informações sobre como usar esse modelo para planejar a recuperação de desastres, confira Recomendações para projetar uma estratégia de recuperação de desastres.
Modelo de responsabilidade compartilhada para resiliência
O modelo de responsabilidade compartilhada para resiliência é composto por três níveis:
- Confiabilidade da plataforma principal. A plataforma do Azure oferece um nível básico de confiabilidade para todos os clientes e todos os serviços por meio da infraestrutura, dos serviços e dos processos subjacentes.
- Recursos que aumentam a resiliência O Azure oferece um conjunto de recursos e serviços internos que aumentam a resiliência, como o uso de zonas de disponibilidade, a implantação em várias regiões e a implementação de estratégias de backup. Embora o Azure forneça esses recursos, é sua responsabilidade avaliá-los e configurá-los para que estejam alinhados aos seus requisitos específicos. Os requisitos podem incluir confiabilidade, custo, desempenho e conformidade com padrões regulatórios.
- Aplicativos. Para usar efetivamente os outros níveis, seu aplicativo e sua carga de trabalho devem ser projetados para resiliência.
A Microsoft é a única responsável pela confiabilidade da plataforma principal. A Microsoft também é responsável por fornecer recursos que aumentam a resiliência e que você pode usar. Você é responsável por selecionar e usar os componentes apropriados.
Escolher as categorias de serviço SaaS, PaaS ou IaaS determina que tipo de decisões você toma. Por exemplo, se você usar um serviço SaaS, normalmente não precisará optar pelo uso de zonas de disponibilidade. Se você usar serviços PaaS para seu nível de dados, poderá ter recursos automáticos de backup disponíveis. Se você usar serviços IaaS, normalmente precisará planejar e implementar muitos recursos de resiliência por conta própria.
Observação
As categorias de serviço (SaaS, PaaS e IaaS) são úteis como um agrupamento amplo de serviços, mas é importante entender suas responsabilidades para cada serviço individual que você usa.
Os guias de confiabilidade fornecem uma visão geral de como cada serviço funciona da perspectiva da resiliência e ajudam você a tomar decisões informadas sobre como configurar seus serviços para atender às suas necessidades.
Você também é responsável pelo design do aplicativo e da carga de trabalho, além de definir seus requisitos de confiabilidade, o que ajuda a decidir como projetar e configurar sua solução.
Confiabilidade da plataforma principal
A plataforma de nuvem da Microsoft consiste em uma grande quantidade de infraestrutura, hardware, software e processos para dar suporte à implantação e ao gerenciamento de serviços. Cada componente é projetado para ser altamente resiliente, com várias redundâncias para hardware e com processos de software baseados em pesquisa. Juntos, esses componentes compõem o nível de confiabilidade da plataforma principal. Alguns exemplos de como a Microsoft fornece uma plataforma confiável incluem os seguintes:
- As redes têm links redundantes e podem contornar dinamicamente segmentos com falha.
- Em cada região, os datacenters são conectados por meio de uma rede de baixa latência, que permite uma variedade de abordagens de replicação de dados.
- As instalações do datacenter têm energia, resfriamento e conexões de rede redundantes. Eles são operados por equipes locais que os protegem, monitoram e gerenciam.
- O hardware, incluindo clusters e racks, tem redundância em várias camadas.
- As atualizações para clusters de computação, racks e hosts seguem um processo controlado. Usamos técnicas como hotpatching para reduzir ou eliminar o impacto nos hosts.
- Atualizações de plataformas de software e alterações de configuração são aplicadas seguindo nossas práticas de implantação segura.
- A Microsoft audita fornecedores externos críticos para garantir que uma interrupção de terceiros não interrompa os serviços do Azure.
- Cada serviço do Azure deve ter um plano detalhado de recuperação de desastres. Realizamos simulações de falha completa de região em regiões que correspondem a ambientes de produção.
Todos os serviços do Azure se beneficiam desses recursos de confiabilidade da plataforma principal e das melhorias contínuas feitas pela Microsoft.
Funcionalidades que aumentam a resiliência
O Azure oferece muitos recursos diferentes que aumentam a resiliência. Embora a Microsoft seja responsável por fornecer esses recursos, você é totalmente responsável por selecionar e usar os recursos apropriados para suas necessidades. Alguns exemplos desses recursos incluem:
Regiões. O Azure tem mais de 60 regiões e você pode usar várias regiões em uma única solução para obter redundância geográfica, atender às suas necessidades de residência de dados e habilitar a comunicação de baixa latência para usuários em todo o mundo.
Zonas de disponibilidades. Muitas regiões do Azure dão suporte a zonas de disponibilidade, que permitem distribuir suas cargas de trabalho em vários conjuntos independentes de datacenters. Os serviços do Azure dão suporte a zonas de disponibilidade de uma forma que atende à sua finalidade pretendida, geralmente com suporte para implantações zonais (fixadas em uma única zona) e/ou implantações com redundância de zona (distribuídas em várias zonas). Para saber mais sobre as zonas de disponibilidade, confira O que são zonas de disponibilidade?.
Camadas de serviço. Os serviços oferecem uma variedade de ofertas e camadas que atendem a diferentes requisitos. Por exemplo, quando você cria uma máquina virtual, pode escolher entre um disco padrão, que oferece uma opção de baixo custo, ou um disco Premium para obter um nível mais alto de disponibilidade.
Backups. Muitos serviços do Azure que armazenam dados dão suporte a backups, que podem ser automáticos, manuais ou ambos. Com backups, você pode proteger sua carga de trabalho contra interrupções, bem como contra corrupção de dados e outros eventos de perda de dados.
Governança. Recursos de plataforma como Azure Policy, controle de acesso baseado em função e recursos de proteção de identidade do Microsoft Entra ID podem ser configurados para impor de forma consistente os requisitos da sua organização. Com essas abordagens, você pode proteger suas cargas de trabalho contra incidentes de segurança e alterações acidentais que possam causar tempo de inatividade ou outros problemas com sua carga de trabalho.
Importante
É importante entender os contratos de nível de serviço (SLAs) de cada serviço do Azure. Os SLAs fornecem informações importantes sobre o tempo de atividade esperado do serviço e quaisquer condições que você precisa atender para se qualificar para o SLA. Para obter os SLAs de cada serviço, confira Contratos de Nível de Serviço (SLA) para Serviços Online.
Aplicativos
É sua responsabilidade garantir que seus aplicativos sejam projetados para serem resilientes. Use os pilares do Azure Well-Architected Framework para garantir a excelência arquitetônica no nível fundamental de uma carga de trabalho. O pilar de confiabilidade se concentra em como você pode tornar sua carga de trabalho e seus aplicativos resilientes a diferentes tipos de falhas e em como habilitar a recuperação quando ocorrerem falhas.
Próximas etapas
O modelo de responsabilidade compartilhada se aplica a outras partes da sua solução além da resiliência. Para obter mais informações sobre o modelo de responsabilidade compartilhada para segurança, confira a Central de Confiabilidade da Microsoft.