Responsabilidade partilhada pela resiliência
Na plataforma de nuvem pública do Azure, a resiliência é uma responsabilidade compartilhada entre a Microsoft e você. Como há diferentes níveis de resiliência em cada carga de trabalho que você projeta e implanta, é importante que você entenda quem é o principal responsável por cada um desses níveis de uma perspetiva de resiliência.
Para ajudá-lo a entender melhor como funciona a responsabilidade compartilhada, especialmente quando confrontado com uma interrupção ou desastre, este artigo descreve o modelo de responsabilidade compartilhada para resiliência. Para obter mais informações sobre como realmente usar esse modelo para planejar a recuperação de desastres, consulte Recomendações para projetar uma estratégia de recuperação de desastres.
Modelo de responsabilidade partilhada para a resiliência
O modelo de responsabilidade partilhada para a resiliência é composto por três níveis:
- Confiabilidade da plataforma principal. A plataforma Azure fornece um nível básico de fiabilidade para todos os clientes e todos os serviços através da infraestrutura, serviços e processos subjacentes.
- Recursos de aprimoramento de resiliência O Azure oferece um conjunto de recursos e serviços internos que aprimoram a resiliência, como o uso de zonas de disponibilidade, a implantação em várias regiões e a implementação de estratégias de backup. Embora o Azure forneça esses recursos, é sua responsabilidade avaliá-los e configurá-los para alinhá-los com seus requisitos específicos. Os requisitos podem incluir confiabilidade, custo, desempenho e conformidade com normas regulamentares.
- Aplicações. Para fazer uso eficaz dos outros níveis, seu aplicativo e sua carga de trabalho devem ser projetados para resiliência.
A Microsoft é a única responsável pela confiabilidade da plataforma principal. A Microsoft também é responsável por fornecer recursos de aumento de resiliência que você pode usar. Você é responsável por selecionar e usar os componentes apropriados.
Se você escolher categorias de serviço SaaS, PaaS ou IaaS determina o tipo de decisões que você toma. Por exemplo, se você usa um serviço SaaS, normalmente não precisa optar por usar zonas de disponibilidade. Se você usa serviços PaaS para sua camada de dados, talvez tenha recursos automatizados de backup disponíveis para você. Se você usa serviços IaaS, normalmente precisa planejar e implementar muitos recursos de resiliência por conta própria.
Nota
As categorias de serviços (SaaS, PaaS e IaaS) são úteis como um amplo agrupamento de serviços, mas é importante entender suas responsabilidades por cada serviço individual que você usa.
Os guias de confiabilidade fornecem uma visão geral de como cada serviço funciona de uma perspetiva de resiliência e ajudam você a tomar decisões informadas sobre como configurar seus serviços para atender às suas necessidades.
Você também é responsável pelo design do aplicativo e da carga de trabalho e pela definição dos requisitos de confiabilidade, o que o ajuda a decidir como projetar e configurar sua solução.
Fiabilidade da plataforma principal
A plataforma de nuvem da Microsoft consiste em uma grande quantidade de infraestrutura, hardware, software e processos para dar suporte à implantação e ao gerenciamento de serviços. Cada componente é projetado para ser altamente resiliente, com várias redundâncias para hardware e com processos de software baseados em pesquisa. Juntos, esses componentes compõem o nível de confiabilidade da plataforma principal. Alguns exemplos de como a Microsoft fornece uma plataforma confiável incluem o seguinte:
- As redes têm links redundantes e podem ignorar dinamicamente segmentos defeituosos.
- Dentro de cada região, os datacenters são conectados por meio de uma rede de baixa latência, o que permite uma variedade de abordagens de replicação de dados.
- As instalações do datacenter têm conexões redundantes de energia, resfriamento e rede. Eles são operados por equipes no local que os protegem, monitoram e gerenciam.
- O hardware, incluindo clusters e racks, tem redundância em várias camadas.
- As atualizações para clusters de computação, racks e hosts seguem um processo controlado. Usamos técnicas como hotpatching para reduzir ou eliminar o impacto nos anfitriões.
- As atualizações da plataforma de software e as alterações de configuração são aplicadas seguindo nossas práticas de implantação segura.
- A Microsoft audita fornecedores externos críticos para garantir que uma interrupção de terceiros não interrompa os serviços do Azure.
- Cada serviço do Azure deve ter um plano detalhado de recuperação de desastres. Realizamos perfurações de região completa em regiões que correspondem aos ambientes de produção.
Todos os serviços do Azure se beneficiam desses recursos principais de confiabilidade da plataforma e com as melhorias contínuas feitas pela Microsoft.
Capacidades de reforço da resiliência
O Azure fornece muitos recursos diferentes de aprimoramento de resiliência. Embora a Microsoft seja responsável por fornecer esses recursos, você é inteiramente responsável por selecionar e usar os apropriados para suas necessidades. Alguns exemplos desses recursos incluem:
Regiões. O Azure tem mais de 60 regiões e você pode usar várias regiões em uma única solução para obter redundância geográfica, atender às suas necessidades de residência de dados e habilitar a comunicação de baixa latência para usuários globalmente. Para saber mais sobre regiões, consulte O que são regiões do Azure?.
Zonas de disponibilidade. Muitas regiões do Azure dão suporte a zonas de disponibilidade, que permitem distribuir suas cargas de trabalho entre vários conjuntos independentes de datacenters. Os serviços do Azure dão suporte a zonas de disponibilidade de uma maneira que se adapta à finalidade pretendida, geralmente dando suporte a implantações zonais (fixadas a uma única zona) e/ou implantações redundantes de zona (espalhadas por várias zonas). Para saber mais sobre zonas de disponibilidade, consulte O que são zonas de disponibilidade?.
Níveis de serviço. Os serviços oferecem uma variedade de ofertas e níveis que atendem a diferentes requisitos. Por exemplo, ao criar uma máquina virtual, você pode escolher entre um disco padrão, que fornece uma opção de baixo custo, ou um disco premium para obter um nível mais alto de disponibilidade.
Cópias de segurança. Muitos serviços do Azure que armazenam dados dão suporte a backups, que podem ser automáticos, manuais ou ambos. Com backups, você pode proteger sua carga de trabalho contra interrupções, corrupção de dados e outros eventos de perda de dados.
Governação. Os recursos da plataforma, como a Política do Azure, o controle de acesso baseado em função e os recursos de proteção de identidade do Microsoft Entra ID, podem ser configurados para impor os requisitos da sua organização de forma consistente. Com essas abordagens, você pode proteger suas cargas de trabalho contra incidentes de segurança e alterações acidentais que podem causar tempo de inatividade ou outros problemas com sua carga de trabalho.
Importante
É importante entender os SLAs (contratos de nível de serviço) para cada serviço do Azure. Os SLAs fornecem informações importantes sobre o tempo de atividade esperado do serviço e quaisquer condições que você precise atender para ser elegível para o SLA. Para obter SLAs para cada serviço, consulte Contratos de Nível de Serviço (SLA) para Serviços Online.
Aplicações
É sua responsabilidade garantir que seus aplicativos sejam projetados para serem resilientes. Use os pilares do Azure Well-Architected Framework para impulsionar a excelência arquitetônica no nível fundamental de uma carga de trabalho. O pilar de confiabilidade se concentra em como você pode tornar sua carga de trabalho e aplicativos resilientes a diferentes tipos de falhas e habilitar a recuperação quando elas ocorrem.
Próximos passos
O modelo de responsabilidade compartilhada se aplica a outras partes da sua solução além da resiliência. Para obter mais informações sobre o modelo de responsabilidade compartilhada para segurança, consulte Central de Confiabilidade da Microsoft.