Introdução
Às vezes, mesmo que planeie tudo na perfeição, as coisas correm mal. Uma organização que possui e gere recursos de TI tem de preparar um plano para o pior cenário e presumir que o pior cenário irá ocorrer algum dia. O planeamento e recuperação após desastre é um dos elementos de TI mais críticos.
As plataformas de cloud modernas fornecem uma variedade de ferramentas para ajudar as organizações a prepararem-se para circunstâncias adversas e mitigarem os seus efeitos quando ocorrerem. Por exemplo, os serviços de cópias de segurança com base na cloud podem criar réplicas de dados armazenados no local para que os dados possam ser restaurados no caso de serem eliminados, danificados ou destruídos. Também é possível efetuar uma cópia de segurança dos recursos de IaaS, tal como máquinas virtuais e cargas de trabalho do SQL. Alguns serviços PaaS incluem cópias de segurança automáticas. Por exemplo, a Base de Dados SQL do Azure cria cópias de segurança completas uma vez por semana, cópias de segurança diferenciais a cada 12 horas e cópias de segurança de registos de transações em intervalos de alguns minutos. As cópias de segurança são armazenadas num armazenamento georredundante que é replicado para um datacenter emparelhado. As bases de dados perdidas ou danificadas são facilmente restauradas a partir de cópias de segurança para um momento no passado à sua escolha.
A perda de dados não é o único "desastre" para o qual os profissionais de TI têm de preparar um plano. Um plano abrangente de recuperação após desastre também garante a continuidade do negócio. Por exemplo, redirecionar pedidos ("efetuar ativação pós-falha") para uma localização secundária quando uma aplicação deixar de responder ou uma região inteira da cloud pública apresentar um período de indisponibilidade. A cloud também ajuda neste aspeto ao oferecer uma Recuperação após Desastre como Serviço (DRaaS). O objetivo da arquitetura de sistemas é evitar qualquer tipo de dependência de uma parte que possa tornar-se um ponto único de falha. Este é o princípio base da resiliência: permitir e até mesmo planear um grau razoável de falha dentro do sistema, enquanto mantém níveis de serviço aceitáveis para uma organização e os seus clientes.
Neste módulo, começamos com uma explicação abrangente dos erros e falhas. Em seguida, apresentamos técnicas de replicação para criar cópias de segurança de aplicações, serviços e dados para minimizar as possibilidades de perda para a empresa e examinar os serviços de cópia de segurança oferecidos pelos principais fornecedores de serviços cloud. A partir daí, analisamos a recuperação após desastre, DRaaS e mecanismos para alcançar continuidade do negócio. Por fim, debatemos como os princípios de resiliência na computação na cloud estão a alterar as abordagens das organizações em termos de preparação ao trocar medidas reativas por medidas proativas.
Objetivos de aprendizagem
- Compreender o significado de "tolerância a falhas"
- Indicar técnicas reativas utilizadas para alcançar a tolerância a falhas em plataformas de cloud
- Indicar técnicas proativas utilizadas para alcançar a tolerância a falhas em plataformas de cloud
- Compreender os serviços de cópias de segurança oferecidos pelos principais fornecedores de serviços cloud
- Compreender a função que os serviços de cópias de segurança desempenham na resposta e recuperação após desastre
- Explicar a diferença entre serviços de cópias de segurança e serviços de recuperação após desastre
- Indicar os objetivos a nível de serviço que impulsionam o planeamento de recuperação após desastre
- Indicar os serviços de recuperação após desastre oferecidos pelos principais fornecedores de serviços cloud
- Explicar o que é resiliência e como é medida
- Explicar como a resiliência contribui para a continuidade do negócio
Pré-requisitos
- Compreender o que é a computação na cloud, incluindo os modelos de serviços cloud e os fornecedores de serviços cloud
- Conhecer os diferentes tipos de clouds (pública, privada, híbrida)
- Reconhecer os modelos de serviços cloud, como IaaS, PaaS e SaaS, e diferenciá-los entre si
- Compreender como funciona o aprovisionamento de recursos da cloud
- Saber como funcionam os datacenters e como os dados são armazenados na cloud
- Compreender as noções básicas da segurança na cloud