Sauvegarde et récupération pour AKS
La sauvegarde et la récupération constituent une partie essentielle de la stratégie opérationnelle et de récupération d’urgence de toute organisation. Un plan de sauvegarde et de récupération s’appuie généralement sur un ensemble diversifié de technologies et de pratiques basées sur la réalisation de copies périodiques des données et des applications sur un appareil ou un service secondaire distinct. En cas de défaillance du système, de perte de données ou de sinistre, ces copies sont utilisées pour récupérer les données et les applications, ainsi que les opérations d’entreprise dont elles dépendent.
Cette section du guide des opérations quotidiennes d’Azure Kubernetes Service (AKS) décrit les pratiques de sauvegarde et de récupération pour AKS.
Pourquoi la sauvegarde de votre cluster AKS est importante
À mesure que les déploiements natifs cloud et Kubernetes continuent à croître en adoption, il devient de plus en plus essentiel pour les organisations d’inclure des clusters et des charges de travail Kubernetes dans une stratégie de sauvegarde et de récupération complète.
L’implémentation de la sauvegarde et de la récupération dans AKS vous permet de :
- Créer une copie secondaire de la configuration et des données de votre cluster AKS pour l’utiliser en cas de défaillance du système irréversible, de perte de données ou de sinistre.
- Copier des ressources Kubernetes et des données d’application d’un cluster AKS vers un autre.
- Répliquer votre cluster AKS pour créer d’autres environnements.
- Capturer des instantanés de charge de travail avant les opérations de maintenance telles que les mises à niveau de version AKS.
- Respecter les exigences de protection des données pour maintenir la conformité réglementaire ou organisationnelle.
- Restaurer rapidement un déploiement précédent si un problème avec un déploiement récent ou une modification est détecté.
Bien que les sauvegardes vous aident à restaurer votre charge de travail en cas de problème, elles ne fournissent pas une haute disponibilité (HA).
En ce qui concerne la haute disponibilité intra-région et la récupération d’urgence inter-régions dans AKS, vous pouvez envisager plusieurs autres options, telles que :
- Zones de disponibilité : AKS prend en charge l’utilisation des zones de disponibilité, qui sont des centres de données physiquement séparés au sein d’une région Azure. En déployant des clusters AKS sur plusieurs zones de disponibilité, vous pouvez garantir une résilience et une tolérance de panne plus élevées au sein d’une région. Cela permet à vos applications de rester opérationnelles même si une zone subit une panne.
- Options de redondance pour les volumes persistants : AKS fournit différentes options de redondance pour les volumes persistants. Le pilote CSI de disque Azure pour Kubernetes prend en charge les classes de stockage intégrées et les classes de stockage personnalisées qui utilisent le stockage localement redondant (LRS) ou le stockage redondant interzone (ZRS) pour une meilleure résilience intra-région. Pour plus d’informations, consultez Paramètres du pilote.
- Azure Kubernetes Fleet Manager : Azure Kubernetes Fleet Manager permet les scénarios intra-région et inter-région, multi cluster et à grande échelle, pour les clusters AKS.
- Options de géoredondance pour Azure Container Registry (ACR) : Azure Container Registry (ACR) offre des fonctionnalités de géoréplication. Grâce à la géoredondance, vos images conteneur sont répliquées dans différentes régions Azure. Ainsi, même si une région particulière subit une panne, vos images sont disponibles, ce qui offre une plus grande disponibilité pour votre registre de conteneurs.
Vous pouvez également utiliser des méthodologies telles que l’infrastructure en tant que code (IaC), Azure Pipelines, GitOps et Flux pour redéployer rapidement vos charges de travail en cas de sinistre.
Pour en savoir plus sur ces méthodologies, vous pouvez consulter ces articles :
- Générer et déployer sur Azure Kubernetes Service avec Azure Pipelines
- Tutoriel : Déployer des applications à l’aide de GitOps avec Flux v2
- Comprendre la structure et la syntaxe des modèles ARM
- Qu’est-ce que Bicep ?
- Vue d’ensemble de Terraform sur Azure – Qu’est-ce que Terraform ?
Éléments à sauvegarder
Lors de l’étude de la sauvegarde et de la récupération pour les clusters AKS et Kubernetes en général, il est essentiel d’identifier exactement quels composants doivent être inclus dans une sauvegarde pour garantir une restauration réussie. Principalement, ces composants critiques comprennent des éléments suivants :
État du cluster : fait référence à la configuration ou à l’état actuel et souhaité de tous les objets Kubernetes au sein du cluster. Il englobe différents objets tels que les déploiements, les pods, les services, etc. L’état du cluster est stocké dans une base de données de paire clé-valeur etcd à haut niveau de disponibilité, souvent accessible uniquement à partir du serveur d’API, comme c’est le cas de clusters managés comme AKS. L’état du cluster est défini de manière déclarative et est le résultat de tous les fichiers de configuration Kubernetes appliqués au cluster, tels que les manifestes YAML.
Données d’application : fait référence aux données créées, managées ou accessibles par les charges de travail conteneurisées exécutées dans le cluster. Pour garantir la persistance des données entre les redémarrages de pod ou de conteneur, Kubernetes recommande de stocker les données d’application dans des volumes persistants. Ces volumes peuvent être créés de manière statique ou dynamique et peuvent être soutenus par différents types de stockage persistant, offrant flexibilité et scalabilité pour le stockage des données et les exigences de gestion.
Bien qu’une sauvegarde complète du cluster nécessite que l’état du cluster et les données d’application soient inclus en tant que seule unité, la détermination de l’étendue optimale de chaque sauvegarde dépend de différents facteurs. Par exemple, la présence de sources alternatives, telles que les pipelines d’intégration continue et livraison continue (CI/CD), peut faciliter la récupération de l’état du cluster. De plus, la taille des données d’application joue un rôle dans les coûts de stockage et le temps nécessaire pour les opérations de sauvegarde et de récupération.
La stratégie idéale de sauvegarde et récupération dépend fortement de l’application et de l’environnement spécifiques. Par conséquent, l’étendue de la sauvegarde doit être évaluée au cas par cas. Elle doit également prendre en compte des facteurs tels que l’importance de l’état du cluster et le volume de données d’application.
Le ciblage d’autres composants tels que des nœuds de cluster individuels (machines virtuelles) ou des systèmes de fichiers et des volumes locaux, qui sont généralement inclus dans les plans de sauvegarde et de récupération traditionnels pour les systèmes basés sur le serveur, n’est pas pertinent dans Kubernetes. L’état et les données pertinents ne sont pas conservés sur des nœuds individuels ou des systèmes de fichiers locaux de la même façon que pour les systèmes traditionnels.
Présentation des options de sauvegarde et récupération pour AKS
Il existe des différences notables entre les applications monolithiques traditionnelles et les charges de travail exécutées dans un cluster Kubernetes, ce qui pose plusieurs défis pour la sauvegarde et la récupération. Les charges de travail Kubernetes sont intentionnellement conçues pour être hautement dynamiques et distribuées, avec des données conservées sur des volumes persistants externes pris en charge par plusieurs ressources et services sous-jacents.
Pour prendre en charge efficacement les environnements Kubernetes, les solutions de sauvegarde et de récupération doivent prendre en charge Kubernetes et les applications. Elles doivent offrir un degré d’automatisation, de fiabilité et d’intégration, qui est souvent introuvable dans les outils de sauvegarde et de récupération hérités ou plus classiques.
Différentes solutions de sauvegarde et de récupération natives Kubernetes sont disponibles, avec des options allant d’open source à une source fermée et offrant différents modèles de licence.
Voici quelques exemples de solutions de sauvegarde et de récupération que vous pouvez utiliser avec AKS. L’un des exemples notables est la solution propriétaire complètement managée de Microsoft appelée Sauvegarde Azure Kubernetes Service (AKS), qui fournit un service intégré à Azure conçu pour la sauvegarde et la récupération des clusters AKS et de leurs charges de travail. Cette liste n’est pas exhaustive et fournit uniquement quelques options disponibles.
Sauvegarde AKS
La sauvegarde AKS est l’offre d’Azure pour sauvegarder et restaurer vos clusters AKS. Il s’agit d’un processus simple, natif Azure, qui vous permet de sauvegarder et restaurer les applications et les données conteneurisées exécutées sur vos clusters AKS.
La sauvegarde AKS permet des sauvegardes à la demande ou planifiées d’un état complet ou précis du cluster et des données d’application stockées dans des volumes persistants basés sur disque Azure. Elle s’intègre au Centre de sauvegarde Azure pour fournir une zone unique dans le portail Azure qui peut vous aider à administrer, surveiller, exploiter et analyser les sauvegardes à grande échelle.
Consultez À propos de la sauvegarde AKS à l’aide de la sauvegarde Azure pour obtenir une description détaillée du fonctionnement de la sauvegarde AKS et de ses fonctionnalités.
Kasten
Kasten est un produit commercial, qui fournit aux équipes d’exploitation un système simple d’utilisation et sécurisé pour la sauvegarde et la récupération d’applications Kubernetes. Il est disponible à la fois en version gratuite avec des fonctionnalités limitées et aucune assistance, et en version payante qui inclut plus de fonctionnalités et un service clientèle.
Quand Kasten est déployé en tant qu’opérateur Kubernetes au sein du cluster, il fournit une solution de sauvegarde complète. Il offre un tableau de bord de gestion pour le contrôle centralisé et la visibilité. Avec Kasten, les utilisateurs peuvent tirer parti des sauvegardes incrémentielles et avec prise en charge des applications, ce qui permet une protection efficace des données. De plus, Kasten offre des fonctionnalités de récupération d’urgence. Ces fonctionnalités incluent le basculement et la restauration automatiques, ainsi que des fonctionnalités de migration des données et de sécurité.
Pour plus d’informations sur l’ensemble de fonctionnalités de Kasten, consultez la documentation de Kasten K10. Pour savoir comment utiliser efficacement Kasten avec des clusters AKS, consultez Installation de K10 sur Azure.
Velero
Velero est un outil de sauvegarde et de récupération open source largement utilisé pour Kubernetes. Il offre une version gratuite et illimitée disponible pour tous les utilisateurs, avec une assistance et une maintenance fournies par une communauté de contributeurs au projet.
Velero s’exécute en tant que déploiement dans le cluster et fournit un ensemble complet de fonctionnalités pour la sauvegarde, la récupération et la migration des données des applications. Bien que les tableaux de bord ne soient pas disponibles d'emblée, ils peuvent être ajoutés via des intégrations externes.
Pour plus d’informations sur son ensemble de fonctionnalités et pour découvrir comment l’intégrer à des clusters AKS, consultez la documentation de Velero.
Installation et configuration de la sauvegarde AKS
Pour installer et configurer la sauvegarde AKS, procédez ainsi :
- Consultez les Conditions préalables pour la sauvegarde AKS à l’aide de la sauvegarde Azure pour obtenir une description détaillée des conditions préalables à l’utilisation de la sauvegarde AKS avec votre cluster AKS.
- Consultez la matrice de prise en charge de la sauvegarde AKS pour obtenir une description détaillée de la disponibilité dans votre région de la sauvegarde AKS, des scénarios pris en charge et des limitations.
- Consultez Gérer les sauvegardes AKS à l’aide de la sauvegarde Azure pour obtenir des conseils sur l’enregistrement des fournisseurs de ressources requis sur vos abonnements et la gestion de ces enregistrements.
- Consultez Sauvegarde AKS à l’aide de la sauvegarde Azure pour obtenir des instructions détaillées sur la configuration de la sauvegarde et de la récupération de votre cluster AKS à l’aide de la sauvegarde AKS. Les instructions incluent la création et la configuration de toutes les ressources Azure nécessaires, telles que le coffre de sauvegarde, les stratégies de sauvegarde et les instances de sauvegarde.
- Consultez Restauration AKS à l’aide de la sauvegarde Azure pour obtenir des instructions détaillées sur la façon d’effectuer des restaurations complètes ou au niveau des éléments de votre cluster AKS à partir d’une instance de sauvegarde existante.
Fréquence et rétention de sauvegarde dans AKS : définition d’une stratégie de sauvegarde
La détermination de la fréquence de sauvegarde et de la période de rétention est un aspect fondamental des solutions de sauvegarde et de récupération. Ces paramètres définissent la fréquence à laquelle les sauvegardes sont effectuées et la durée pendant laquelle elles sont conservées avant la suppression. La sélection de la fréquence de sauvegarde et de la période de rétention pour un cluster AKS et ses charges de travail doivent s’aligner sur les buts prédéfinis de l’objectif de point de récupération (RPO) et l’objectif de temps de récupération (RTO).
Dans un scénario Kubernetes, le RPO représente la quantité maximale acceptable de perte d’état du cluster ou de données qui peut être tolérée. Le RTO spécifie le délai maximal autorisé entre la perte de l’état du cluster ou des données et la reprise des opérations du cluster.
La fréquence de sauvegarde et la période de rétention choisies sont un compromis entre les objectifs de RPO/RTO souhaitables, les coûts de stockage et la surcharge de gestion des sauvegardes. Cela signifie qu’il n’existe pas une configuration unique adaptée à tous les clusters et toutes les charges de travail AKS, et que la configuration optimale pour chaque cluster ou charge de travail doit être définie au cas par cas pour répondre aux exigences de l’entreprise, en suivant une planification et une considération minutieuses. Les facteurs pertinents à prendre en compte lors de la définition de la fréquence de sauvegarde et de la période de rétention d’un cluster AKS sont les suivants :
- Criticité : niveau de criticité associé au cluster et à ses données d’application de charge de travail en termes de continuité d’activité.
- Modèles d’accès et taux de modification : quantité d’état et de données de cluster ajoutées, modifiées, supprimées pendant une période donnée.
- Volume de données : volume de données affectant les coûts de stockage et le temps nécessaire pour effectuer des opérations de sauvegarde et de récupération.
- Conformité : exigences en matière de conservation des données et de souveraineté des données en fonction des règles de conformité internes et des réglementations du secteur d’activité.
Dans le service de sauvegarde AKS, la fréquence de sauvegarde et la période de rétention sont stockées en tant que ressource de stratégie de sauvegarde, qui s’applique à la fois à l’état du cluster et aux données d’application à partir de volumes persistants.
Les stratégies de sauvegarde dans la sauvegarde AKS prennent en charge les sauvegardes quotidiennes et horaires, avec des périodes de rétention allant jusqu’à 360 jours, tandis que plusieurs stratégies peuvent être définies et appliquées au même cluster.
Pour plus d’informations sur la configuration des stratégies de sauvegarde dans la sauvegarde AKS, consultez Créer une stratégie de sauvegarde.
Autres considérations relatives à la sauvegarde
Pour vous assurer que votre solution de sauvegarde et de récupération répond aux exigences et aux stratégies de votre organisation, tenez compte des points suivants :
- Objectif de point de récupération (RPO) et objectif de temps de récupération (RTO) : déterminez si vous avez des cibles spécifiques de RPO et de RTO qui doivent être atteintes pour vos opérations de sauvegarde et récupération.
- Volumes persistants (PV) : vérifiez si vous utilisez des volumes persistants et assurez-vous que la solution de sauvegarde AKS prend en charge vos types de PV. Pour plus d’informations sur la compatibilité, reportez-vous à la matrice de prise en charge de la sauvegarde AKS.
- Étendue de la sauvegarde : définissez les éléments à sauvegarder, tels que des espaces de noms spécifiques, des types de ressources ou des données spécifiques au sein du cluster. Pour plus d’informations, consultez Configurer une tâche de sauvegarde.
- Fréquence de sauvegarde et rétention : déterminez la fréquence à laquelle vous devez effectuer des sauvegardes et la durée pendant laquelle vous devez les conserver. Ce paramètre peut être configuré à l’aide de stratégies de sauvegarde. Pour plus d’informations, consultez Définir une stratégie de sauvegarde.
- Sélection du cluster : déterminez si vous devez sauvegarder tous les clusters ou uniquement des clusters de production spécifiques en fonction de vos besoins.
- Procédure de restauration de test : effectuez des restaurations de test périodiques pour valider la fiabilité et la facilité d’utilisation de votre stratégie de sauvegarde. Cette étape est essentielle pour garantir l’efficacité de la solution de sauvegarde et de récupération. Pour plus d’informations, consultez Restaurer un cluster AKS.
- Scénarios pris en charge : vérifiez que la solution de sauvegarde AKS prend en charge votre scénario spécifique. Pour plus d’informations sur la compatibilité, reportez-vous à la matrice de prise en charge de la sauvegarde AKS.
- Allocations de budget : déterminez si vous disposez d’allocations de budget spécifiques pour les opérations de sauvegarde et de restauration. Passez en revue les informations de tarification fournies par la solution de sauvegarde AKS pour vous aligner sur vos besoins budgétaires.
En tenant compte de ces autres considérations, vous pouvez vous assurer que votre solution de sauvegarde et de récupération pour AKS répond aux besoins et préférences de votre organisation de manière efficace et efficiente.
Emplacement de sauvegarde AKS et stockage
La sauvegarde AKS utilise un coffre de sauvegarde et un compte de stockage pour stocker les différents types de données capturées à partir d’un cluster pendant une sauvegarde.
Pour les volumes persistants basés sur disque, la sauvegarde AKS utilise des instantanés incrémentiels du disque Azure sous-jacent, qui sont stockés dans votre abonnement Azure.
Un coffre de sauvegarde est une entité de stockage sécurisée dans Azure, utilisée pour stocker les données de sauvegarde pour les charges de travail prises en charge par la sauvegarde Azure, comme les clusters AKS. Le coffre de sauvegarde lui-même contient les stratégies de sauvegarde, ainsi que les sauvegardes et les points de récupération créés par les tâches de sauvegarde.
Azure gère automatiquement le stockage du coffre de sauvegarde. Vous pouvez choisir parmi plusieurs options de redondance pour les données stockées dans ce coffre, qui peuvent être configurées au moment de la création du coffre de sauvegarde.
Un compte de stockage est une zone de stockage pour vos objets de données au sein d’Azure ; il est hautement configurable. Il fournit plusieurs options de redondance intra-région et inter-région pour garantir la durabilité des données. La sauvegarde AKS utilise un conteneur d’objets blob au sein d’un compte de stockage désigné pour effectuer des sauvegardes de certains composants du cluster AKS.
Les instantanés incrémentiels sont des sauvegardes ponctuelles des disques managés qui contiennent uniquement les modifications apportées depuis le dernier instantané. Le premier instantané incrémentiel est une copie complète du disque. Les instantanés incrémentiels suivants capturent uniquement les modifications delta apportées aux disques depuis le dernier instantané.
Utilisation de la sauvegarde AKS pour migrer des charges de travail entre des clusters AKS
Vous pouvez utiliser la sauvegarde AKS comme mécanisme de sauvegarde et de récupération pour des clusters spécifiques. La sauvegarde AKS prend également en charge les scénarios de migration en vous permettant d’effectuer une sauvegarde à partir d’un cluster et de la restaurer vers un autre, par exemple :
- Restauration d’un cluster de développement vers un cluster intermédiaire
- Réplication du contenu sur plusieurs clusters
Pour vous assurer que votre scénario est pris en charge, consultez la documentation suivante :
Contributeurs
Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.
Auteur principal :
- Adam Sharif | Conseiller technique
- Joao Tavares | Ingénieur senior pour l’escalade
Autres contributeurs :
- Paul Salvatori | Ingénieur client principal, FastTrack for Azure
- Sonia Cuff | Cloud Advocate en chef
Étapes suivantes
En savoir plus sur la sauvegarde AKS
- Présentation de la sauvegarde AKS
- Matrice de prise en charge de la sauvegarde AKS
- Prérequis pour la sauvegarde AKS
- Configurer la sauvegarde AKS
- Créer un coffre de sauvegarde
- Créer une stratégie de sauvegarde
- Configurer les sauvegardes
- Restaurer un cluster AKS
- Meilleures pratiques en matière de continuité d’activité et reprise d’activité pour AKS
- Modèles de fiabilité – Modèles de conception cloud