Aperçu sur la résilience et la continuité
Comment Microsoft garantit-il la continuité de l’activité en cas de sinistre ou d’autre menace pour la disponibilité du service ?
L’équipe Enterprise Resilience and Crisis Management (ERCM) de Microsoft supervise les activités de gestion de la continuité d’activité et de récupération d’urgence dans les services Microsoft et les offres cloud. Les représentants des unités commerciales Microsoft se coordonnent avec l’équipe ERCM pour développer des plans de continuité d’activité et valider la conformité aux exigences de continuité d’activité.
Le cycle de vie de la gestion de la continuité d’activité (BCM) est au cœur de notre méthodologie BCM. Ce processus en trois phases est conçu pour être adaptable afin de pouvoir être implémenté par un large éventail de modèles d’entreprise dans Microsoft. Elle commence par une phase d’évaluation pour identifier les processus et les objectifs critiques qui doivent être inclus dans le programme de continuité des activités. La phase d’évaluation nécessite également une analyse de l’impact sur l’entreprise (BIA). La phase de planification se concentre sur le développement et la mise en œuvre de stratégies de résilience et de récupération et leur documentation dans les plans de continuité d’activité officiels. Enfin, la validation des capacités teste les plans de continuité d’activité et leurs implémentations pour vérifier l’efficacité et identifier les améliorations potentielles.
Microsoft services en ligne stratégies de continuité d’activité utilisent la redondance du matériel, du réseau et du centre de données. La réplication des données entre les centres de données offre une haute disponibilité et une fiabilité en cas d’incident catastrophique. Il augmente également la résilience aux incidents banals tels que les défaillances matérielles isolées ou l’altération des données.
Comment Microsoft teste-t-il les plans de continuité d’activité et de reprise d’activité ?
La stratégie enterprise resilience and crisis management (ERCM) de Microsoft stipule que tous les plans de continuité d’activité et de reprise d’activité microsoft doivent être testés, mis à jour et révisés sur une base annuelle. Microsoft services en ligne tester leurs plans de continuité d’activité au moins une fois par an par stratégie ERCM. Une fois les rapports d’action créés et révisés pour valider, testez les résultats et informez les mises à jour du plan en réponse aux problèmes détectés pendant le test.
Pour valider les stratégies de résilience et de récupération contre un large éventail d’incidents potentiels, le programme ERCM définit plusieurs catégories de scénarios de test affectant les personnes, les emplacements et la technologie. Le niveau de validation nécessaire pour chaque service dépend de sa criticité ; les services plus critiques faisant l’objet d’une validation plus rigoureuse. Chaque équipe de service en ligne Microsoft teste son plan de continuité d’activité conformément aux directives ERCM pour mesurer l’efficacité du plan et la préparation de l’équipe de service à l’exécution du plan.
Selon les directives ercm, les examens annuels des plans de continuité d’activité et la validation des capacités doivent avoir lieu dans les 12 mois suivant le dernier examen. La validation des capacités doit inclure un examen de la documentation à l’appui, telle que la BIA, pour s’assurer qu’elle reste exacte. Microsoft met à la disposition de ses clients les résultats de validation des fonctionnalités de certaines services en ligne Microsoft par le biais de rapports trimestriels.
Comment Microsoft services en ligne s’assurer que la capacité du système répond à la demande ?
La planification de la capacité aide les équipes de service à allouer les ressources nécessaires pour prendre en charge la disponibilité du service en ligne Microsoft. Une planification régulière de la capacité est requise dans le cadre du programme ERCM de Microsoft. Les équipes de service examinent les données de capacité pendant les révisions trimestrielles et dans les situations d’urgence qui justifient un examen plus important de la capacité.
Les données brutes pour la planification de la capacité sont conservées par chaque équipe de service et incluent des métriques telles que le traitement du système, la mémoire et la capacité matérielle. Les évaluations planifiées utilisent un modèle de la capacité actuelle du système et testent celles-ci en cas d’urgence. Si le modèle indique des écarts de capacité, les modifications proposées à la capacité du système sont soumises au leadership des équipes de maintenance pour examen. Les modifications approuvées sont incorporées dans un nouveau modèle avant leur implémentation par les ingénieurs d’équipe de service.
Comment Microsoft services en ligne maintenir la disponibilité du service en cas de défaillances système courantes ?
Microsoft services en ligne assurer la résilience du service grâce à une architecture redondante, à la réplication des données et à la vérification automatisée de l’intégrité. L’architecture redondante implique le déploiement de plusieurs instances d’un service sur du matériel géographiquement et physiquement distinct, offrant ainsi une tolérance de panne accrue pour Microsoft services en ligne. La réplication des données garantit qu’il y a toujours plusieurs copies des données client dans différentes zones d’erreur, ce qui permet de récupérer les données client critiques en cas de corruption, de perte ou même de suppression accidentelle par le client. La vérification automatisée de l’intégrité augmente la disponibilité des données en restaurant automatiquement les données affectées par de nombreux types d’altération physique ou logique.
Réglementations externes connexes & certifications
Les services en ligne de Microsoft sont régulièrement auditées pour vérifier la conformité aux réglementations et certifications externes. Reportez-vous au tableau suivant pour la validation des contrôles liés à la résilience et à la continuité.
Azure et Dynamics 365
Audits externes | Section | Date du dernier rapport |
---|---|---|
ISO 27001 Déclaration d’applicabilité Certificat |
A.17.1 : Continuité de la sécurité des informations A.17.2 : Redondances |
8 avril 2024 |
ISO 22301 Certificat |
Tous les contrôles | 8 avril 2024 |
SOC 1 SOC 2 SOC 3 |
BC-1 : Plans de continuité d’activité BC-3 : Procédures de continuité d’activité et de récupération d’urgence BC-4 : test BCDR BC-7 : Plans de continuité d’activité des centres de données BC-8 : Test de continuité d’activité des centres de données BC-9 : Évaluation de la résilience des centres de données DS-5 : Composants du service de clé de sauvegarde DS-6 : Redondance des composants critiques DS-7 : Réplication automatique des données client DS-8 : Planification de la sauvegarde DS-9 : Procédures de restauration de sauvegarde DS-11 : sauvegardes hors site DS-14 : Restauration automatique des services clients |
20 mai 2024 |
Microsoft 365
Audits externes | Section | Date du dernier rapport |
---|---|---|
FedRAMP | CP-2 : Plan d’urgence CP-3 : Formation d’urgence CP-4 : Test du plan d’urgence CP-6 : Site de stockage secondaire CP-7 : Site de traitement secondaire CP-9 : Sauvegarde du système d’information CP-10 : Récupération et reconstitution du système d’information |
21 août 2024 |
ISO 27001 Déclaration d’applicabilité Certificat |
A.17.1 : Continuité de la sécurité des informations A.17.2 : Redondances |
Mars 2024 |
ISO 22301 Certificat |
Tous les contrôles | Mars 2024 |
SOC 1 SOC 2 |
CA-49 : Stratégies de sauvegarde CA-50 : Continuité d’activité CA-51 : Réplication des données |
1er août 2024 |
SOC 3 | CUEC-09 : Restauration des e-mails EXO | 23 janvier 2024 |
Ressources
- Microsoft Cloud ERCM : Rapport de validation du plan de continuité d’activité et de récupération d’urgence FY24 Q4
- Programme de résilience et de gestion des crises en entreprise (ERCM)