Continuité d’activité et reprise d’activité
La plateforme d’applications métiers (BAP) de Microsoft offre des fonctionnalités de continuité des activités et reprise d’activité (BCDR) à tous les environnements de type production dans les applications SAAS Dynamics 365 et Power Platform. Cet article décrit les détails et les pratiques prises par Microsoft pour garantir la résilience de vos données de production en cas de panne régionale.
Sauvegarde des environnements de production
Microsoft s’engage à garantir les plus hauts niveaux de disponibilité des services pour vos applications et données critiques. Microsoft garantit que l’infrastructure de base et les services de plateforme sont disponibles via sa continuité d’activité et son architecture de type récupération d’urgence en autorisant la redondance géographique, lorsque toutes les données des environnements de production, à l’exception des environnements par défaut, sont sauvegardées dans la région secondaire appariée. Ces sauvegardes sont appelées sauvegardes géo-secondaires et sont configurées pendant le déploiement de l’environnement principal.
L’illustration ci-dessus montre que lorsque la région principale A est affectée lors d’une panne, les environnements de type production de la région A basculent vers la région secondaire B, qui est saine. Aucune action n’est entreprise sur les autres types d’environnements tels que les environnements par défaut, d’essai, bac à sable, Teams ou développeur.
Pour en savoir plus sur la protection des données dans les environnements hors production, consultez Sauvegarder et restaurer des environnements.
Comment serez-vous averti d’une panne ?
Le principal canal de communication est le Tableau de bord d’intégrité du service (SHD) au sein des centres d’administration Microsoft et Power Platform. L’équipe de communication de Microsoft lance le processus en publiant des communications initiales pour vous informer de la panne et publier les mises à jour nécessaires dans le Tableau de bord de la santé du service, le cas échéant. Pour plus d’informations sur la façon d’afficher vos messages dans le centre d’administration, consultez le tableau de bord Page d’accueil. Pour mieux vous préparer, visitez la page Préparation aux incidents.
Processus de basculement et de restauration automatique et critères de continuité d’activité
Le basculement et la restauration automatique sont les deux tâches principales accomplies au cours du processus de continuité d’activité et reprise d’activité (BCDR), l’objectif étant de minimiser l’impact d’un sinistre sur la disponibilité et les performances des fonctions et applications métier critiques.
Le basculement est le processus qui consiste à passer à une sauvegarde géosecondaire désignée de tous les systèmes et données de votre site de production principal. À la fin de l’opération de basculement, votre environnement de production est accessible depuis le site géosecondaire.
Important
Pendant que les applications de finances et d’opérations fonctionnent dans la région secondaire après une maintenance du basculement, les déploiements de packages, Financial Reporting et les rapports Power BI ne sont pas disponibles.
La restauration automatique consiste à retourner à l’emplacement d’origine de l’environnement après un sinistre ou une période de maintenance planifiée.
Dans le cadre de la norme de continuité d’activité et reprise d’activité (BCDR) de Microsoft, les clients ont la garantie que chaque service en ligne chez Microsoft revoit, met à jour et teste son plan BCDR une fois par an. Le rapport de validation du plan de continuité d’activité et de reprise d’activité Microsoft Cloud est mis à la disposition des clients sur Portail Service Trust.
Si une panne imprévue à l’échelle de la région se produit, comme une catastrophe naturelle qui affecte l’ensemble de la région Azure, les étapes et processus suivants ont lieu.
Responsabilité de Microsoft | Responsabilités du client |
---|---|
Si Microsoft détecte une panne et constate que les clients sont affectés, l’équipe de communication de Microsoft envoie les communications nécessaires et tient à jour le tableau de bord d’intégrité du service avec les informations nécessaires. | None |
En cas de panne, Microsoft effectue un basculement automatique des instances de production vers la région secondaire s’il n’y a AUCUNE PERTE DE DONNÉES pour le client. | None |
Si une panne se produit, Microsoft détermine qu’il y a une PERTE DE DONNÉES, puis le basculement de l’environnement n’est pas initié sans le consentement/l’approbation du client. | Une fois que le client est conscient de la panne en cours et en voit l’IMPACT, il relève de sa responsabilité : - De contacter Microsoft via le support pour connaître le niveau de perte de données qui se produirait si un basculement était initié. - Si le niveau de perte de données est acceptable par rapport aux normes de son organisation, le client doit donner son consentement par le biais du support pour que Microsoft lance un basculement. |
Lorsque Microsoft détermine que la région principale est de nouveau en ligne et qu’elle est pleinement opérationnelle, une RESTAURATION AUTOMATIQUE est effectuée dans les instances de production. Il n’y a pas de perte de données pendant le processus de restauration automatique planifié, mais les utilisateurs peuvent subir de brèves interruptions ou déconnexions pendant ce laps de temps. | None |
Récupération d’urgence en libre-service (version préliminaire)
[Cette section fait partie de la documentation en version préliminaire et peut faire l’objet de modifications.]
Important
- Cette fonctionnalité est en version préliminaire.
- Les fonctionnalités en version préliminaire ne sont pas destinées à une utilisation en production et peuvent être restreintes. Ces fonctionnalités sont soumises à des conditions d’utilisation supplémentaires, et sont disponibles avant une version officielle de telle sorte que les clients puissent tirer parti d’un accès anticipé et fournir leurs commentaires.
La récupération d’urgence est une fonctionnalité premium de l’infrastructure Power Platform qui permet aux clients de lancer un basculement d’environnement entre les régions en libre-service. Les clients ont généralement plusieurs environnements de différents types créés dans leur locataire. Cette fonctionnalité est disponible spécifiquement pour les environnements de type production et peut être activée pour chaque environnement. À l’heure actuelle, cette fonctionnalité n’est pas disponible pour les environnements de production des finances et des opérations.
Activer la récupération d’urgence en libre-service
Vous devez activer la récupération d’urgence en libre-service pour un environnement avant de pouvoir utiliser la fonctionnalité. Il s’agit d’une action unique qui provisionne les ressources et démarre le processus de réplication des données entre l’emplacement principal et l’emplacement secondaire. Cela peut prendre jusqu’à 48 heures. Les administrateurs reçoivent une notification lorsque le processus est terminé.
L’activation de la récupération d’urgence dans un environnement n’a aucun impact sur l’environnement ou les données qu’il contient.
Pour activer la récupération d’urgence, procédez comme suit.
- Accédez à la liste des environnements dans le centre d’administration Power Platform.
- Sélectionnez l’environnement de type production dans lequel vous souhaitez activer la récupération d’urgence en libre-service.
- Sélectionnez Récupération d’urgence dans la barre de commandes, en haut de la page. Le volet Récupération d’urgence s’affiche.
- Sélectionnez le bouton bascule pour le changer en Activé.
- Sélectionnez Enregistrer.
- L’environnement est brièvement placé dans la page Modifier les détails.
- La page Détails de l’environnement s’affiche, indiquant que le processus d’activation de la fonctionnalité a commencé.
Il y a deux raisons qui peuvent vous obliger à utiliser cette fonctionnalité :
- Exercice de récupération d’urgence.
- Intervention d’urgence en cas de panne régionale majeure.
Exercices de récupération d’urgence
Votre entreprise peut avoir des exercices de reprise après sinistre documentés comme une exigence dans vos plans internes de continuité des activités. Il existe également des industries et des entreprises qui peuvent être tenues par la réglementation gouvernementale d’effectuer des audits sur leurs capacités BCDR. Dans ces cas, vous pouvez exécuter un exercice de récupération d’urgence sur un environnement. Un exercice de récupération d’urgence vous permet d’effectuer une récupération d’urgence en libre-service sans perdre de données. La durée de l’action de basculement peut être légèrement supérieure pendant que toutes les données restantes sont répliquées dans la région secondaire.
Nous recommandons d’effectuer les exercices sur une copie d’un environnement de production, car cela implique des temps d’arrêt pouvant durer plusieurs minutes. Par exemple, vous pouvez copier un environnement de production dans un environnement de type bac à sable, puis changer le type de bac à sable en environnement de production.
Basculement d’une intervention d’urgence
Cette option devrait être choisie en cas d’urgence, c’est-à-dire lorsque la région principale a subi une panne et que l’accès aux environnements ou aux données n’est pas possible. Si vous choisissez cette option, l’environnement échoue sans copier d’autres données que celles qui ont été répliquées avant la panne.
Lorsque vous effectuez une intervention d’urgence, vous voyez la quantité de perte de données représentée dans le temps, que vous pouvez comparer à votre objectif de point de récupération (RPO), si vous déterminez qu’elle est acceptable et que vous choisissez de continuer. L’environnement fonctionne à l’état d’exécution jusqu’à ce que la récupération d’urgence soit terminée et que l’environnement revienne à un fonctionnement normal à partir de la région secondaire.
Basculement vers la région primaire
Une fois que vous avez terminé votre exercice ou qu’une panne a été atténuée, nous vous recommandons de rétablir l’environnement dans sa région principale. Un environnement peut fonctionner avec des ressources limitées dans la région appariée. Il n’y a pas de perte de données pendant cette opération.
Statut de la récupération d’urgence de l’environnement
Les administrateurs peuvent déterminer l’état de récupération d’urgence actuel et l’emplacement d’un environnement dans la page Détails de l’environnement. Les administrateurs peuvent également sélectionner Récupération d’urgence dans la barre de commandes pour ouvrir le volet Récupération d’urgence.
Pour vérifier la latence de réplication des données à tout moment, vous pouvez sélectionner Récupération d’urgence et sélectionner Intervention d’urgence comme raison de la récupération d’urgence. Cela ouvre une boîte de dialogue de confirmation qui inclut l’heure de la dernière réplication entre les régions pour cet environnement. Vous pouvez sélectionner Annuler si votre seul objectif était de vérifier la perte potentielle de données en cas d’opération de basculement. Gardez à l’esprit que l’heure de la dernière synchronisation est toujours différente à différents moments, car les données sont répliquées en continu.
Documenter votre plan de continuité d’activité
Nous vous recommandons d’effectuer des exercices de récupération d’urgence ou une intervention d’urgence, si vous le souhaitez, avant qu’une véritable catastrophe ne se produise afin de pouvoir documenter toutes les étapes requises pour tous les points d’intégration externes à Power Platform. Dans ce cas, votre entreprise est mieux préparée à la reprise en cas de véritable catastrophe.
Remarque à propos de la version préliminaire
Pendant la version préliminaire, cette fonctionnalité n’est pas facturée et ne peut pas être désactivée par le client. Lorsque la fonctionnalité atteint la disponibilité générale, les clients de la version préliminaire ont la possibilité de conserver la fonctionnalité ou d’autoriser sa désactivation par Microsoft. Il n’y aura aucun impact sur l’emplacement ou les capacités de votre environnement principal si vous choisissez de ne pas effectuer la mise à niveau pendant la disponibilité générale.