Partager via


Continuité d’activité et reprise d’activité

Microsoft fournit des fonctionnalités de continuité d’activité et de reprise d’activité (BCDR) à tous les environnements de type production dans les applications Software as a service (SAAS) de Dynamics 365 et Power Platform. Cet article décrit les détails et les pratiques que Microsoft prend pour s’assurer que vos données de production sont résilientes lors d’une panne régionale.

Sauvegarde des environnements de production

Microsoft s’engage à garantir les plus hauts niveaux de disponibilité des services pour vos applications et données critiques. Microsoft garantit que l’infrastructure de base et les services de plateforme sont disponibles via sa continuité d’activité et son architecture de type récupération d’urgence en autorisant la redondance géographique, lorsque toutes les données des environnements de production, à l’exception des environnements par défaut, sont sauvegardées dans la région secondaire appariée. Ces sauvegardes sont appelées sauvegardes géo-secondaires et sont configurées pendant le déploiement de l’environnement principal.

Schéma illustrant un réplica géo-secondaire de l’infrastructure de stockage et de calcul des données.

L’illustration ci-dessus montre que lorsque la région A principale est touchée lors d’une panne, les environnements de type production de la région A basculent vers la région secondaire B, qui est saine. Aucune action n’est entreprise sur les autres types d’environnements tels que les environnements par défaut, d’essai, bac à sable, Teams ou développeur.

Pour en savoir plus sur la protection des données dans les environnements hors production, consultez Sauvegarder et restaurer des environnements.

Comment serez-vous averti d’une panne ?

Le principal canal de communication est via le Tableau de bord de l’état du service (SHD) dans les centres d’administration Microsoft et Power Platform. L’équipe de communication de Microsoft lance le processus en publiant des communications initiales pour vous informer de la panne et publier les mises à jour nécessaires dans le Tableau de bord de la santé du service, le cas échéant. Pour plus d’informations sur l’affichage de vos messages dans le centre d’administration, accédez au Tableau de bord de la page d’accueil. Pour mieux vous préparer, visitez la page Préparation aux incidents.    

Processus de basculement et de restauration automatique et critères de continuité d’activité

Le basculement et la restauration automatique sont les deux principales tâches accomplies pendant le processus de continuité d’activité et de reprise après sinistre. L’objectif est de minimiser l’impact d’un sinistre sur la disponibilité et les performances des fonctions et applications métier critiques.

Le basculement est le processus qui consiste à passer à une sauvegarde géosecondaire désignée de tous les systèmes et données de votre site de production principal. À la fin de l’opération de basculement, votre environnement de production est accessible depuis le site géosecondaire.

Important

Pendant que les applications de finances et d’opérations fonctionnent dans la région secondaire après une maintenance du basculement, les déploiements de packages, les rapports financiers et les rapports Power BI ne sont pas disponibles.

Une opération de restauration automatique est le processus de restauration de la production à son emplacement d’origine après un sinistre ou une période de maintenance planifiée.

Dans le cadre de la norme de continuité d’activité et reprise d’activité (BCDR) de Microsoft, les clients ont la garantie que chaque service en ligne de Microsoft révise, teste et met à jour son plan BCDR une fois par an. Le rapport de validation du plan de continuité d’activité et de reprise d’activité Microsoft Cloud est mis à la disposition des clients sur Portail Service Trust.

Si une panne imprévue à l’échelle de la région se produit, telle qu’une catastrophe naturelle qui affecte l’ensemble de la région Azure, les étapes et processus suivants ont lieu.

Responsabilités de Microsoft Responsabilités du client
Si Microsoft détecte une panne et constate que les clients sont touchés, l’équipe de communication de Microsoft envoie les communications nécessaires et tient à jour le tableau de bord d’état du service avec les informations nécessaires. None
En cas de panne, Microsoft effectue un basculement automatique des instances de production vers la région secondaire s’il n’y a aucune perte de données pour le client. None
Si une panne se produit et que Microsoft détermine qu’une perte de données s’est produite, le basculement de l’environnement n’est pas lancé sans le consentement ou l’approbation du client. Une fois que le client est conscient de la panne en cours et en voit l’impact, il relève de sa responsabilité :
- De contacter Microsoft via le support pour connaître le niveau de perte de données qui se produirait si un basculement était initié.
- Si le niveau de perte de données est acceptable par rapport aux normes de son organisation, le client doit donner son consentement par le biais du support pour que Microsoft lance un basculement.
Lorsque Microsoft détermine que la région principale est de nouveau en ligne et qu’elle est pleinement opérationnelle, une restauration automatique est effectuée dans les instances de production. Il n’y a pas de perte de données pendant le processus de restauration automatique planifié, mais les utilisateurs peuvent subir de brèves interruptions ou déconnexions pendant ce laps de temps. None

Récupération d’urgence en libre-service (version préliminaire)

[Cette section fait partie de la documentation en version préliminaire et peut faire l’objet de modifications.]

Important

  • Cette fonctionnalité est en version préliminaire.
  • Les fonctionnalités en version préliminaire ne sont pas destinées à une utilisation en production et peuvent être restreintes. Ces fonctionnalités sont soumises à des conditions d’utilisation supplémentaires, et sont disponibles avant une version officielle de telle sorte que les clients puissent tirer parti d’un accès anticipé et fournir leurs commentaires.

La récupération d’urgence est une fonctionnalité premium de l’infrastructure Power Platform qui permet aux clients de lancer un basculement d’environnement entre les régions en libre-service.

Les clients ont généralement plusieurs environnements de différents types créés dans leur locataire. Cette fonctionnalité est disponible spécifiquement pour les environnements de type production et peut être activée pour chaque environnement. À l’heure actuelle, cette fonctionnalité n’est pas disponible pour les environnements de production des finances et des opérations.

Activer la récupération d’urgence en libre-service

Vous devez activer la récupération d’urgence en libre-service pour un environnement avant de pouvoir utiliser la fonctionnalité. Il s’agit d’une action unique qui provisionne les ressources et démarre le processus de réplication des données entre l’emplacement principal et l’emplacement secondaire. Cela peut prendre jusqu’à 48 heures. Les administrateurs reçoivent une notification lorsque le processus est terminé.

L’activation de la récupération d’urgence dans un environnement n’a aucun impact sur l’environnement ou les données qu’il contient.

Pour activer la récupération d’urgence, procédez comme suit :

  1. Accédez à la liste des environnements dans le centre d’administration Power Platform.
  2. Sélectionnez l’environnement de type production dans lequel vous souhaitez activer la récupération d’urgence en libre-service.
  3. Sélectionnez Récupération d’urgence dans la barre de commandes en haut de la page. Le volet Récupération d’urgence s’affiche.
  4. Sélectionnez le bouton bascule pour le changer en Activé.
  5. Sélectionnez Enregistrer.
  6. L’environnement est brièvement placé dans la page Modifier les détails.
  7. La page Détails de l’environnement s’affiche, indiquant que le processus d’activation de la fonctionnalité a commencé.

Ces deux événements peuvent nécessiter l’utilisation de cette fonctionnalité :

  • Exercice de récupération d’urgence.
  • Intervention d’urgence en cas de panne régionale majeure.

Exercices de récupération d’urgence

Votre entreprise peut avoir des exercices de récupération d’urgence documentés comme une exigence dans vos plans internes de continuité des activités. Certains secteurs et entreprises peuvent être tenus par les réglementations gouvernementales d’effectuer des audits sur leurs capacités BCDR. Dans ces cas, vous pouvez exécuter un exercice de récupération d’urgence sur un environnement. Un exercice de récupération d’urgence vous permet d’effectuer une récupération d’urgence en libre-service sans perdre de données. La durée de l’action de basculement peut être légèrement plus longue pendant que toutes les données restantes sont répliquées dans la région secondaire.

Nous vous recommandons d’effectuer des exercices sur une copie d’un environnement de production, car cela implique des temps d’arrêt pouvant durer plusieurs minutes. Par exemple, vous pouvez copier un environnement de production dans un environnement de type bac à sable, puis changer le type de bac à sable à production.

Basculement d’une intervention d’urgence

Vous pouvez choisir cette option en cas d’urgence, c’est-à-dire lorsque la région principale a subi une panne et que l’accès aux environnements ou aux données n’est pas possible. Si vous choisissez cette option, l’environnement échoue sans copier d’autres données que celles qui ont été répliquées avant la panne.

Lorsque vous effectuez une intervention d’urgence, vous voyez la quantité de perte de données représentée dans le temps, que vous pouvez comparer à votre objectif de point de récupération (RPO), si vous déterminez qu’elle est acceptable et que vous choisissez de continuer. L’environnement fonctionne à l’état d’exécution jusqu’à ce que la récupération d’urgence soit terminée et que l’environnement revienne à un fonctionnement normal à partir de la région secondaire.

Basculement vers la région primaire

Une fois l’exercice terminé ou après l’atténuation d’une panne, nous vous recommandons de rétablir l’environnement dans sa région principale. Un environnement peut fonctionner avec des ressources limitées dans la région appariée. Il n’y a pas de perte de données pendant cette opération.

Statut de la récupération d’urgence de l’environnement

Les administrateurs peuvent déterminer l’état de récupération d’urgence actuel et l’emplacement d’un environnement dans la page Détails de l’environnement. Les administrateurs peuvent également sélectionner Récupération d’urgence dans la barre de commandes pour ouvrir le volet Récupération d’urgence.

Pour vérifier la latence de réplication des données à tout moment, vous pouvez sélectionner Récupération d’urgence, puis sélectionner Intervention d’urgence comme raison de la récupération d’urgence. Cela ouvre une boîte de dialogue de confirmation qui inclut l’heure de la dernière réplication entre les régions pour cet environnement. Vous pouvez sélectionner Annuler si votre seul objectif était de vérifier la perte potentielle de données en cas d’opération de basculement. Gardez à l’esprit que l’heure de la dernière synchronisation est toujours différente à différents moments, car les données sont répliquées en continu.

Documentez votre plan de continuité d’activité

Nous vous recommandons d’effectuer des exercices de récupération d’urgence ou une intervention d’urgence avant qu’une véritable catastrophe ne se produise afin de pouvoir documenter toutes les étapes requises pour tous les points d’intégration externes à Power Platform. Votre entreprise est alors mieux préparée à la reprise en cas de véritable catastrophe.

Remarque à propos de la version préliminaire

Pendant la version préliminaire, cette fonctionnalité n’est pas facturée et vous ne pouvez pas la désactiver. Lorsque la fonctionnalité atteint la disponibilité générale, les clients de la version préliminaire ont la possibilité de conserver la fonctionnalité ou d’autoriser sa désactivation par Microsoft. Il n’y aura aucun impact sur l’emplacement ou les capacités de votre environnement principal si vous choisissez de ne pas effectuer la mise à niveau pendant la disponibilité générale.