Surveiller l’intégrité de vos sauvegardes à l’aide des métriques de sauvegarde Azure (version préliminaire)

Article
12/12/2024

Sauvegarde Azure fournit un ensemble de métriques intégrées via Azure Monitor qui vous permettent de surveiller l’intégrité de vos sauvegardes. Elle vous permet également de configurer des règles d’alerte qui se déclenchent lorsque les métriques dépassent les seuils définis.

Sauvegarde Azure offre les principales fonctionnalités suivantes :

Possibilité d’afficher les métriques prêtes à l’emploi liées à la sauvegarde et à la restauration de l’intégrité de vos éléments de sauvegarde, ainsi que les tendances associées.
Possibilité d’écrire des règles d’alerte personnalisées sur ces métriques pour surveiller efficacement l’intégrité de vos éléments de sauvegarde.
Possibilité d’acheminer les alertes de métriques déclenchées vers différents canaux de notification pris en charge par Azure Monitor, tels que la messagerie, ITSM, webhook, les applications logiques, etc.

En savoir plus sur les métriques Azure Monitor.

Scénarios pris en charge

Prend en charge les métriques intégrées pour les types de charges de travail suivants :
- machine virtuelle Azure, bases de données SQL dans une machine virtuelle Azure
- Bases de données SAP HANA dans une machine virtuelle Azure
- Azure Files
- Blobs Azure.
Les métriques pour le type de charge de travail d’instance HANA ne sont pas prises en charge actuellement.
Les métriques peuvent être consultées pour tous les coffres Recovery Services de chaque région et abonnement à la fois. L’affichage des métriques pour une plus grande étendue dans le portail Azure n’est pas pris en charge actuellement. Les mêmes limites s’appliquent également à la configuration des règles d’alerte de métrique.

Mesures prises en charge

Actuellement, Sauvegarde Azure prend en charge les métriques suivantes :

Événements d’intégrité de la sauvegarde : la valeur de cette métrique représente le nombre d’événements d’intégrité liés à l’intégrité des tâches de sauvegarde, qui ont été déclenchées pour le coffre dans un délai spécifique. Lorsqu’une tâche de sauvegarde se termine, le service Sauvegarde Azure crée un événement d’intégrité de sauvegarde. En fonction de l’état d’une tâche (par exemple, réussite ou échec), les dimensions associées à l’événement varient.
Événements d’intégrité de la restauration : la valeur de cette métrique représente le nombre d’événements d’intégrité liés à l’intégrité des tâches de sauvegarde, qui ont été déclenchées pour le coffre dans un délai spécifique. Lorsqu’une tâche de restauration est terminée, le service Sauvegarde Azure crée un événement d’intégrité de restauration. En fonction de l’état d’une tâche (par exemple, réussite ou échec), les dimensions associées à l’événement varient.

Notes

Nous prenons en charge les événements d’intégrité de restauration uniquement pour la charge de travail des objets BLOB Azure, car les sauvegardes sont continues, et il n’y a aucune notion de tâches de sauvegarde ici.

Par défaut, les nombres sont exposés au niveau du coffre. Pour afficher le nombre d’éléments de sauvegarde et d’état de tâche particuliers, vous pouvez filtrer les métriques sur l’une des dimensions prises en charge.

Le tableau suivant répertorie les dimensions prises en charge par les métriques Événements d’intégrité de sauvegarde et Événements d’intégrité de restauration :

Nom de la dimension	Description
ID de la source de données	ID unique de la source de données associée à la tâche. Pour les ressources Azure, telles que les machines virtuelles et les fichiers, contient l’ID d’Azure Resource Manager (ID ARM) de la ressource. Par exemple : `/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM` Pour les bases de données SQL/HANA dans les machines virtuelles, il contient l’ID ARM de la machine virtuelle, suivi des détails de la base de données. Par exemple : `/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM/providers/Microsoft.RecoveryServices/backupProtectedItem/SQLDataBase;mssqlserver;msdb` Pour la sauvegarde de base de données SQL AG, le champ ID de source de données est vide, car il n’y a aucune source de données (machine virtuelle) dans de tels scénarios. Pour afficher les métriques d’une base de données particulière au sein d’un groupe de disponibilité, utilisez le champ ID de l'instance de sauvegarde.
Type de source de données	Type de la source de données associée à la tâche. Voici les types de sources de données pris en charge : Microsoft.Compute/VirtualMachines (Machines virtuelles Azure) Microsoft.Storage/storageAccounts/fileServices/shares (Azure Files) SQLDatabase (SQL dans la machine virtuelle Azure) SAPHANADataBase (SAP HANA dans la machine virtuelle Azure)
ID d’instance de sauvegarde	L’ID ARM de l’instance de sauvegarde associée à la tâche. Par exemple : `/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM`
Nom de l’instance de sauvegarde	Nom convivial de l’instance de sauvegarde pour faciliter la lisibilité. Son format est le suivant : `{protectedContainerName};{backupItemFriendlyName}`. Par exemple : `testStorageAccount;testFileShare`
État d’intégrité	Représente l’intégrité de l’élément de sauvegarde une fois la tâche terminée. Il peut prendre l’une des valeurs suivantes : Sain, Temporaire, Non sain, Non sain persistant, Détérioré temporaire, Détérioré persistant. Lorsqu’une tâche de sauvegarde/restauration réussit, un événement d’intégrité avec l’état Sain s’affiche. Non sain apparaît pour des échecs de tâches en raison d’erreurs de service, et Dégradé apparaît pour des échecs dus à des erreurs d’utilisateur. Lorsque la même erreur se produit de façon répétée pour le même élément de sauvegarde, l’état passe de Non sain/Dégradé temporaire à Non sain/Dégradé persistant.

Afficher les métriques dans le portail Azure

Pour afficher les métriques dans le portail Azure, suivez les étapes ci-dessous :

Dans le portail Azure, accédez au Business Continuity Center>Supervision + rapports>Métriques.

Vous pouvez aussi accéder au coffre Recovery Services ou à Azure Monitor, puis sélectionner Métriques.
Pour filtrer les métriques, sélectionnez le type de données suivant :
- Portée
- Abonnement (vous ne pouvez en sélectionner qu’un seul à la fois)
- Coffre Recovery Services/ Coffre de sauvegarde comme type de ressource
- Emplacement
Remarque
- Si vous accédez à Métriques depuis Coffre Recovery Services/ Coffre de sauvegarde, l’étendue des métriques est présélectionnée.
- Sélectionner le Coffre Recovery Services/ Coffre de sauvegarde comme type de ressource vous permet de suivre les métriques intégrées relatives à la sauvegarde : Événements d’intégrité de la sauvegarde et Événements d’intégrité de la restauration.
- Actuellement, l’étendue de visualisation des métriques est disponible pour tous les coffres Recovery Services dans un abonnement et une région particuliers. Par exemple, tous les coffres Recovery Services dans la région USA Est pour l’abonnement AbonnementTest1.
Sélectionnez un coffre ou un groupe de coffres dont vous souhaitez afficher les métriques.

Actuellement, la portée maximale pour laquelle vous pouvez afficher les métriques est : Tous les coffres Recovery Services dans un abonnement et une région particuliers. Par exemple, tous les coffres Recovery Services dans la région USA Est dansTestSubscription1.
Sélectionnez une métrique pour afficher les événements d’intégrité de sauvegarde ou les événements d’intégrité de restauration.

Cela génère le rendu d’un graphique qui indique le nombre d’événements d’intégrité pour le ou les coffres. Vous pouvez ajuster l’intervalle de temps et la granularité de l’agrégation à l’aide des filtres situés en haut de l’écran.
Pour filtrer les métriques selon différentes dimensions, cliquez sur le bouton Ajouter un filtre et sélectionnez les valeurs de dimension appropriées.
- Par exemple, si vous souhaitez afficher le nombre d’événements d’intégrité uniquement pour les sauvegardes de machines virtuelles Azure, ajoutez un filtre Datasource Type = Microsoft.Compute/virtualMachines.
- Pour afficher les événements d’intégrité d’une source de données ou d’une instance de sauvegarde particulière au sein du coffre, utilisez les filtres ID de source de données/ID d’instance de sauvegarde.
- Pour afficher les événements d’intégrité uniquement pour les échecs de sauvegarde, utilisez un filtre sur HealthStatus, en sélectionnant les valeurs correspondant à un état d’intégrité non sain ou détérioré.

Gestion des alertes

Pour afficher les alertes de métriques déclenchées, procédez comme suit :

Dans le portail Azure, accédez au Business Continuity Center>Supervision + rapports>Alertes.
Filtrage pour Type de signal = Métrique et Type d’alerte = Configuré.
Cliquez sur une alerte pour afficher plus de détails sur l’alerte et modifier son état.

Remarque

L’alerte comporte deux champs : Condition de surveillance (déclenchée/résolue) et État de l’alerte (nouveau/acquitter (ack)/fermé) .

État de l’alerte : vous pouvez modifier ce champ (comme indiqué dans la capture d’écran ci-dessous).
Condition du surveillance : vous ne pouvez pas modifier ce champ. Ce champ est plus utilisé dans les scénarios où le service lui-même résout l’alerte. Par exemple, le comportement de résolution automatique dans les alertes de métriques utilise le champ Condition de surveillance pour résoudre une alerte.

Alertes de source de source et alertes globales

En fonction de la configuration des règles d’alerte, l’alerte déclenchée apparaît dans le panneau Alertes du Business Continuity Center.

Découvrez comment visualiser et filtrer les alertes.

Remarque

Actuellement, en cas d’alertes de restauration d’objets BLOB, les alertes s’affichent sous les alertes datasource uniquement si vous sélectionnez à la fois les dimensions- datasourceId et datasourceType lors de la création de la règle d’alerte. Si aucune dimension n’est sélectionnée, les alertes s’affichent sous les alertes globales.

Accès aux métriques par programmation

Vous pouvez utiliser les différents clients programmatiques, tels que PowerShell, l’interface CLI ou l’API REST, pour accéder à la fonctionnalité de métriques. Consultez Documentation sur l’API REST Azure Monitor pour plus de détails.

Exemples de scénarios d’alerte

Déclencher une seule alerte si toutes les sauvegardes déclenchées d’un coffre ont réussi au cours des dernières 24 heures

Règle d’alerte : déclencher une alerte si des événements d’intégrité de sauvegarde < 1 au cours des dernières 24 heures pour :

Dimensions["HealthStatus"] != "Healthy"

Déclencher une alerte après chaque travail de sauvegarde ayant échoué

Règle d’alerte : déclencher une alerte si des événements d’intégrité de sauvegarde > 0 au cours des 5 dernières minutes pour :

Dimensions["HealthStatus"]!= "Healthy"
Dimensions["DatasourceId"]= "Toutes les valeurs actuelles et futures"

Déclencher une alerte en cas d’échecs de sauvegarde consécutifs pour le même élément au cours des dernières 24 heures

Règle d’alerte : déclencher une alerte si des événements d’intégrité de sauvegarde > 1 au cours des dernières 24 heures pour :

Dimensions["HealthStatus"]!= "Healthy"
Dimensions["DatasourceId"]= "Toutes les valeurs actuelles et futures"

Déclencher une alerte si aucune tâche de sauvegarde n’a été exécutée pour un élément au cours des dernières 24 heures