Gestion de l’intégrité de la mémoire persistante
S’applique à : Azure Stack HCI, versions 22H2 et 21H2 ; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10
Important
Azure Stack HCI fait désormais partie d’Azure Local. Le changement de nom de la documentation produit est en cours. Toutefois, les versions antérieures d’Azure Stack HCI, par exemple 22H2, continueront de référencer Azure Stack HCI et ne reflèteront pas la modification du nom. Plus d’informations
Cet article fournit des informations sur la gestion des erreurs et la gestion de l’intégrité propres aux appareils de mémoire persistante (PMem), souvent appelées mémoire de classe de stockage (SCM), constituant un type de média non volatile qui peut être utilisé comme stockage de niveau supérieur.
Ces courtes vidéos fournissent une vue d’ensemble de la prise en charge de la mémoire persistante par Windows :
- Utilisation de la mémoire non volatile (NVDIMM-N) en tant que stockage de bloc dans Windows Server 2016
- Utilisation de la mémoire non volatile (NVDIMM-N) en tant que stockage adressable en octets dans Windows Server 2016
Voir aussi Comprendre et déployer la mémoire persistante.
Les périphériques de mémoire persistante sont pris en charge avec les pilotes natifs à partir de Windows Server 2016 et Windows 10 (version 1607). Bien que les périphériques de mémoire persistante se comportent comme d’autres disques (disques durs et SSD), ils possèdent quelques particularités.
Dans un cas d’usage courant, deux modules de mémoire persistante sont utilisés en tant que cache en écriture différée en miroir dans un espace de stockage. Pour définir une telle configuration, consultez Configuration des espaces de stockage avec un cache en écriture différée NVDIMM-N.
Dans Windows Server 2016, l’interface graphique utilisateur des espaces de stockage affiche le type de bus NVDIMM-N comme étant INCONNU. Il n’y a aucune perte de fonctionnalité ni aucune incapacité à créer un pool, un disque virtuel de stockage. Vous pouvez vérifier le type de bus en exécutant l’applet de commande suivante :
Get-PhysicalDisk | fl
Le paramètre BusType dans la sortie indiquera correctement le type de bus en tant que SCM.
Afficher l’état d’intégrité de la mémoire persistante
Cette section décrit comment afficher l’état d’intégrité de vos modules de mémoire persistante. Lorsque vous utilisez la mémoire persistante, l’expérience de surveillance comporte quelques différences :
- La mémoire persistante ne crée pas de compteurs de performances de disque physique. C’est pourquoi elle n’est pas représenté dans les graphiques de Windows Admin Center.
- La mémoire persistante ne crée pas de données Storport 505, ce qui empêche la détection proactive des valeurs hors norme.
Dans le cas contraire, l’expérience de surveillance est la même que pour n’importe quel autre disque physique.
Vous pouvez interroger l’intégrité d’un disque de mémoire persistante en exécutant les applets de commande suivantes :
Get-PmemDisk
DiskNumber Size HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ---- ------------ ------------- ------------ ----------------- -------------------
2 252 GB Unhealthy None True {20, 120} 2
3 252 GB Healthy None True {1020, 1120} 0
Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
SerialNumber HealthStatus OperationalStatus OperationalDetails
------------ ------------ ------------------ ------------------
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warning Predictive Failure {Threshold Exceeded,NVDIMM_N Error}
Notez que vous pouvez récupérer les mêmes informations à l’aide de l’applet de commande Get-PhysicalDisk
et en spécifiant le BusType en tant que SCM :
Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
Remarque
Pour rechercher l’emplacement physique d’un périphérique de mémoire persistante spécifié dans un événement, placez-vous dans l’onglet Détails de l’événement dans l’observateur d'événements, puis accédez à l’emplacement de EventData>Emplacement. Notez que Windows Server 2016 répertorie l’emplacement incorrect des périphériques de mémoire persistante, mais ce problème est résolu dans la version 1709 de Windows Server.
HealthStatus indique si le disque de mémoire persistante est sain.
La valeur UnsafeshutdownCount suit le nombre d’arrêts qui peuvent entraîner une perte de données sur ce disque logique. Il s’agit de la somme du nombre d’arrêts non sécurisés de tous les périphériques de mémoire persistante sous-jacents de ce disque. Pour plus d’informations sur l’état d’intégrité, utilisez l’applet de commande Get-PmemPhysicalDevice
pour rechercher des informations telles que OperationalStatus.
Get-PmemPhysicalDevice
DeviceId DeviceType HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ---------- ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_C1 102005310 126 GB 0 GB
1120 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_F1 102005310 126 GB 0 GB
120 Intel INVDIMM device Healthy {Ok} CPU1_DIMM_F1 102005310 126 GB 0 GB
20 Intel INVDIMM device Unhealthy {HardwareError} CPU1_DIMM_C1 102005310 126 GB 0 GB
Cette applet de commande indique quel périphérique de mémoire persistante est défectueux. L’appareil défectueux (DeviceID 20) correspond au boîtier de l’exemple précédent. Le PhysicalLocation dans le BIOS peut aider à identifier l’appareil de mémoire persistante dans un état défectueux.
Pour mieux comprendre les différentes conditions d’intégrité, consultez les sections suivantes.
État d’intégrité « Avertissement »
Cette condition s’applique quand vous vérifiez l’intégrité d’un périphérique de mémoire persistante et que vous observez que son état d’intégrité est Avertissement, comme illustré dans cet exemple de sortie :
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | Ok | |
802c-01-1602-117cb64f | Avertissement | Prévention d’erreur | {Threshold Exceeded,NVDIMM_N Error} |
Le tableau suivant répertorie des informations sur cette condition.
Direction | Description |
---|---|
Condition probable | Seuil d’avertissement dépassé |
Cause racine | Les périphériques de mémoire persistante suivent divers seuils, comme la température, la durée de vie NVM et/ou la durée de vie de la source d’énergie. Quand l’un de ces seuils est dépassé, le système d’exploitation est notifié. |
Comportement général | Le dispositif reste totalement opérationnel. Il s’agit d’un avertissement, pas d’une erreur. |
Comportement des espaces de stockage | Le dispositif reste totalement opérationnel. Il s’agit d’un avertissement, pas d’une erreur. |
Plus d’informations | Champ OperationalStatus de l’objet PhysicalDisk. Journal des événements – Microsoft-Windows-ScmDisk0101/Operational |
Procédure à suivre | En fonction du seuil d’avertissement, il peut être prudent de remplacer le périphérique de mémoire persistante. |
Échec de l’écriture sur un périphérique de mémoire persistante
Cette condition se produit quand vous vérifiez l’intégrité d’un périphérique de mémoire persistante et que vous observez l’état d’intégrité Défectueux et l’état opérationnel IO Error (Erreur d’E/S), comme illustré dans cet exemple de sortie :
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | Ok | |
802c-01-1602-117cb64f | Unhealthy | {Métadonnées obsolètes, Erreur d’E/S, Erreur temporaire} | {Persistance de données perdue, Données perdues, NV...} |
Le tableau suivant répertorie des informations sur cette condition.
Direction | Description |
---|---|
Condition probable | Perte de persistance/alimentation de secours |
Cause racine | Les appareils de mémoire persistante s’appuient sur une source d’alimentation de secours pour leur persistance, souvent une batterie ou un supercondensateur. Si cette source d’alimentation de secours n’est pas disponible ou si le dispositif ne parvient pas à effectuer une sauvegarde pour une raison quelconque (erreur de contrôleur/Flash), les données sont exposées à un risque et Windows empêche toute nouvelle écriture sur le dispositif concerné. Les lectures sont toujours possibles pour évacuer des données. |
Comportement général | Le volume NTFS est démonté. Le champ de l’état d’intégrité de PhysicalDisk indique « Défectueux » pour tous les dispositifs NVDIMM-N concernés. |
Comportement des espaces de stockage | L’espace de stockage reste opérationnel tant qu’un seul module de mémoire persistante est concerné. Si plusieurs dispositifs sont concernés, les écritures dans l’espace de stockage échouent. Le champ de l’état d’intégrité de PhysicalDisk indique « Défectueux » pour tous les appareils de mémoire persistante concernés. |
Plus d’informations | Champ OperationalStatus de l’objet PhysicalDisk. Journal des événements – Microsoft-Windows-ScmDisk0101/Operational |
Procédure à suivre | Nous vous recommandons de sauvegarder les données PMem concernées. Pour obtenir un accès en lecture, vous pouvez manuellement mettre le disque en ligne (il apparaît en tant que volume NTFS en lecture seule). Pour effacer entièrement cette condition, la cause première doit être résolue (réparez le bloc d’alimentation ou remplacez le module de mémoire persistante, en fonction du problème) et le volume situé sur le module doit être mis hors connexion, puis remis en ligne, ou le système doit être redémarré. Pour rendre le périphérique de mémoire persistante à nouveau utilisable dans les espaces de stockage, utilisez l’applet de commande Reset-PhysicalDisk qui réintègre le dispositif et démarre le processus de réparation. |
Le périphérique apparaît avec une capacité de 0 octet ou en tant que « Disque physique générique »
Cette condition est présente lorsqu’un périphérique de mémoire persistante affiche une capacité de 0 octet et ne peut pas être initialisé ou est exposé en tant qu’objet de « Disque physique générique » sans numéro de série et indiquant l’état opérationnel Perte de communication, comme illustré dans cet exemple de sortie :
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | Ok | |
Avertissement | Perte de communication |
Le tableau suivant répertorie des informations sur cette condition.
Direction | Description |
---|---|
Condition probable | Le BIOS n’a pas exposé le module de mémoire persistante au système d’exploitation |
Cause racine | Les périphériques de mémoire persistante sont basés sur la DRAM. Quand une adresse DRAM endommagée est référencée, la plupart des processeurs lancent une vérification d’ordinateur et redémarrent le serveur. Certaines plateformes de serveur démappe le périphérique de mémoire persistante, ce qui empêche le système d’exploitation d’y accéder et d’entraîner éventuellement une autre vérification d’ordinateur. Cela peut également se produire si le BIOS détecte que le module de mémoire persistante a échoué et doit être remplacé. |
Comportement général | Le module de mémoire persistante apparaît comme non initialisé, avec une capacité de 0 octet et il n’est ni lisible ni inscriptible. |
Comportement des espaces de stockage | L’espace de stockage reste opérationnel (à condition qu’un seul module de mémoire persistante soit affecté). L’objet PMem PhysicalDisk est affiché avec l’état d’intégrité Avertissement et comme « Disque physique général » |
Plus d’informations | Champ OperationalStatus de l’objet PhysicalDisk. Journal des événements – Microsoft-Windows-ScmDisk0101/Operational |
Procédure à suivre | Le périphérique de mémoire persistante doit être remplacé ou assaini de sorte que la plateforme serveur l’expose au système d’exploitation hôte. Le remplacement du périphérique est recommandé, car d’autres erreurs irrécupérables risquent de se produire. L’applet de commande Add-PhysicalDisk permet d’ajouter un appareil de remplacement à une configuration d’espaces de stockage. |
Le périphérique apparaît en tant que RAW ou en tant que disque vide après un redémarrage
Cette condition s’applique quand vous vérifiez l’intégrité d’un périphérique de mémoire persistante et que vous observez l’état d’intégrité Défectueux et l’état opérationnel Métadonnées non reconnues, comme illustré dans cet exemple de sortie :
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | Ok | {Inconnus} |
802c-01-1602-117cb64f | Unhealthy | {Métadonnées non reconnues, Métadonnées obsolètes} | {Inconnus} |
Le tableau suivant répertorie des informations sur cette condition.
Direction | Description |
---|---|
Condition probable | Échec de sauvegarde/restauration |
Origine | En cas de défaillance de la procédure de sauvegarde ou de restauration, vous risquez de perdre toutes les données du module de mémoire persistante. Lorsque le système d'exploitation se charge, il apparaît en tant que tout nouveau périphérique de mémoire persistante sans partition ni système de fichiers et comporte le libellé RAW, ce qui signifie qu'il n'a pas de système de fichiers. |
Comportement général | La mémoire persistante est en mode de lecture seule. Une action explicite de l’utilisateur est nécessaire pour commencer à l’utiliser à nouveau. |
Comportement des espaces de stockage | Les espaces de stockage restent opérationnels si un seul périphérique de mémoire persistante est concerné. L’objet du disque physique PMem apparaît avec l’état d’intégrité « Défectueux » et il n’est pas utilisé par les espaces de stockage. |
Plus d’informations | Champ OperationalStatus de l’objet PhysicalDisk. Journal des événements – Microsoft-Windows-ScmDisk0101/Operational |
Procédure à suivre | Si l’utilisateur ne veut pas remplacer le dispositif concerné, il peut utiliser l’applet de commande Reset-PhysicalDisk pour supprimer la condition de lecture seule sur le périphérique de mémoire persistante concerné. Dans les environnements d’espaces de stockage, celle-ci peut aussi essayer de réintégrer le périphérique de mémoire persistante dans l’espace de stockage et démarrer le processus de réparation. |
Étapes suivantes
Pour consulter des informations connexes, reportez-vous également à :