Condividi tramite


Gestione dell'integrità della memoria persistente

Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10

Importante

Azure Stack HCI is now part of Azure Local. La ridenominazione della documentazione del prodotto è in corso. Tuttavia, le versioni precedenti di Azure Stack HCI, ad esempio 22H2 continueranno a fare riferimento ad Azure Stack HCI e non rifletteranno la modifica del nome. Altre informazioni.

Questo articolo fornisce informazioni sulla gestione degli errori e sulla gestione dell'integrità specifici dei dispositivi PMem (Persistent Memory), spesso denominati memoria della classe di archiviazione (SCM), che è un tipo di supporto non volatile che può essere usato come archiviazione di livello superiore.

Questi brevi video offrono una panoramica del supporto di Windows per la memoria persistente:

Vedere anche Informazioni e distribuzione della memoria persistente.

I dispositivi di memoria persistente sono supportati con driver nativi a partire da Windows Server 2016 e Windows 10 (versione 1607). Anche se i dispositivi di memoria persistente si comportano in modo simile ad altri dischi (HDD e UNITÀ SSD), esistono alcune differenze.

Un caso d'uso comune è il caso in cui due moduli di memoria persistente vengono utilizzati come cache writeback con mirroring in uno spazio di archiviazione. Per impostare questa configurazione, vedere Configurazione di Spazi di archiviazione con una cache write-back NVDIMM-N.

In Windows Server 2016, l'interfaccia utente grafica di Spazi di archiviazione mostra il tipo di bus NVDIMM-N come UNKNOWN. Non ha alcuna perdita di funzionalità o impossibilità nella creazione di pool, VD di archiviazione. È possibile verificare il tipo di bus eseguendo il cmdlet seguente:

Get-PhysicalDisk | fl

Il parametro BusType nell'output visualizzerà correttamente il tipo di bus come SCM.

Visualizzare lo stato di integrità della memoria persistente

Questa sezione descrive come visualizzare lo stato di integrità dei moduli di memoria persistente. Quando si usa la memoria persistente, esistono alcune differenze nell'esperienza di monitoraggio:

  • La memoria persistente non crea contatori delle prestazioni disco fisico, quindi non verrà visualizzata nei grafici in Windows Admin Center.
  • La memoria persistente non crea dati Storport 505, quindi non si otterrà il rilevamento proattivo dell'outlier.

In caso contrario, l'esperienza di monitoraggio è uguale a quella di qualsiasi altro disco fisico.

È possibile eseguire query sull'integrità di un disco di memoria persistente eseguendo i cmdlet seguenti:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Vale la pena notare che è possibile ottenere le stesse informazioni usando il Get-PhysicalDisk cmdlet e specificando BusType come SCM:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Nota

Per trovare la posizione fisica di un dispositivo di memoria persistente specificato in un evento, nella scheda Dettagli dell'evento in Visualizzatore eventi passare a EventData Location.To find the physical location of a persistent memory device specified in an event, on the Details tab of the event in Visualizzatore eventi, go to EventData>Location. Si noti che Windows Server 2016 elenca la posizione non corretta dei dispositivi di memoria persistente, ma questo problema è risolto in Windows Server versione 1709.

HealthStatus indica se il disco di memoria persistente è integro.

Il valore UnsafeshutdownCount tiene traccia del numero di arresti che possono causare la perdita di dati su questo disco logico. Si tratta della somma dei conteggi di arresto non sicuri di tutti i dispositivi di memoria persistente sottostanti di questo disco. Per altre informazioni sullo stato di integrità, usare il Get-PmemPhysicalDevice cmdlet per trovare informazioni come OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Questo cmdlet mostra il dispositivo di memoria persistente non integro. Il dispositivo non integro (DeviceId 20) corrisponde al caso dell'esempio precedente. PhysicalLocation nel BIOS può aiutare a identificare il dispositivo di memoria persistente in stato di errore.

Per comprendere le diverse condizioni di integrità, vedere le sezioni seguenti.

Stato di integrità avviso

Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e si noterà che lo stato di integrità è elencato come Avviso, come illustrato in questo output di esempio:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy Ok
802c-01-1602-117cb64f Avviso Errore prevedibile {Soglia superata, errore di NVDIMM_N}

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Intestazione Descrizione
Condizione probabile Soglia di avviso violata
Causa radice I dispositivi di memoria persistente tengono traccia di varie soglie, ad esempio temperatura, durata NVM e/o durata della fonte energetica. Quando uno di questi valori soglia viene superato, il sistema operativo viene notificato.
Comportamento generale Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore.
Comportamento di Spazi di archiviazione Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore.
Ulteriori informazioni Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazione da eseguire A seconda della soglia di avviso violata, può essere prudente sostituire il dispositivo di memoria persistente.

Le scritture in un dispositivo di memoria persistente hanno esito negativo

Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità elencato come Non integro e lo stato operativo indica un errore di I/O, come illustrato nell'output di esempio seguente:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy Ok
802c-01-1602-117cb64f Unhealthy {Metadati obsoleti, errore I/O, errore temporaneo} {Perdita della persistenza dei dati, perdita di dati, NV...}

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Intestazione Descrizione
Condizione probabile Perdita di persistenza/potenza di backup
Causa radice I dispositivi di memoria persistente si basano su una fonte di alimentazione di backup per la persistenza, in genere una batteria o un super-cap. Se questa fonte di alimentazione di backup non è disponibile o il dispositivo non può eseguire un backup per qualsiasi motivo (errore controller/flash), i dati sono a rischio e Windows impedisce ulteriori scritture sui dispositivi interessati. Le operazioni di lettura sono comunque possibile per spostare i dati.
Comportamento generale Verrà smontato il volume NTFS.
Nel campo dello stato di integrità PhysicalDisk verrà visualizzato lo stato "Danneggiato" per tutti i dispositivi NVDIMM-N interessati.
Comportamento di Spazi di archiviazione Lo spazio di archiviazione rimarrà operativo fino a quando è interessato un solo modulo di memoria persistente. Se sono interessati più dispositivi, le scritture sullo spazio di archiviazione avranno esito negativo.
Il campo Stato integrità disco fisico mostrerà "Non integro" per tutti i dispositivi di memoria persistente interessati.
Ulteriori informazioni Campo OperationalStatus dell'oggetto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazione da eseguire È consigliabile eseguire il backup dei dati di PMem interessati. Per ottenere l'accesso in lettura, è possibile portare online il disco manualmente (verrà visualizzato come un volume NTFS in sola lettura).

Per cancellare completamente questa condizione, la causa radice deve essere risolta (ovvero, l'alimentatore del servizio o sostituire il modulo di memoria persistente, a seconda del problema) e il volume nel modulo deve essere portato offline e portato nuovamente online oppure il sistema deve essere riavviato.

Per rendere nuovamente utilizzabile il modulo di memoria persistente in Spazi di archiviazione, usare il Reset-PhysicalDisk cmdlet , che reintegra il dispositivo e avvia il processo di ripristino.

Il dispositivo viene visualizzato con una capacità di '0' byte o come "Disco fisico generico"

Questa condizione è presente quando un dispositivo di memoria persistente viene visualizzato con una capacità di 0 byte e non può essere inizializzato oppure viene esposto come oggetto "Disco fisico generico" senza numero di serie che visualizza uno stato operativo di comunicazione persa, come illustrato in questo output di esempio:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
Avviso Comunicazione perduta

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Intestazione Descrizione
Condizione probabile BIOS non ha esposto il modulo di memoria persistente al sistema operativo
Causa radice I dispositivi di memoria persistente sono basati su DRAM. Quando viene fatto riferimento a un indirizzo DRAM danneggiato, la maggior parte delle CPU avvia un controllo del computer e riavvia il server. Alcune piattaforme server annullano quindi il mapping del modulo di memoria persistente, impedendo al sistema operativo di accedervi e causando potenzialmente un altro controllo del computer. Ciò può verificarsi anche se il BIOS rileva che il modulo di memoria persistente non è riuscito e deve essere sostituito.
Comportamento generale Il modulo di memoria persistente viene visualizzato come non inizializzato, con una capacità di 0 byte e non può essere letto o scritto.
Comportamento di Spazi di archiviazione Lo spazio di archiviazione rimane operativo (purché sia interessato un solo modulo di memoria persistente).
L'oggetto PMem PhysicalDisk viene visualizzato con uno stato di integrità di avviso e come "Disco fisico generale"
Ulteriori informazioni Campo OperationalStatus dell'oggetto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazione da eseguire Il dispositivo di memoria persistente deve essere sostituito o sanificato, in modo che la piattaforma server la esponga nuovamente al sistema operativo host. È consigliabile sostituire il dispositivo, perché potrebbero verificarsi più errori non verificabili. L'aggiunta di un dispositivo sostitutivo a una configurazione di spazi di archiviazione può essere eseguita con il Add-PhysicalDisk cmdlet .

Il dispositivo viene visualizzato come disco RAW o vuoto dopo un riavvio

Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità non integro e lo stato operativo dei metadati non riconosciuti, come illustrato in questo output di esempio:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy Ok {Sconosciuto}
802c-01-1602-117cb64f Unhealthy {Metadati non riconosciuti, metadati obsoleti} {Sconosciuto}

Nella tabella seguente sono elencate alcune informazioni su questa condizione.

Intestazione Descrizione
Condizione probabile Errore di backup/ripristino
Causa principale Un errore nella procedura di backup o ripristino causerà probabilmente la perdita di tutti i dati nel modulo di memoria persistente. Quando il sistema operativo viene caricato, verrà visualizzato come un nuovo dispositivo di memoria persistente senza una partizione o un file system e superficie come RAW, ovvero non ha un file system.
Comportamento generale La memoria persistente sarà in modalità di sola lettura. Sarà necessaria un'azione esplicita dell'utente per iniziare a usarlo nuovamente.
Comportamento di Spazi di archiviazione Spazi di archiviazione rimane operativo se è interessato un solo modulo di memoria persistente).
L'oggetto disco fisico PMem verrà visualizzato con lo stato di integrità "Non integro" e non viene usato da Spazi di archiviazione.
Ulteriori informazioni Campo OperationalStatus dell'oggetto PhysicalDisk.
EventLog – Microsoft-Windows-ScmDisk0101/Operational
Operazione da eseguire Se l'utente non vuole sostituire il dispositivo interessato, può usare il Reset-PhysicalDisk cmdlet per cancellare la condizione di sola lettura nel modulo di memoria persistente interessato. Negli ambienti Spazi di archiviazione verrà anche tentato di reintegrare il modulo di memoria persistente in Spazi di archiviazione e avviare il processo di ripristino.

Passaggi successivi

Per ulteriori informazioni, vedere anche: