Gestione dell'integrità della memoria persistente
Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10
Importante
Azure Stack HCI is now part of Azure Local. La ridenominazione della documentazione del prodotto è in corso. Tuttavia, le versioni precedenti di Azure Stack HCI, ad esempio 22H2 continueranno a fare riferimento ad Azure Stack HCI e non rifletteranno la modifica del nome. Altre informazioni.
Questo articolo fornisce informazioni sulla gestione degli errori e sulla gestione dell'integrità specifici dei dispositivi PMem (Persistent Memory), spesso denominati memoria della classe di archiviazione (SCM), che è un tipo di supporto non volatile che può essere usato come archiviazione di livello superiore.
Questi brevi video offrono una panoramica del supporto di Windows per la memoria persistente:
- Uso di memoria non volatile (NVDIMM-N) come archiviazione a blocchi in Windows Server 2016
- Uso di memoria non volatile (NVDIMM-N) come archiviazione indirizzabile tramite byte in Windows Server 2016
Vedere anche Informazioni e distribuzione della memoria persistente.
I dispositivi di memoria persistente sono supportati con driver nativi a partire da Windows Server 2016 e Windows 10 (versione 1607). Anche se i dispositivi di memoria persistente si comportano in modo simile ad altri dischi (HDD e UNITÀ SSD), esistono alcune differenze.
Un caso d'uso comune è il caso in cui due moduli di memoria persistente vengono utilizzati come cache writeback con mirroring in uno spazio di archiviazione. Per impostare questa configurazione, vedere Configurazione di Spazi di archiviazione con una cache write-back NVDIMM-N.
In Windows Server 2016, l'interfaccia utente grafica di Spazi di archiviazione mostra il tipo di bus NVDIMM-N come UNKNOWN. Non ha alcuna perdita di funzionalità o impossibilità nella creazione di pool, VD di archiviazione. È possibile verificare il tipo di bus eseguendo il cmdlet seguente:
Get-PhysicalDisk | fl
Il parametro BusType nell'output visualizzerà correttamente il tipo di bus come SCM.
Visualizzare lo stato di integrità della memoria persistente
Questa sezione descrive come visualizzare lo stato di integrità dei moduli di memoria persistente. Quando si usa la memoria persistente, esistono alcune differenze nell'esperienza di monitoraggio:
- La memoria persistente non crea contatori delle prestazioni disco fisico, quindi non verrà visualizzata nei grafici in Windows Admin Center.
- La memoria persistente non crea dati Storport 505, quindi non si otterrà il rilevamento proattivo dell'outlier.
In caso contrario, l'esperienza di monitoraggio è uguale a quella di qualsiasi altro disco fisico.
È possibile eseguire query sull'integrità di un disco di memoria persistente eseguendo i cmdlet seguenti:
Get-PmemDisk
DiskNumber Size HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ---- ------------ ------------- ------------ ----------------- -------------------
2 252 GB Unhealthy None True {20, 120} 2
3 252 GB Healthy None True {1020, 1120} 0
Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
SerialNumber HealthStatus OperationalStatus OperationalDetails
------------ ------------ ------------------ ------------------
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warning Predictive Failure {Threshold Exceeded,NVDIMM_N Error}
Vale la pena notare che è possibile ottenere le stesse informazioni usando il Get-PhysicalDisk
cmdlet e specificando BusType come SCM:
Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
Nota
Per trovare la posizione fisica di un dispositivo di memoria persistente specificato in un evento, nella scheda Dettagli dell'evento in Visualizzatore eventi passare a EventData Location.To find the physical location of a persistent memory device specified in an event, on the Details tab of the event in Visualizzatore eventi, go to EventData>Location. Si noti che Windows Server 2016 elenca la posizione non corretta dei dispositivi di memoria persistente, ma questo problema è risolto in Windows Server versione 1709.
HealthStatus indica se il disco di memoria persistente è integro.
Il valore UnsafeshutdownCount tiene traccia del numero di arresti che possono causare la perdita di dati su questo disco logico. Si tratta della somma dei conteggi di arresto non sicuri di tutti i dispositivi di memoria persistente sottostanti di questo disco. Per altre informazioni sullo stato di integrità, usare il Get-PmemPhysicalDevice
cmdlet per trovare informazioni come OperationalStatus.
Get-PmemPhysicalDevice
DeviceId DeviceType HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ---------- ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_C1 102005310 126 GB 0 GB
1120 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_F1 102005310 126 GB 0 GB
120 Intel INVDIMM device Healthy {Ok} CPU1_DIMM_F1 102005310 126 GB 0 GB
20 Intel INVDIMM device Unhealthy {HardwareError} CPU1_DIMM_C1 102005310 126 GB 0 GB
Questo cmdlet mostra il dispositivo di memoria persistente non integro. Il dispositivo non integro (DeviceId 20) corrisponde al caso dell'esempio precedente. PhysicalLocation nel BIOS può aiutare a identificare il dispositivo di memoria persistente in stato di errore.
Per comprendere le diverse condizioni di integrità, vedere le sezioni seguenti.
Stato di integrità avviso
Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e si noterà che lo stato di integrità è elencato come Avviso, come illustrato in questo output di esempio:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | Ok | |
802c-01-1602-117cb64f | Avviso | Errore prevedibile | {Soglia superata, errore di NVDIMM_N} |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Intestazione | Descrizione |
---|---|
Condizione probabile | Soglia di avviso violata |
Causa radice | I dispositivi di memoria persistente tengono traccia di varie soglie, ad esempio temperatura, durata NVM e/o durata della fonte energetica. Quando uno di questi valori soglia viene superato, il sistema operativo viene notificato. |
Comportamento generale | Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore. |
Comportamento di Spazi di archiviazione | Il dispositivo rimane completamente operativo. Si tratta di un avviso, non di un errore. |
Ulteriori informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazione da eseguire | A seconda della soglia di avviso violata, può essere prudente sostituire il dispositivo di memoria persistente. |
Le scritture in un dispositivo di memoria persistente hanno esito negativo
Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità elencato come Non integro e lo stato operativo indica un errore di I/O, come illustrato nell'output di esempio seguente:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | Ok | |
802c-01-1602-117cb64f | Unhealthy | {Metadati obsoleti, errore I/O, errore temporaneo} | {Perdita della persistenza dei dati, perdita di dati, NV...} |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Intestazione | Descrizione |
---|---|
Condizione probabile | Perdita di persistenza/potenza di backup |
Causa radice | I dispositivi di memoria persistente si basano su una fonte di alimentazione di backup per la persistenza, in genere una batteria o un super-cap. Se questa fonte di alimentazione di backup non è disponibile o il dispositivo non può eseguire un backup per qualsiasi motivo (errore controller/flash), i dati sono a rischio e Windows impedisce ulteriori scritture sui dispositivi interessati. Le operazioni di lettura sono comunque possibile per spostare i dati. |
Comportamento generale | Verrà smontato il volume NTFS. Nel campo dello stato di integrità PhysicalDisk verrà visualizzato lo stato "Danneggiato" per tutti i dispositivi NVDIMM-N interessati. |
Comportamento di Spazi di archiviazione | Lo spazio di archiviazione rimarrà operativo fino a quando è interessato un solo modulo di memoria persistente. Se sono interessati più dispositivi, le scritture sullo spazio di archiviazione avranno esito negativo. Il campo Stato integrità disco fisico mostrerà "Non integro" per tutti i dispositivi di memoria persistente interessati. |
Ulteriori informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazione da eseguire | È consigliabile eseguire il backup dei dati di PMem interessati. Per ottenere l'accesso in lettura, è possibile portare online il disco manualmente (verrà visualizzato come un volume NTFS in sola lettura). Per cancellare completamente questa condizione, la causa radice deve essere risolta (ovvero, l'alimentatore del servizio o sostituire il modulo di memoria persistente, a seconda del problema) e il volume nel modulo deve essere portato offline e portato nuovamente online oppure il sistema deve essere riavviato. Per rendere nuovamente utilizzabile il modulo di memoria persistente in Spazi di archiviazione, usare il Reset-PhysicalDisk cmdlet , che reintegra il dispositivo e avvia il processo di ripristino. |
Il dispositivo viene visualizzato con una capacità di '0' byte o come "Disco fisico generico"
Questa condizione è presente quando un dispositivo di memoria persistente viene visualizzato con una capacità di 0 byte e non può essere inizializzato oppure viene esposto come oggetto "Disco fisico generico" senza numero di serie che visualizza uno stato operativo di comunicazione persa, come illustrato in questo output di esempio:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | OK | |
Avviso | Comunicazione perduta |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Intestazione | Descrizione |
---|---|
Condizione probabile | BIOS non ha esposto il modulo di memoria persistente al sistema operativo |
Causa radice | I dispositivi di memoria persistente sono basati su DRAM. Quando viene fatto riferimento a un indirizzo DRAM danneggiato, la maggior parte delle CPU avvia un controllo del computer e riavvia il server. Alcune piattaforme server annullano quindi il mapping del modulo di memoria persistente, impedendo al sistema operativo di accedervi e causando potenzialmente un altro controllo del computer. Ciò può verificarsi anche se il BIOS rileva che il modulo di memoria persistente non è riuscito e deve essere sostituito. |
Comportamento generale | Il modulo di memoria persistente viene visualizzato come non inizializzato, con una capacità di 0 byte e non può essere letto o scritto. |
Comportamento di Spazi di archiviazione | Lo spazio di archiviazione rimane operativo (purché sia interessato un solo modulo di memoria persistente). L'oggetto PMem PhysicalDisk viene visualizzato con uno stato di integrità di avviso e come "Disco fisico generale" |
Ulteriori informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazione da eseguire | Il dispositivo di memoria persistente deve essere sostituito o sanificato, in modo che la piattaforma server la esponga nuovamente al sistema operativo host. È consigliabile sostituire il dispositivo, perché potrebbero verificarsi più errori non verificabili. L'aggiunta di un dispositivo sostitutivo a una configurazione di spazi di archiviazione può essere eseguita con il Add-PhysicalDisk cmdlet . |
Il dispositivo viene visualizzato come disco RAW o vuoto dopo un riavvio
Questa condizione è presente quando si controlla l'integrità di un dispositivo di memoria persistente e viene visualizzato lo stato di integrità non integro e lo stato operativo dei metadati non riconosciuti, come illustrato in questo output di esempio:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Healthy | Ok | {Sconosciuto} |
802c-01-1602-117cb64f | Unhealthy | {Metadati non riconosciuti, metadati obsoleti} | {Sconosciuto} |
Nella tabella seguente sono elencate alcune informazioni su questa condizione.
Intestazione | Descrizione |
---|---|
Condizione probabile | Errore di backup/ripristino |
Causa principale | Un errore nella procedura di backup o ripristino causerà probabilmente la perdita di tutti i dati nel modulo di memoria persistente. Quando il sistema operativo viene caricato, verrà visualizzato come un nuovo dispositivo di memoria persistente senza una partizione o un file system e superficie come RAW, ovvero non ha un file system. |
Comportamento generale | La memoria persistente sarà in modalità di sola lettura. Sarà necessaria un'azione esplicita dell'utente per iniziare a usarlo nuovamente. |
Comportamento di Spazi di archiviazione | Spazi di archiviazione rimane operativo se è interessato un solo modulo di memoria persistente). L'oggetto disco fisico PMem verrà visualizzato con lo stato di integrità "Non integro" e non viene usato da Spazi di archiviazione. |
Ulteriori informazioni | Campo OperationalStatus dell'oggetto PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Operazione da eseguire | Se l'utente non vuole sostituire il dispositivo interessato, può usare il Reset-PhysicalDisk cmdlet per cancellare la condizione di sola lettura nel modulo di memoria persistente interessato. Negli ambienti Spazi di archiviazione verrà anche tentato di reintegrare il modulo di memoria persistente in Spazi di archiviazione e avviare il processo di ripristino. |
Passaggi successivi
Per ulteriori informazioni, vedere anche: