Sdílet prostřednictvím


Správa stavu trvalé paměti

Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10

Důležité

Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.

Tento článek obsahuje informace o zpracování chyb a správě stavu specifických pro zařízení s trvalou pamětí (PMem), která se často označují jako paměť třídy úložiště (SCM), což je typ nestálého média, které lze použít jako úložiště nejvyšší úrovně.

Tato krátká videa poskytují přehled podpory systému Windows pro trvalou paměť:

Viz Také vysvětlení a nasazení trvalé paměti.

Trvalá paměťová zařízení jsou podporována nativními ovladači počínaje Windows Serverem 2016 a Windows 10 (verze 1607). I když se trvalá paměťová zařízení chovají podobně jako jiné disky (HDD a SSD), existují určité rozdíly.

Běžným případem použití je použití dvou trvalých paměťových modulů jako zrcadlené mezipaměti zpětného zápisu v prostoru úložiště. Zřízení této konfigurace je popsané v části Konfigurace prostorů úložiště s mezipamětí se zpětným zápisem NVDIMM-N.

Ve Windows Serveru 2016 se v grafickém uživatelském rozhraní Prostory úložiště zobrazuje typ sběrnice NVDIMM-N jako NEZNÁMÝ. Nemá žádnou ztrátu funkčnosti ani nemožnost při vytváření fondu, úložiště VD. Typ sběrnice můžete ověřit spuštěním následující rutiny:

Get-PhysicalDisk | fl

Parametr BusType ve výstupu správně zobrazí typ sběrnice jako SCM.

Zobrazení stavu trvalé paměti

Tato část popisuje, jak zobrazit stav trvalých paměťových modulů. Pokud používáte trvalou paměť, existuje několik rozdílů v prostředí monitorování:

  • Trvalá paměť nevytváří čítače výkonu fyzického disku, takže se nezobrazí v grafech v Centru pro správu Windows.
  • Trvalá paměť nevytvoří data Storport 505, takže nebudete dostávat proaktivní zjišťování odlehlé hodnoty.

Jinak je prostředí monitorování stejné jako u jakéhokoli jiného fyzického disku.

Stav trvalého paměťového disku můžete dotazovat spuštěním následujících rutin:

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Je vhodné poznamenat, že můžete získat stejné informace pomocí Get-PhysicalDisk rutiny a zadáním BusType jako SCM:

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Poznámka:

Pokud chcete najít fyzické umístění trvalého paměťového zařízení zadaného v události, přejděte na kartě Podrobnosti události v Prohlížeč událostí do umístění EventData>. Všimněte si, že Windows Server 2016 uvádí nesprávné umístění trvalých paměťových zařízení, ale je opraveno ve Windows Serveru verze 1709.

HealthStatus ukazuje, jestli je trvalý paměťový disk v pořádku.

Hodnota UnsafeshutdownCount sleduje počet vypnutí, které mohou způsobit ztrátu dat na tomto logickém disku. Jedná se o součet počtu nebezpečných vypnutí všech základních trvalých paměťových zařízení tohoto disku. Další informace o stavu najdete pomocí rutiny Get-PmemPhysicalDevice , jako je OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Tato rutina ukazuje, které trvalé paměťové zařízení není v pořádku. Zařízení, které není v pořádku (DeviceId 20), odpovídá případu v předchozím příkladu. PhysicalLocation v systému BIOS může pomoct určit, které trvalé paměťové zařízení je v chybném stavu.

Podmínky různých stavů jsou vysvětlené v následujících odstavcích.

Stav upozornění

Tato podmínka se zobrazí, když zkontrolujete stav trvalého paměťového zařízení a zjistíte, že je jeho stav uvedený jako Upozornění, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
802c-01-1602-117cb64f Upozorňující Prediktivní selhání {Byla překročena prahová hodnota,NVDIMM_N chyba}.

V následující tabulce jsou uvedeny některé informace o této podmínce.

Záhlaví Popis
Pravděpodobná podmínka Překročení prahové hodnoty upozornění
Původní příčina Trvalá paměťová zařízení sledují různé prahové hodnoty, jako je teplota, životnost NVM nebo životnost zdroje energie. Překročení některé z těchto prahových hodnot se oznámí systému.
Obecné chování Zařízení zůstává plně funkční. Jedná se o upozornění, ne o chybu.
Chování Prostorů úložiště Zařízení zůstává plně funkční. Jedná se o upozornění, ne o chybu.
Více informací Pole s provozním stavem objektu fyzického disku Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat V závislosti na překročení prahové hodnoty upozornění může být vhodné nahradit trvalé paměťové zařízení.

Selhání zápisů do trvalého paměťového zařízení

Tato podmínka se zobrazí, když zkontrolujete stav trvalého paměťového zařízení a zobrazí se stav v pořádku a provozní stav zmíní chybu vstupně-výstupní operace, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
802c-01-1602-117cb64f Není v pořádku {Zastaralá metadata, Vstupně-výstupní chyba, Přechodná chyba} {Ztráta trvalosti dat, Ztráta dat, NV...}

V následující tabulce jsou uvedeny některé informace o této podmínce.

Záhlaví Popis
Pravděpodobná podmínka Ztráta trvalosti / záložního výkonu
Původní příčina Trvalá paměťová zařízení spoléhají na záložní zdroj napájení pro jejich trvalost – obvykle baterie nebo super-cap. Pokud tento záložní zdroj napájení není dostupný nebo zařízení nemůže z nějakého důvodu provést zálohu (chyba řadiče/flash disku), jsou data ohrožená a systém Windows zabrání dalším zápisům na ovlivněná zařízení. Kvůli vyklizení dat je pořád možné čtení.
Obecné chování Svazek NTFS bude odpojen.
V poli Stav fyzického disku se u všech ovlivněných zařízení NVDIMM-N zobrazí stav není v pořádku.
Chování Prostorů úložiště Prostor úložiště zůstane funkční, dokud bude ovlivněn pouze jeden trvalý paměťový modul. Pokud je ovlivněných více zařízení, zápisy do Prostorů úložiště selžou.
V poli Stav fyzického disku se u všech ovlivněných trvalých paměťových zařízení zobrazí stav Není v pořádku.
Více informací Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Doporučujeme zálohovat data ovlivněných PMem. Přístup ke čtení získáte ručním uvedením disku do online režimu (zobrazí se jako svazek NTFS jen pro čtení).

Pokud chcete tuto podmínku úplně vymazat, musí být původní příčina vyřešena (tj. napájení služby nebo nahradit trvalý paměťový modul v závislosti na problému) a svazek na tomto modulu musí být buď převezen do offline režimu a znovu převést do režimu online, nebo se musí systém restartovat.

Pokud chcete, aby se trvalý paměťový modul znovu používal v Prostory úložiště, použijte rutinuReset-PhysicalDisk, která zařízení znovu integruje a spustí proces opravy.

Zařízení se zobrazuje s kapacitou 0 bajtů nebo jako obecný fyzický disk.

Tato podmínka je k dispozici, když se zobrazí trvalé paměťové zařízení s kapacitou 0 bajtů a nelze ji inicializovat nebo je vystaven jako objekt "Obecný fyzický disk" bez sériového čísla, který zobrazuje provozní stav ztracené komunikace, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK
Upozorňující Ztráta komunikace

V následující tabulce jsou uvedeny některé informace o této podmínce.

Záhlaví Popis
Pravděpodobná podmínka Systém BIOS nezpřístupnil trvalý paměťový modul operačnímu systému.
Původní příčina Trvalá paměťová zařízení jsou založená na DRAM. Při odkazování na poškozenou adresu paměti DRAM spustí většina procesorů kontrolu počítače a restartuje server. Některé serverové platformy pak nemapují trvalý modul paměti, brání operačnímu systému v přístupu k němu a potenciálně způsobí kontrolu jiného počítače. K tomu může dojít také v případě, že systém BIOS zjistí, že modul trvalé paměti selhal a je třeba ho nahradit.
Obecné chování Trvalý modul paměti se zobrazuje jako neinicializovaný s kapacitou 0 bajtů a nelze ho číst ani zapisovat.
Chování Prostorů úložiště Prostor úložiště zůstává funkční (za předpokladu, že je ovlivněn pouze jeden trvalý modul paměti).
Objekt fyzického disku PMem se zobrazuje se stavem upozornění a jako obecný fyzický disk
Více informací Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Trvalé paměťové zařízení musí být nahrazeno nebo sanitizováno, aby ji serverová platforma znovu zpřístupnila hostitelskému operačnímu systému. Doporučuje se nahradit zařízení, protože může dojít k více neopravitelným chybám. Přidáním náhradního zařízení do konfigurace prostorů úložiště je možné pomocí rutiny Add-PhysicalDisk dosáhnout.

Zařízení se po restartování zobrazí jako NEZPRACOVANý nebo prázdný disk.

Tato podmínka je k dispozici, když zkontrolujete stav trvalého paměťového zařízení a zobrazí se stav nespravovaného a provozního stavu nerozpoznaných metadat, jak je znázorněno v tomto příkladu výstupu:

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc V pořádku OK {Neznámé}
802c-01-1602-117cb64f Není v pořádku {Nerozpoznaná metadata, Zastaralá metadata} {Neznámé}

V následující tabulce jsou uvedeny některé informace o této podmínce.

Záhlaví Popis
Pravděpodobná podmínka Chyba při zálohování/obnovení
Původní příčina Selhání v postupu zálohování nebo obnovení pravděpodobně způsobí ztrátu všech dat v modulu trvalé paměti. Když se operační systém načte, zobrazí se jako zcela nové trvalé paměťové zařízení bez oddílu nebo systému souborů a zobrazí se jako RAW, což znamená, že nemá systém souborů.
Obecné chování Trvalá paměť bude v režimu jen pro čtení. Jeho opětovné použití vyžaduje explicitní akci uživatele.
Chování Prostorů úložiště Prostory úložiště zůstane funkční, pokud je ovlivněn pouze jeden trvalý modul paměti).
Objekt fyzického disku PMem se zobrazí se stavem Není v pořádku a není používán Prostory úložiště.
Více informací Pole s provozním stavem objektu fyzického disku
Protokol událostí – Microsoft-Windows-ScmDisk0101/Operational
Co dělat Pokud uživatel nechce nahradit ovlivněné zařízení, může pomocí Reset-PhysicalDisk rutiny vymazat podmínku jen pro čtení v ovlivněném modulu trvalé paměti. V Prostory úložiště prostředí se také pokusíte znovu integrovat trvalý modul paměti do Prostory úložiště a spustit proces opravy.

Další kroky

Související informace najdete také: