Trwałe zarządzanie kondycją pamięci
Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows 10
Ważne
Usługa Azure Stack HCI jest teraz częścią usługi Azure Local. Trwa zmiana nazwy dokumentacji produktu. Jednak starsze wersje rozwiązania Azure Stack HCI, na przykład 22H2 będą nadal odwoływać się do rozwiązania Azure Stack HCI i nie będą odzwierciedlać zmiany nazwy. Dowiedz się więcej.
Ten artykuł zawiera informacje na temat obsługi błędów i zarządzania kondycją specyficznych dla urządzeń pamięci trwałej (PMem), często nazywanych pamięcią klasy magazynu (SCM), który jest typem nośnika nietrwałego, który może być używany jako magazyn najwyższego poziomu.
Te krótkie filmy wideo zawierają omówienie obsługi pamięci trwałej systemu Windows:
- Używanie pamięci nietrwałej (NVDIMM-N) jako magazynu blokowego w systemie Windows Server 2016
- Używanie pamięci nietrwałej (NVDIMM-N) jako magazynu z możliwością adresowania bajtów w systemie Windows Server 2016
Zobacz też Opis i wdrażanie pamięci trwałej.
Urządzenia pamięci trwałej są obsługiwane z sterownikami natywnymi rozpoczynającymi się w systemach Windows Server 2016 i Windows 10 (wersja 1607). Urządzenia pamięci trwałej zachowują się podobnie do innych dysków (HDD i SSD), ale istnieją pewne różnice.
Typowy przypadek użycia polega na tym, że dwa trwałe moduły pamięci są używane jako dublowana pamięć podręczna zapisu zwrotnego w miejscu do magazynowania. Aby przeprowadzić taką konfigurację, zobacz temat Configuring Storage Spaces with a NVDIMM-N write-back cache (Konfigurowanie miejsc do magazynowania z pamięcią podręczną zapisu karty NVDIMM-N).
W systemie Windows Server 2016 graficzny interfejs użytkownika Miejsca do magazynowania wyświetla typ magistrali NVDIMM-N jako NIEZNANY. Nie ma żadnych funkcji utraty ani braku możliwości tworzenia puli, dysku VD magazynu. Typ magistrali można sprawdzić, uruchamiając następujące polecenie cmdlet:
Get-PhysicalDisk | fl
Parametr BusType w danych wyjściowych poprawnie wyświetli typ magistrali jako SCM.
Wyświetlanie stanu kondycji pamięci trwałej
W tej sekcji opisano sposób wyświetlania stanu kondycji modułów pamięci trwałej. W przypadku korzystania z pamięci trwałej istnieje kilka różnic w środowisku monitorowania:
- Pamięć trwała nie tworzy liczników wydajności dysku fizycznego, więc nie będzie widoczny na wykresach w Centrum administracyjnym systemu Windows.
- Pamięć trwała nie tworzy danych Storport 505, więc nie będziesz aktywnie wykrywać wartości odstającego.
W przeciwnym razie środowisko monitorowania jest takie samo jak w przypadku każdego innego dysku fizycznego.
Możesz wykonać zapytanie dotyczące kondycji dysku pamięci trwałej, uruchamiając następujące polecenia cmdlet:
Get-PmemDisk
DiskNumber Size HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ---- ------------ ------------- ------------ ----------------- -------------------
2 252 GB Unhealthy None True {20, 120} 2
3 252 GB Healthy None True {1020, 1120} 0
Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
SerialNumber HealthStatus OperationalStatus OperationalDetails
------------ ------------ ------------------ ------------------
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warning Predictive Failure {Threshold Exceeded,NVDIMM_N Error}
Warto zauważyć, że możesz uzyskać te same informacje przy użyciu Get-PhysicalDisk
polecenia cmdlet i określić typ bustype jako SCM:
Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails
Uwaga
Aby znaleźć lokalizację fizyczną urządzenia pamięci trwałej określonego w zdarzeniu, na karcie Szczegóły zdarzenia w Podgląd zdarzeń przejdź do lokalizacji EventData.> Należy pamiętać, że system Windows Server 2016 zawiera niepoprawną lokalizację urządzeń pamięci trwałej, ale jest to naprawione w systemie Windows Server w wersji 1709.
HealthStatus pokazuje, czy dysk pamięci trwałej jest w dobrej kondycji.
Wartość UnsafeshutdownCount śledzi liczbę zamykania, które mogą spowodować utratę danych na tym dysku logicznym. Jest to suma niebezpiecznych liczników zamknięcia wszystkich podstawowych urządzeń pamięci trwałej tego dysku. Aby uzyskać więcej informacji na temat stanu kondycji, użyj Get-PmemPhysicalDevice
polecenia cmdlet , aby znaleźć informacje, takie jak OperationalStatus.
Get-PmemPhysicalDevice
DeviceId DeviceType HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ---------- ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_C1 102005310 126 GB 0 GB
1120 Intel INVDIMM device Healthy {Ok} CPU2_DIMM_F1 102005310 126 GB 0 GB
120 Intel INVDIMM device Healthy {Ok} CPU1_DIMM_F1 102005310 126 GB 0 GB
20 Intel INVDIMM device Unhealthy {HardwareError} CPU1_DIMM_C1 102005310 126 GB 0 GB
To polecenie cmdlet pokazuje, które urządzenie pamięci trwałej jest w złej kondycji. Urządzenie w złej kondycji (DeviceId 20) jest zgodne z przypadkiem w poprzednim przykładzie. Funkcja PhysicalLocation w systemie BIOS może pomóc określić, które trwałe urządzenie pamięci jest w stanie awarii.
Aby ułatwić zrozumienie różnych warunków kondycji, zobacz następujące sekcje.
Stan kondycji ostrzeżenia
Ten warunek występuje, gdy sprawdzasz kondycję urządzenia pamięci trwałej i widzisz, że jego stan kondycji jest wyświetlany jako Ostrzeżenie, jak pokazano w poniższych przykładowych danych wyjściowych:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Dobra kondycja | OK | |
802c-01-1602-117cb64f | Ostrzeżenie | Przewidywanie awarii | {Przekroczono próg,NVDIMM_N błąd} |
W poniższej tabeli wymieniono niektóre informacje o tym warunku.
Nagłówek | opis |
---|---|
Prawdopodobny warunek | Przekroczono próg ostrzegawczy |
Główna przyczyna | Urządzenia pamięci trwałej śledzą różne progi, takie jak temperatura, okres istnienia urządzenia NVM i/lub okres istnienia źródła energii. Jeśli jeden z tych progów zostanie przekroczony, system operacyjny zostanie powiadomiony. |
Ogólne zachowanie | Zostaje zachowana pełna funkcjonalność urządzenia. Jest to ostrzeżenie, a nie błąd. |
Zachowanie miejsc do magazynowania | Zostaje zachowana pełna funkcjonalność urządzenia. Jest to ostrzeżenie, a nie błąd. |
Więcej informacji | Pole OperationalStatus obiektu PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Postępowanie | W zależności od progu ostrzeżenia naruszonego może być rozsądne zastąpienie urządzenia pamięci trwałej. |
Zapisywanie na urządzeniu pamięci trwałej kończy się niepowodzeniem
Ten warunek występuje, gdy sprawdzasz kondycję urządzenia pamięci trwałej i widzisz stan kondycji wyświetlany jako W złej kondycji, a stan operacyjny wskazuje błąd we/wy, jak pokazano w poniższych przykładowych danych wyjściowych:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Dobra kondycja | OK | |
802c-01-1602-117cb64f | Nieprawidłowy | {Nieodświeżone metadane, Błąd we/wy, Błąd przejściowy} | {Utrata stanu trwałego danych, Utracone dane, NV...} |
W poniższej tabeli wymieniono niektóre informacje o tym warunku.
Nagłówek | opis |
---|---|
Prawdopodobny warunek | Utrata trwałości/zasilania kopii zapasowej |
Główna przyczyna | Trwałe urządzenia pamięci polegają na źródle zasilania kopii zapasowej dla ich trwałości — zwykle baterii lub super-cap. Jeśli źródło zasilania awaryjnego jest niedostępne lub urządzenie niezależnie od przyczyny nie może wykonać kopii zapasowej (Błąd kontrolera/pamięci flash), dane są zagrożone i system Windows uniemożliwi dalszy zapis na objętych urządzeniach. Odczyty mogą nadal usuwać dane. |
Ogólne zachowanie | Wolumin NTFS zostanie odinstalowany. W polu Stan kondycji dysku fizycznego będzie wyświetlana wartość "W złej kondycji" dla wszystkich urządzeń, których dotyczy karta NVDIMM-N. |
Zachowanie miejsc do magazynowania | Miejsce do magazynowania pozostanie operacyjne tak długo, jak tylko jeden trwały moduł pamięci zostanie naruszony. Jeśli objętych zostanie wiele urządzeń, zapis w miejscu do magazynowania zakończy się niepowodzeniem. W polu Stan kondycji dysku fizycznego zostanie wyświetlona wartość "W złej kondycji" dla wszystkich urządzeń pamięci trwałej, których dotyczy problem. |
Więcej informacji | Pole OperationalStatus obiektu PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Postępowanie | Zalecamy tworzenie kopii zapasowych danych PMem, których dotyczy problem. Aby uzyskać dostęp do funkcji odczytu, można ręcznie przenieść dysk do trybu online (zostanie on uwidoczniony jako wolumin NTFS tylko do odczytu). Aby w pełni wyczyścić ten warunek, należy rozwiązać główną przyczynę (czyli zasilania usługi lub zastąpić trwały moduł pamięci, w zależności od problemu), a wolumin modułu musi zostać przełączony w tryb offline i ponownie przełączony w tryb online lub należy ponownie uruchomić system. Aby ponownie wykorzystać moduł pamięci trwałej w Miejsca do magazynowania, użyj Reset-PhysicalDisk polecenia cmdlet , które ponownie integruje urządzenie i uruchamia proces naprawy. |
Urządzenie jest wyświetlane z pojemnością "0" bajtów lub jako "Ogólny dysk fizyczny"
Ten warunek występuje, gdy urządzenie pamięci trwałej jest wyświetlane z pojemnością 0 bajtów i nie można zainicjować lub jest uwidocznione jako obiekt "Ogólny dysk fizyczny" bez numeru seryjnego, który wyświetla stan operacyjny utraconej komunikacji, jak pokazano w tym przykładzie danych wyjściowych:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Dobra kondycja | OK | |
Ostrzeżenie | Utrata łączności |
W poniższej tabeli wymieniono niektóre informacje o tym warunku.
Nagłówek | opis |
---|---|
Prawdopodobny warunek | System BIOS nie uwidocznił trwałego modułu pamięci w systemie operacyjnym |
Główna przyczyna | Urządzenia pamięci trwałej są oparte na pamięci DRAM. Jeśli zostanie utworzone odwołanie do uszkodzonego adresu DRAM, większość procesorów CPU zainicjuje sprawdzanie komputera i uruchomi ponownie serwer. Niektóre platformy serwerów następnie anulują mapowanie modułu pamięci trwałej, uniemożliwiając systemowi operacyjnemu dostęp do niego i potencjalnie powodując inną kontrolę maszyny. Może się to również zdarzyć, jeśli system BIOS wykryje, że moduł pamięci trwałej uległ awarii i musi zostać zastąpiony. |
Ogólne zachowanie | Moduł pamięci trwałej jest wyświetlany jako niezainicjowany z pojemnością 0 bajtów i nie można go odczytać ani zapisać. |
Zachowanie miejsc do magazynowania | Miejsce do magazynowania pozostaje operacyjne (jeśli dotyczy to tylko jednego modułu pamięci trwałej). Obiekt PMem PhysicalDisk jest wyświetlany ze stanem kondycji Ostrzeżenie i jako "Ogólny dysk fizyczny" |
Więcej informacji | Pole OperationalStatus obiektu PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Postępowanie | Urządzenie pamięci trwałej musi zostać zastąpione lub oczyszczone, tak aby platforma serwera ponownie uwidaczniała go systemowi operacyjnemu hosta. Zalecane jest zastąpienie urządzenia, ponieważ mogą wystąpić więcej niekorzystnych błędów. Dodanie urządzenia zastępczego do konfiguracji miejsc do magazynowania można osiągnąć za Add-PhysicalDisk pomocą polecenia cmdlet . |
Urządzenie jest wyświetlane jako dysk RAW lub pusty po ponownym uruchomieniu
Ten warunek występuje podczas sprawdzania kondycji urządzenia pamięci trwałej i wyświetlania stanu kondycji w złej kondycji i stanu operacyjnego nierozpoznanych metadanych, jak pokazano w poniższych przykładowych danych wyjściowych:
SerialNumber | HealthStatus | OperationalStatus | OperationalDetails |
---|---|---|---|
802c-01-1602-117cb5fc | Dobra kondycja | OK | {Nieznany} |
802c-01-1602-117cb64f | Nieprawidłowy | {Nierozpoznane metadane, nieodświeżone metadane} | {Nieznany} |
W poniższej tabeli wymieniono niektóre informacje o tym warunku.
Nagłówek | opis |
---|---|
Prawdopodobny warunek | Wykonywanie kopii zapasowej/przywracanie nie powiodło się |
Główna przyczyna | Niepowodzenie procedury tworzenia kopii zapasowej lub przywracania prawdopodobnie spowoduje utratę wszystkich danych w module pamięci trwałej. Podczas ładowania systemu operacyjnego będzie on wyświetlany jako zupełnie nowe urządzenie pamięci trwałej bez partycji lub systemu plików i powierzchni jako RAW, co oznacza, że nie ma systemu plików. |
Ogólne zachowanie | Pamięć trwała będzie w trybie tylko do odczytu. Aby zacząć go ponownie używać, potrzebna jest jawna akcja użytkownika. |
Zachowanie miejsc do magazynowania | Miejsca do magazynowania pozostaje operacyjna, jeśli dotyczy to tylko jednego modułu pamięci trwałej). Obiekt dysku fizycznego PMem zostanie wyświetlony ze stanem kondycji "W złej kondycji" i nie jest używany przez Miejsca do magazynowania. |
Więcej informacji | Pole OperationalStatus obiektu PhysicalDisk. EventLog – Microsoft-Windows-ScmDisk0101/Operational |
Postępowanie | Jeśli użytkownik nie chce zastąpić objętego urządzenia, może użyć Reset-PhysicalDisk polecenia cmdlet , aby wyczyścić warunek tylko do odczytu w module pamięci trwałej, którego dotyczy problem. W środowiskach Miejsca do magazynowania będzie to również próbowało ponownie zintegrować moduł pamięci trwałej w Miejsca do magazynowania i uruchomić proces naprawy. |
Następne kroki
Aby uzyskać powiązane informacje, zobacz również: