Procedury konserwacji klastra trybu failover

Artykuł
11/23/2024

Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Ważne

Usługa Azure Stack HCI jest teraz częścią usługi Azure Local. Trwa zmiana nazwy dokumentacji produktu. Jednak starsze wersje rozwiązania Azure Stack HCI, na przykład 22H2 będą nadal odwoływać się do rozwiązania Azure Stack HCI i nie będą odzwierciedlać zmiany nazwy. Dowiedz się więcej.

W tym artykule założono, że konieczne jest wyłączenie serwera fizycznego w celu przeprowadzenia konserwacji lub ponowne uruchomienie go z jakiegoś powodu. Aby zainstalować aktualizacje w klastrze usługi Azure Stack HCI bez przełączeń serwerów w tryb offline, zobacz Aktualizowanie klastrów rozwiązania Azure Stack HCI.

Przełącznie serwera w tryb offline na potrzeby konserwacji wymaga przełączenia części magazynu w tryb offline, które są współużytkowane przez wszystkie serwery w klastrze trybu failover. Wymaga to wstrzymania serwera, który ma zostać przełączony w tryb offline, umieszczenie dysków serwera w trybie konserwacji, przeniesienie ról klastrowanych i maszyn wirtualnych do innych serwerów w klastrze oraz sprawdzenie, czy wszystkie dane są dostępne na innych serwerach w klastrze. Ten proces gwarantuje, że dane pozostają bezpieczne i dostępne przez cały okres konserwacji.

Możesz użyć centrum administracyjnego systemu Windows lub programu PowerShell, aby przejąć serwer w tryb offline na potrzeby konserwacji. W tym temacie omówiono obie metody.

Przełącz serwer w tryb offline przy użyciu centrum administracyjnego systemu Windows

Najprostszym sposobem przygotowania do przełączenie serwera w tryb offline jest użycie centrum administracyjnego systemu Windows.

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Za pomocą programu Windows Admin Center nawiąż połączenie z serwerem, który chcesz przełączyć w tryb offline. Wybierz pozycję Dyski magazynu z menu Narzędzia i sprawdź, czy w kolumnie Stan dla każdego dysku wirtualnego jest wyświetlana wartość Online.>
Następnie wybierz pozycję Woluminy magazynu > i sprawdź, czy kolumna Kondycja dla każdego woluminu ma wartość W dobrej kondycji i czy kolumna Stan dla każdego woluminu jest wyświetlana ok.

Wstrzymywanie i opróżnianie serwera

Przed zamknięciem lub ponownym uruchomieniem serwera należy wstrzymać serwer i opróżnić (przenieść) wszystkie role klastrowane, takie jak maszyny wirtualne uruchomione na nim. Zawsze wstrzymywanie i opróżnianie klastrowanych serwerów przed przełączenie ich do trybu offline w celu przeprowadzenia konserwacji.

Za pomocą programu Windows Admin Center połącz się z klastrem, a następnie wybierz pozycję Serwery obliczeniowe > z menu Narzędzia w Menedżerze klastra.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wstrzymać i opróżnić, a następnie wybierz pozycję Wstrzymaj. Powinien zostać wyświetlony następujący monit:

Wstrzymaj serwery na potrzeby konserwacji: Czy na pewno chcesz wstrzymać serwery? Spowoduje to przeniesienie obciążeń, takich jak maszyny wirtualne, do innych serwerów w klastrze.
Wybierz pozycję Tak , aby wstrzymać serwer i zainicjować proces opróżniania. Stan serwera będzie wyświetlany jako W konserwacji, opróżnieniu i rolach, takich jak funkcja Hyper-V i maszyny wirtualne, natychmiast rozpocznie migrację na żywo do innych serwerów w klastrze. Może to potrwać kilka minut. Do momentu wznowienia nie można dodać ról do serwera. Po zakończeniu procesu opróżniania stan serwera będzie wyświetlany jako W konserwacji, Opróżnianie ukończone. System operacyjny przeprowadza automatyczną kontrolę bezpieczeństwa, aby upewnić się, że jest bezpieczny do kontynuowania. Jeśli istnieją woluminy w złej kondycji, zatrzyma się i powiadomi Cię, że nie będzie można kontynuować.

Zamykanie serwera

Po zakończeniu opróżniania serwera można bezpiecznie zamknąć go w celu konserwacji lub ponownego uruchomienia.

Ostrzeżenie

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, przed zamknięciem serwera należy umieścić dyski w trybie konserwacji i wycofać dyski z trybu konserwacji przed wznowieniem serwera w klastrze.

Wznawianie działania serwera

Gdy serwer będzie gotowy do ponownego rozpoczęcia hostowania ról klastrowanych i maszyn wirtualnych, po prostu włącz serwer, zaczekaj na jego uruchomienie i wznów działanie serwera, wykonując następujące kroki.

W Menedżerze klastra wybierz pozycję Serwery obliczeniowe > z menu Narzędzia po lewej stronie.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wznowić, a następnie kliknij przycisk Wznów.

Role klastrowane i maszyny wirtualne natychmiast rozpoczną migrację na żywo z powrotem do serwera. Może to potrwać kilka minut.

Poczekaj na ponowną synchronizację magazynu

Po wznowieniu działania serwera wszystkie nowe zapisy, które wystąpiły, gdy była niedostępna, należy ponownie zsynchronizować. Dzieje się to automatycznie przy użyciu inteligentnego śledzenia zmian. Nie jest to konieczne, aby wszystkie dane zostały przeskanowane ani zsynchronizowane; tylko zmiany. Ten proces jest ograniczany w celu ograniczenia wpływu na obciążenia produkcyjne. W zależności od czasu wstrzymania serwera i ilości zapisanych nowych danych może upłynąć wiele minut.

Ważne

Przed przełączenie innych serwerów w klastrze w tryb offline należy poczekać na ukończenie ponownej synchronizacji.

Aby sprawdzić, czy ponowna synchronizacja magazynu została ukończona:

Połącz się z klastrem przy użyciu Centrum administracyjnego systemu Windows i wybierz pozycję Woluminy magazynu>.
Wybierz Zapasy.
Sprawdź kolumnę Stan dla każdego woluminu. Jeśli zostanie wyświetlona wartość OK, ponowna synchronizacja magazynu zostanie ukończona. Teraz można bezpiecznie przejąć inne serwery w klastrze w tryb offline.

Przełącz serwer w tryb offline przy użyciu programu PowerShell

Użyj poniższych procedur, aby prawidłowo wstrzymać, opróżnić i wznowić serwer w klastrze trybu failover przy użyciu programu PowerShell.

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Aby sprawdzić, czy wszystkie woluminy są w dobrej kondycji, uruchom następujące polecenie cmdlet jako administrator:

Get-VirtualDisk

Oto przykład tego, jak mogą wyglądać dane wyjściowe:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Sprawdź, czy właściwość HealthStatus dla każdego woluminu jest w dobrej kondycji, a wartość OperationalStatus pokazuje ok.

Aby to zrobić przy użyciu Menedżera klastra trybu failover, przejdź do pozycji Dyski magazynu>.

Wstrzymywanie i opróżnianie serwera

Uruchom następujące polecenie cmdlet jako administrator, aby wstrzymać i opróżnić serwer:

Suspend-ClusterNode -Drain

Aby to zrobić w Menedżerze klastra trybu failover, przejdź do węzłów, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz pozycję Wstrzymaj>role opróżniania.

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, wstrzymanie i opróżnienie serwera spowoduje również przełączenie dysków serwera w tryb konserwacji. Jeśli na serwerze działa rozwiązanie Azure Stack HCI w wersji 20H2, Windows Server 2019 lub Windows Server 2016, musisz to zrobić ręcznie (zobacz następny krok).

Umieszczanie dysków w trybie konserwacji

W usłudze Azure Stack HCI w wersji 20H2, Windows Server 2019 i Windows Server 2016 umieszczenie dysków serwera w trybie konserwacji daje Miejsca do magazynowania Direct możliwość bezpiecznego opróżniania i zatwierdzania danych w celu zapewnienia, że zamknięcie serwera nie ma wpływu na stan aplikacji. Gdy tylko dysk przejdzie do trybu konserwacji, nie będzie już zezwalać na zapisy. Aby zminimalizować czas ponownej synchronizacji magazynu, zalecamy umieszczenie dysków w tryb konserwacji bezpośrednio przed ponownym uruchomieniem i wyprowadzenie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.

Uwaga

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski są automatycznie umieszczane w trybie konserwacji po wstrzymaniu i opróżnieniu serwera. Te systemy operacyjne mają szczegółową funkcję naprawy, która sprawia, że ponowne synchronizowanie jest szybsze i mniej wpływające na zasoby systemowe i sieciowe, dzięki czemu można wykonać konserwację serwera i magazynu razem.

Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Zamykanie serwera

Po zakończeniu opróżniania serwera będzie on wyświetlany jako Wstrzymany w programie PowerShell i Menedżerze klastra trybu failover.

Teraz można bezpiecznie zamknąć serwer lub uruchomić go ponownie za pomocą Stop-Computer poleceń cmdlet programu PowerShell lub Restart-Computer przy użyciu Menedżera klastra trybu failover.

Uwaga

W przypadku uruchamiania Get-VirtualDisk polecenia na serwerach, na których jest zamykanie lub uruchamianie/zatrzymywanie usługi klastra, stan operacyjny serwera może być zgłaszany jako niekompletny lub obniżony, a kolumna Stan kondycji może wyświetlić ostrzeżenie. Jest to normalne i nie powinno powodować niepokoju. Wszystkie woluminy pozostają w trybie online i są dostępne.

Wyjmij dyski z trybu konserwacji

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, należy wyłączyć tryb konserwacji magazynu na dyskach przed wznowieniem serwera w klastrze. Aby zminimalizować czas ponownej synchronizacji magazynu, zalecamy wyjęcie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.

Uwaga

Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski zostaną automatycznie wyjęte z trybu konserwacji po wznowieniu serwera.

Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator, aby wyłączyć tryb konserwacji magazynu:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Wznawianie działania serwera

Wznów serwer w klastrze. Aby zwrócić role klastrowane i maszyny wirtualne, które były wcześniej uruchomione na serwerze, użyj opcjonalnej flagi -Failback :

Resume-ClusterNode –Failback Immediate

Aby to zrobić w Menedżerze klastra trybu failover, przejdź do węzłów, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz polecenie Wznów>role trybu fail back.

Po wznowieniu działania serwera będzie on wyświetlany jako W programie PowerShell i Menedżerze klastra trybu failover.

Poczekaj na ponowną synchronizację magazynu

Po wznowieniu działania serwera należy poczekać na ukończenie ponownej synchronizacji przed przełączenie innych serwerów w klastrze w tryb offline.

Uruchom następujące polecenie cmdlet jako administrator, aby monitorować postęp:

Get-StorageJob

Jeśli ponowna synchronizacja została już ukończona, nie uzyskasz żadnych danych wyjściowych.

Oto kilka przykładowych danych wyjściowych pokazujących zadania ponownej synchronizacji (naprawy) nadal uruchomione:

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

W kolumnie BytesTotal przedstawiono ilość miejsca potrzebnego do ponownej synchronizacji magazynu. W kolumnie PercentComplete jest wyświetlany postęp.

Ostrzeżenie

Nie można bezpiecznie przejąć innego serwera w tryb offline, dopóki te zadania naprawy nie zakończą się.

W tym czasie w obszarze HealthStatus woluminy będą nadal wyświetlane jako Ostrzeżenie, co jest normalne.

Jeśli na przykład używasz polecenia cmdlet podczas ponownej Get-VirtualDisk synchronizacji magazynu, mogą zostać wyświetlone następujące dane wyjściowe:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Po zakończeniu zadań sprawdź, czy woluminy są ponownie wyświetlane w dobrej kondycji przy użyciu Get-VirtualDisk polecenia cmdlet . Oto kilka przykładowych danych wyjściowych:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Teraz można bezpiecznie wstrzymać i ponownie uruchomić inne serwery w klastrze.

Następne kroki

Aby uzyskać powiązane informacje, zobacz również:

Udostępnij za pośrednictwem

Procedury konserwacji klastra trybu failover

Przełącz serwer w tryb offline przy użyciu centrum administracyjnego systemu Windows

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Wstrzymywanie i opróżnianie serwera

Zamykanie serwera

Wznawianie działania serwera

Poczekaj na ponowną synchronizację magazynu

Przełącz serwer w tryb offline przy użyciu programu PowerShell

Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline

Wstrzymywanie i opróżnianie serwera

Umieszczanie dysków w trybie konserwacji

Zamykanie serwera

Wyjmij dyski z trybu konserwacji

Wznawianie działania serwera

Poczekaj na ponowną synchronizację magazynu

Następne kroki

Opinia

Dodatkowe zasoby