Procedury konserwacji klastra trybu failover
Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Ważne
Usługa Azure Stack HCI jest teraz częścią usługi Azure Local. Trwa zmiana nazwy dokumentacji produktu. Jednak starsze wersje rozwiązania Azure Stack HCI, na przykład 22H2 będą nadal odwoływać się do rozwiązania Azure Stack HCI i nie będą odzwierciedlać zmiany nazwy. Dowiedz się więcej.
W tym artykule założono, że konieczne jest wyłączenie serwera fizycznego w celu przeprowadzenia konserwacji lub ponowne uruchomienie go z jakiegoś powodu. Aby zainstalować aktualizacje w klastrze usługi Azure Stack HCI bez przełączeń serwerów w tryb offline, zobacz Aktualizowanie klastrów rozwiązania Azure Stack HCI.
Przełącznie serwera w tryb offline na potrzeby konserwacji wymaga przełączenia części magazynu w tryb offline, które są współużytkowane przez wszystkie serwery w klastrze trybu failover. Wymaga to wstrzymania serwera, który ma zostać przełączony w tryb offline, umieszczenie dysków serwera w trybie konserwacji, przeniesienie ról klastrowanych i maszyn wirtualnych do innych serwerów w klastrze oraz sprawdzenie, czy wszystkie dane są dostępne na innych serwerach w klastrze. Ten proces gwarantuje, że dane pozostają bezpieczne i dostępne przez cały okres konserwacji.
Możesz użyć centrum administracyjnego systemu Windows lub programu PowerShell, aby przejąć serwer w tryb offline na potrzeby konserwacji. W tym temacie omówiono obie metody.
Przełącz serwer w tryb offline przy użyciu centrum administracyjnego systemu Windows
Najprostszym sposobem przygotowania do przełączenie serwera w tryb offline jest użycie centrum administracyjnego systemu Windows.
Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline
Za pomocą programu Windows Admin Center nawiąż połączenie z serwerem, który chcesz przełączyć w tryb offline. Wybierz pozycję Dyski magazynu z menu Narzędzia i sprawdź, czy w kolumnie Stan dla każdego dysku wirtualnego jest wyświetlana wartość Online.>
Następnie wybierz pozycję Woluminy magazynu > i sprawdź, czy kolumna Kondycja dla każdego woluminu ma wartość W dobrej kondycji i czy kolumna Stan dla każdego woluminu jest wyświetlana ok.
Wstrzymywanie i opróżnianie serwera
Przed zamknięciem lub ponownym uruchomieniem serwera należy wstrzymać serwer i opróżnić (przenieść) wszystkie role klastrowane, takie jak maszyny wirtualne uruchomione na nim. Zawsze wstrzymywanie i opróżnianie klastrowanych serwerów przed przełączenie ich do trybu offline w celu przeprowadzenia konserwacji.
Za pomocą programu Windows Admin Center połącz się z klastrem, a następnie wybierz pozycję Serwery obliczeniowe > z menu Narzędzia w Menedżerze klastra.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wstrzymać i opróżnić, a następnie wybierz pozycję Wstrzymaj. Powinien zostać wyświetlony następujący monit:
Wstrzymaj serwery na potrzeby konserwacji: Czy na pewno chcesz wstrzymać serwery? Spowoduje to przeniesienie obciążeń, takich jak maszyny wirtualne, do innych serwerów w klastrze.
Wybierz pozycję Tak , aby wstrzymać serwer i zainicjować proces opróżniania. Stan serwera będzie wyświetlany jako W konserwacji, opróżnieniu i rolach, takich jak funkcja Hyper-V i maszyny wirtualne, natychmiast rozpocznie migrację na żywo do innych serwerów w klastrze. Może to potrwać kilka minut. Do momentu wznowienia nie można dodać ról do serwera. Po zakończeniu procesu opróżniania stan serwera będzie wyświetlany jako W konserwacji, Opróżnianie ukończone. System operacyjny przeprowadza automatyczną kontrolę bezpieczeństwa, aby upewnić się, że jest bezpieczny do kontynuowania. Jeśli istnieją woluminy w złej kondycji, zatrzyma się i powiadomi Cię, że nie będzie można kontynuować.
Zamykanie serwera
Po zakończeniu opróżniania serwera można bezpiecznie zamknąć go w celu konserwacji lub ponownego uruchomienia.
Ostrzeżenie
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, przed zamknięciem serwera należy umieścić dyski w trybie konserwacji i wycofać dyski z trybu konserwacji przed wznowieniem serwera w klastrze.
Wznawianie działania serwera
Gdy serwer będzie gotowy do ponownego rozpoczęcia hostowania ról klastrowanych i maszyn wirtualnych, po prostu włącz serwer, zaczekaj na jego uruchomienie i wznów działanie serwera, wykonując następujące kroki.
W Menedżerze klastra wybierz pozycję Serwery obliczeniowe > z menu Narzędzia po lewej stronie.
Wybierz Zapasy. Kliknij nazwę serwera, który chcesz wznowić, a następnie kliknij przycisk Wznów.
Role klastrowane i maszyny wirtualne natychmiast rozpoczną migrację na żywo z powrotem do serwera. Może to potrwać kilka minut.
Poczekaj na ponowną synchronizację magazynu
Po wznowieniu działania serwera wszystkie nowe zapisy, które wystąpiły, gdy była niedostępna, należy ponownie zsynchronizować. Dzieje się to automatycznie przy użyciu inteligentnego śledzenia zmian. Nie jest to konieczne, aby wszystkie dane zostały przeskanowane ani zsynchronizowane; tylko zmiany. Ten proces jest ograniczany w celu ograniczenia wpływu na obciążenia produkcyjne. W zależności od czasu wstrzymania serwera i ilości zapisanych nowych danych może upłynąć wiele minut.
Ważne
Przed przełączenie innych serwerów w klastrze w tryb offline należy poczekać na ukończenie ponownej synchronizacji.
Aby sprawdzić, czy ponowna synchronizacja magazynu została ukończona:
- Połącz się z klastrem przy użyciu Centrum administracyjnego systemu Windows i wybierz pozycję Woluminy magazynu>.
- Wybierz Zapasy.
- Sprawdź kolumnę Stan dla każdego woluminu. Jeśli zostanie wyświetlona wartość OK, ponowna synchronizacja magazynu zostanie ukończona. Teraz można bezpiecznie przejąć inne serwery w klastrze w tryb offline.
Przełącz serwer w tryb offline przy użyciu programu PowerShell
Użyj poniższych procedur, aby prawidłowo wstrzymać, opróżnić i wznowić serwer w klastrze trybu failover przy użyciu programu PowerShell.
Sprawdź, czy można bezpiecznie przejąć serwer w tryb offline
Aby sprawdzić, czy wszystkie woluminy są w dobrej kondycji, uruchom następujące polecenie cmdlet jako administrator:
Get-VirtualDisk
Oto przykład tego, jak mogą wyglądać dane wyjściowe:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Sprawdź, czy właściwość HealthStatus dla każdego woluminu jest w dobrej kondycji, a wartość OperationalStatus pokazuje ok.
Aby to zrobić przy użyciu Menedżera klastra trybu failover, przejdź do pozycji Dyski magazynu>.
Wstrzymywanie i opróżnianie serwera
Uruchom następujące polecenie cmdlet jako administrator, aby wstrzymać i opróżnić serwer:
Suspend-ClusterNode -Drain
Aby to zrobić w Menedżerze klastra trybu failover, przejdź do węzłów, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz pozycję Wstrzymaj>role opróżniania.
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, wstrzymanie i opróżnienie serwera spowoduje również przełączenie dysków serwera w tryb konserwacji. Jeśli na serwerze działa rozwiązanie Azure Stack HCI w wersji 20H2, Windows Server 2019 lub Windows Server 2016, musisz to zrobić ręcznie (zobacz następny krok).
Umieszczanie dysków w trybie konserwacji
W usłudze Azure Stack HCI w wersji 20H2, Windows Server 2019 i Windows Server 2016 umieszczenie dysków serwera w trybie konserwacji daje Miejsca do magazynowania Direct możliwość bezpiecznego opróżniania i zatwierdzania danych w celu zapewnienia, że zamknięcie serwera nie ma wpływu na stan aplikacji. Gdy tylko dysk przejdzie do trybu konserwacji, nie będzie już zezwalać na zapisy. Aby zminimalizować czas ponownej synchronizacji magazynu, zalecamy umieszczenie dysków w tryb konserwacji bezpośrednio przed ponownym uruchomieniem i wyprowadzenie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.
Uwaga
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski są automatycznie umieszczane w trybie konserwacji po wstrzymaniu i opróżnieniu serwera. Te systemy operacyjne mają szczegółową funkcję naprawy, która sprawia, że ponowne synchronizowanie jest szybsze i mniej wpływające na zasoby systemowe i sieciowe, dzięki czemu można wykonać konserwację serwera i magazynu razem.
Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Zamykanie serwera
Po zakończeniu opróżniania serwera będzie on wyświetlany jako Wstrzymany w programie PowerShell i Menedżerze klastra trybu failover.
Teraz można bezpiecznie zamknąć serwer lub uruchomić go ponownie za pomocą Stop-Computer
poleceń cmdlet programu PowerShell lub Restart-Computer
przy użyciu Menedżera klastra trybu failover.
Uwaga
W przypadku uruchamiania Get-VirtualDisk
polecenia na serwerach, na których jest zamykanie lub uruchamianie/zatrzymywanie usługi klastra, stan operacyjny serwera może być zgłaszany jako niekompletny lub obniżony, a kolumna Stan kondycji może wyświetlić ostrzeżenie. Jest to normalne i nie powinno powodować niepokoju. Wszystkie woluminy pozostają w trybie online i są dostępne.
Wyjmij dyski z trybu konserwacji
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, należy wyłączyć tryb konserwacji magazynu na dyskach przed wznowieniem serwera w klastrze. Aby zminimalizować czas ponownej synchronizacji magazynu, zalecamy wyjęcie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.
Uwaga
Jeśli na serwerze jest uruchomiona usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski zostaną automatycznie wyjęte z trybu konserwacji po wznowieniu serwera.
Jeśli na serwerze jest uruchomiony system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator, aby wyłączyć tryb konserwacji magazynu:
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Jeśli na serwerze jest uruchomiony system Windows Server 2016, użyj następującej składni:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Wznawianie działania serwera
Wznów serwer w klastrze. Aby zwrócić role klastrowane i maszyny wirtualne, które były wcześniej uruchomione na serwerze, użyj opcjonalnej flagi -Failback :
Resume-ClusterNode –Failback Immediate
Aby to zrobić w Menedżerze klastra trybu failover, przejdź do węzłów, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz polecenie Wznów>role trybu fail back.
Po wznowieniu działania serwera będzie on wyświetlany jako W programie PowerShell i Menedżerze klastra trybu failover.
Poczekaj na ponowną synchronizację magazynu
Po wznowieniu działania serwera należy poczekać na ukończenie ponownej synchronizacji przed przełączenie innych serwerów w klastrze w tryb offline.
Uruchom następujące polecenie cmdlet jako administrator, aby monitorować postęp:
Get-StorageJob
Jeśli ponowna synchronizacja została już ukończona, nie uzyskasz żadnych danych wyjściowych.
Oto kilka przykładowych danych wyjściowych pokazujących zadania ponownej synchronizacji (naprawy) nadal uruchomione:
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
W kolumnie BytesTotal przedstawiono ilość miejsca potrzebnego do ponownej synchronizacji magazynu. W kolumnie PercentComplete jest wyświetlany postęp.
Ostrzeżenie
Nie można bezpiecznie przejąć innego serwera w tryb offline, dopóki te zadania naprawy nie zakończą się.
W tym czasie w obszarze HealthStatus woluminy będą nadal wyświetlane jako Ostrzeżenie, co jest normalne.
Jeśli na przykład używasz polecenia cmdlet podczas ponownej Get-VirtualDisk
synchronizacji magazynu, mogą zostać wyświetlone następujące dane wyjściowe:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
Po zakończeniu zadań sprawdź, czy woluminy są ponownie wyświetlane w dobrej kondycji przy użyciu Get-VirtualDisk
polecenia cmdlet . Oto kilka przykładowych danych wyjściowych:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
Teraz można bezpiecznie wstrzymać i ponownie uruchomić inne serwery w klastrze.
Następne kroki
Aby uzyskać powiązane informacje, zobacz również: