Udostępnij za pośrednictwem


Weryfikowanie klastra rozwiązania Azure Stack HCI

Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019.

Ważne

Usługa Azure Stack HCI jest teraz częścią usługi Azure Local. Trwa zmiana nazwy dokumentacji produktu. Jednak starsze wersje rozwiązania Azure Stack HCI, na przykład 22H2 będą nadal odwoływać się do rozwiązania Azure Stack HCI i nie będą odzwierciedlać zmiany nazwy. Dowiedz się więcej.

Ostrzeżenie

Instrukcje wdrażania podane w tym artykule dotyczą starszej wersji usługi Azure Stack HCI w wersji 22H2. W przypadku nowych wdrożeń zalecamy użycie najnowszej ogólnie dostępnej wersji, Azure Stack HCI w wersji 23H2. Aby uzyskać instrukcje dotyczące wdrażania, zobacz About Azure Stack HCI, version 23H2 deployment (Informacje o wdrożeniu rozwiązania Azure Stack HCI w wersji 23H2).

Sprawdzanie, czy kontroler domeny nie jest już zalecanym narzędziem do konfigurowania lub testowania konfiguracji sieci hosta w usłudze Azure Stack HCI. Zalecamy użycie usługi Network ATC do skonfigurowania konfiguracji sieci hosta dla usługi Azure Stack HCI. Usługa Network ATC zawsze zastępuje narzędzie Validate DCB w usłudze Azure Stack HCI.

Mimo że kreator tworzenia klastra w centrum administracyjnym systemu Windows przeprowadza pewne walidacje w celu utworzenia klastra roboczego z wybranym sprzętem, walidacja klastra wykonuje dodatkowe kontrole, aby upewnić się, że klaster będzie działać w środowisku produkcyjnym. Ten artykuł z instrukcjami koncentruje się na tym, dlaczego walidacja klastra jest ważna i kiedy należy ją uruchomić w klastrze azure Stack HCI.

Zalecamy przeprowadzenie weryfikacji klastra w następujących podstawowych scenariuszach:

  • Po wdrożeniu klastra serwerów uruchom narzędzie Validate-DCB, aby przetestować sieć.
  • Po zaktualizowaniu klastra serwerów w zależności od scenariusza uruchom obie opcje weryfikacji, aby rozwiązać problemy z klastrem.
  • Po skonfigurowaniu replikacji za pomocą repliki magazynu sprawdź, czy replikacja jest kontynuowana normalnie, sprawdzając niektóre określone zdarzenia i uruchamiając kilka poleceń.
  • Po utworzeniu klastra serwerów uruchom narzędzie Validate-DCB przed umieszczeniem go w środowisku produkcyjnym.

Co to jest walidacja klastra?

Walidacja klastra ma na celu przechwycenie problemów ze sprzętem lub konfiguracją przed przejściem klastra do środowiska produkcyjnego. Walidacja klastra pomaga upewnić się, że rozwiązanie Azure Stack HCI, które chcesz wdrożyć, jest naprawdę zależne. Możesz również użyć walidacji klastra w skonfigurowanych klastrach trybu failover jako narzędzia diagnostycznego.

Konkretne scenariusze weryfikacji

W tej sekcji opisano scenariusze, w których wymagana jest również walidacja lub jest przydatna.

  • Sprawdzanie poprawności przed skonfigurowaniem klastra:

    • Zestaw serwerów gotowych do utworzenia klastra trybu failover: jest to najprostszy scenariusz weryfikacji. Składniki sprzętowe (systemy, sieci i magazyn) są połączone, ale systemy nie działają jeszcze jako klaster. Uruchamianie testów w tej sytuacji nie ma wpływu na dostępność.

    • Maszyny wirtualne serwera: w przypadku serwerów zwirtualizowanych w klastrze uruchom walidację klastra, tak jak w przypadku dowolnego innego nowego klastra. Wymaganie uruchomienia tej funkcji jest takie samo, czy masz:

      • "Klaster hostów", w którym następuje przejście w tryb failover między dwoma komputerami fizycznymi.
      • "Klaster gościa", w którym następuje przejście w tryb failover między systemami operacyjnymi gościa na tym samym komputerze fizycznym.
  • Walidacja po skonfigurowaniu klastra i użyciu:

    • Przed dodaniem serwera do klastra: podczas dodawania serwera do klastra zdecydowanie zalecamy zweryfikowanie klastra. Określ zarówno istniejące elementy członkowskie klastra, jak i nowy serwer podczas uruchamiania weryfikacji klastra.

    • Podczas dodawania dysków: po dodaniu dodatkowych dysków do klastra, co różni się od zastępowania dysków w trybie failed lub tworzenia dysków wirtualnych lub woluminów, które opierają się na istniejących dyskach, uruchom walidację klastra, aby potwierdzić, że nowy magazyn będzie działał poprawnie.

    • Podczas wprowadzania zmian wpływających na oprogramowanie układowe lub sterowniki: w przypadku uaktualniania lub wprowadzania zmian w klastrze, które mają wpływ na oprogramowanie układowe lub sterowniki, należy uruchomić walidację klastra, aby potwierdzić, że nowa kombinacja sprzętu, oprogramowania układowego, sterowników i oprogramowania obsługuje funkcje klastra trybu failover.

    • Po przywróceniu systemu z kopii zapasowej: po przywróceniu systemu z kopii zapasowej uruchom walidację klastra, aby potwierdzić, że system działa prawidłowo w ramach klastra.

Weryfikowanie sieci

Narzędzie Microsoft Validate-DCB jest przeznaczone do weryfikowania konfiguracji mostkowania centrum danych (DCB) w klastrze. W tym celu narzędzie przyjmuje oczekiwaną konfigurację jako dane wejściowe, a następnie testuje każdy serwer w klastrze. W tej sekcji opisano sposób instalowania i uruchamiania narzędzia Validate-DCB, przeglądania wyników i rozwiązywania błędów sieciowych zidentyfikowanych przez narzędzie.

Uwaga

Firma Microsoft zaleca wdrażanie konfiguracji i zarządzanie nią za pomocą usługi Network ATC, co eliminuje większość problemów z konfiguracją sprawdzanych przez narzędzie Validate-DCB. Aby dowiedzieć się więcej o usłudze Network ATC, która zapewnia oparte na intencji podejście do wdrażania sieci hostów, zobacz Upraszczanie sieci hostów za pomocą usługi Network ATC.

W sieci zdalny bezpośredni dostęp do pamięci (RDMA) za pośrednictwem konwergentnej sieci Ethernet (RoCE) wymaga technologii DCB, aby sieć szkieletowa bezstratna. W przypadku interfejsu iWARP dcB jest opcjonalne. Jednak konfigurowanie usługi DCB może być złożone, z dokładną konfiguracją wymaganą w ramach:

  • Każdy serwer w klastrze
  • Każdy port sieciowy przechodzący przez ruch RDMA w sieci szkieletowej

Wymagania wstępne

  • Informacje o konfiguracji sieci klastra serwerów, które chcesz zweryfikować, w tym:
    • Nazwa klastra hosta lub serwera
    • Nazwa przełącznika wirtualnego
    • Nazwy kart sieciowych
    • Ustawienia kontroli przepływu priorytetu (PFC) i rozszerzonego wyboru transmisji (ETS)
  • Połączenie internetowe umożliwiające pobranie modułu narzędzia w programie Windows PowerShell od firmy Microsoft.

Instalowanie i uruchamianie narzędzia Validate-DCB

Aby zainstalować i uruchomić narzędzie Validate-DCB:

  1. Na komputerze z zarządzaniem otwórz sesję programu Windows PowerShell jako administrator, a następnie użyj następującego polecenia, aby zainstalować narzędzie.

    Install-Module Validate-DCB
    
  2. Zaakceptuj żądania użycia dostawcy NuGet i uzyskaj dostęp do repozytorium, aby zainstalować narzędzie.

  3. Gdy program PowerShell połączy się z siecią firmy Microsoft, aby pobrać narzędzie, wpisz Validate-DCB i naciśnij Enter , aby uruchomić kreatora narzędzi.

    Uwaga

    Jeśli nie możesz uruchomić skryptu narzędzia Validate-DCB, może być konieczne dostosowanie zasad wykonywania programu PowerShell. Użyj polecenia cmdlet Get-ExecutionPolicy, aby wyświetlić bieżące ustawienia zasad wykonywania skryptu. Aby uzyskać informacje na temat ustawiania zasad wykonywania w programie PowerShell, zobacz About Execution Policies (Informacje o zasadach wykonywania).

  4. Na stronie Kreatora konfiguracji Validate-DCB — Zapraszamy wybierz pozycję Dalej.

  5. Na stronie Klastry i węzły wpisz nazwę klastra serwerów, który chcesz zweryfikować, wybierz pozycję Rozwiąż , aby wyświetlić listę na stronie, a następnie wybierz przycisk Dalej.

    Strona Klastry i węzły kreatora konfiguracji Validate-DCB

  6. Na stronie Adaptery:

    1. Zaznacz dołączone pole wyboru vSwitch i wpisz nazwę przełącznika wirtualnego.
    2. W obszarze Nazwa karty wpisz nazwę każdej fizycznej karty sieciowej w obszarze Nazwa wirtualnej karty sieciowej hosta, nazwę każdej wirtualnej karty sieciowej (vNIC) i w obszarze VLAN identyfikator sieci VLAN używany dla każdej karty.
    3. Rozwiń pole listy rozwijanej Typ RDMA i wybierz odpowiedni protokół: RoCE lub iWARP. Ustaw również ramki Jumbo na odpowiednią wartość dla sieci, a następnie wybierz przycisk Dalej.

    Strona Adaptery kreatora konfiguracji Validate-DCB

    Uwaga

  7. Na stronie Mostkowanie centrum danych zmodyfikuj wartości w celu dopasowania ich do ustawień priorytetu, nazwy zasad i rezerwacji przepustowości, a następnie wybierz pozycję Dalej.

    Strona Mostkowanie centrum danych kreatora konfiguracji Validate-DCB

    Uwaga

    Wybranie funkcji RDMA przez roCE na poprzedniej stronie kreatora wymaga kontrolera DCB w celu zwiększenia niezawodności sieci na wszystkich kartach sieciowych i portach przełączników.

  8. Na stronie Zapisywanie i wdrażanie w polu Ścieżka pliku konfiguracji zapisz plik konfiguracji przy użyciu rozszerzenia ps1 do lokalizacji, w której można użyć go ponownie później w razie potrzeby, a następnie wybierz pozycję Eksportuj , aby rozpocząć uruchamianie narzędzia Validate-DCB.

    • Opcjonalnie możesz wdrożyć plik konfiguracji, wypełniając sekcję Wdrażanie konfiguracji w węzłach na stronie, która obejmuje możliwość użycia konta usługi Azure Automation do wdrożenia konfiguracji, a następnie zweryfikowania jej. Zobacz Tworzenie konta usługi Azure Automation, aby rozpocząć pracę z usługą Azure Automation.

    Strona Zapisywanie i wdrażanie kreatora konfiguracji Validate-DCB

Przejrzyj wyniki i napraw błędy

Narzędzie Validate-DCB generuje wyniki w dwóch jednostkach:

  1. [Global Unit] wyniki zawierają listę wymagań wstępnych i wymagań dotyczących uruchamiania testów modalnych.
  2. [Modal Unit] wyniki dostarczają opinii na temat każdej konfiguracji hosta klastra i najlepszych rozwiązań.

W tym przykładzie przedstawiono pomyślne wyniki skanowania pojedynczego serwera dla wszystkich wymagań wstępnych i modalnych testów jednostkowych, wskazując liczbę niepomyślnie 0.

Validate-DCB Global unit and Modal unit results (Weryfikowanie wyników globalnych jednostek DCB i wyniki testu jednostkowego modalnego)

W poniższych krokach pokazano, jak zidentyfikować błąd pakietu Jumbo z wirtualnej karty sieciowej SMB02 i naprawić go:

  1. Wyniki skanowania narzędzi Validate-DCB pokazują błąd Liczba nieudanych z 1.

    Wyniki skanowania narzędzia Validate-DCB z wyświetlonym błędem Liczba nieudanych operacji 1

  2. Przewijanie z powrotem w wynikach pokazuje błąd na czerwono wskazujący, że pakiet Jumbo dla wirtualnej karty sieciowej SMB02 na hoście S046036 jest ustawiony na domyślny rozmiar 1514, ale powinien być ustawiony na 9014.

    Wynik skanowania narzędzia Validate-DCB przedstawiający błąd ustawienia rozmiaru pakietu jumbo

  3. Przejrzyj właściwości Zaawansowane VNIC SMB02 na hoście S046036 pokazuje, że pakiet Jumbo jest ustawiony na wartość domyślną Wyłączone.

    Ustawienie Zaawansowane właściwości funkcji Hyper-V hosta serwera Jumbo Packet

  4. Usunięcie błędu wymaga włączenia funkcji Pakietu Jumbo i zmiany rozmiaru na 9014 bajtów. Ponowne uruchomienie skanowania na hoście S046036 potwierdza tę zmianę, zwracając liczbę niepomyślnie 0.

    Sprawdzanie poprawności wyników skanowania DCB z potwierdzeniem, że ustawienie Pakiet Jumbo hosta serwera jest stałe

Aby dowiedzieć się więcej o usuwaniu błędów zidentyfikowanych przez narzędzie Validate-DCB, zobacz poniższy film wideo.

Narzędzie można również zainstalować w trybie offline. W przypadku odłączonych systemów użyj polecenia Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB , a następnie przenieś moduły w folderze c:\temp\Validate-DCB do odłączonego systemu. Aby uzyskać więcej informacji, zobacz poniższe wideo.

Weryfikowanie klastra

Wykonaj poniższe kroki, aby zweryfikować serwery w istniejącym klastrze w Centrum administracyjnym systemu Windows.

  1. W centrum administracyjnym systemu Windows w obszarze Wszystkie połączenia wybierz klaster Azure Stack HCI, który chcesz zweryfikować, a następnie wybierz pozycję Połącz.

    Na pulpicie nawigacyjnym Menedżera klastra są wyświetlane informacje o klastrze.

  2. Na pulpicie nawigacyjnym Menedżera klastra w obszarze Narzędzia wybierz pozycję Serwery.

  3. Na stronie Spis wybierz serwery w klastrze, a następnie rozwiń podmenu Więcej i wybierz pozycję Weryfikuj klaster.

  4. W oknie podręcznym Weryfikuj klaster wybierz pozycję Tak.

    Okno podręczne Weryfikowanie klastra

  5. W oknie podręcznym Dostawca usług zabezpieczeń poświadczeń (CredSSP) wybierz pozycję Tak.

  6. Podaj swoje poświadczenia, aby włączyć protokół CredSSP , a następnie wybierz pozycję Kontynuuj.
    Walidacja klastra jest uruchamiana w tle i wyświetla powiadomienie po zakończeniu, w którym momencie możesz wyświetlić raport weryfikacji, zgodnie z opisem w następnej sekcji.

Uwaga

Po zweryfikowaniu serwerów klastra należy wyłączyć protokół CredSSP ze względów bezpieczeństwa.

Wyłączanie protokołu CredSSP

Po pomyślnym zweryfikowaniu klastra serwerów należy wyłączyć protokół CredSSP (Credential Security Support Provider) na każdym serwerze na potrzeby zabezpieczeń. Aby uzyskać więcej informacji, zobacz CVE-2018-0886.

  1. W centrum administracyjnym systemu Windows w obszarze Wszystkie połączenia wybierz pierwszy serwer w klastrze, a następnie wybierz pozycję Połącz.

  2. Na stronie Przegląd wybierz pozycję Wyłącz credSSP, a następnie w oknie podręcznym Wyłącz credSSP wybierz pozycję Tak.

    Wynik kroku 2 usuwa czerwony baner CredSSP ENABLED w górnej części strony Przegląd serwera i wyłącza credSSP na innych serwerach.

Wyświetlanie raportów weryfikacji

Teraz możesz wyświetlić raport weryfikacji klastra.

Istnieje kilka sposobów uzyskiwania dostępu do raportów weryfikacji:

  • Na stronie Spis rozwiń podmenu Więcej , a następnie wybierz pozycję Wyświetl raporty weryfikacji.

  • W prawym górnym rogu centrum administracyjnego systemu Windows wybierz ikonę Dzwonek powiadomień, aby wyświetlić okienko Powiadomienia. Wybierz powiadomienie o pomyślnym zweryfikowaniu klastra, a następnie wybierz pozycję Przejdź do raportu weryfikacji klastra trybu failover.

Uwaga

Proces weryfikacji klastra serwerów może zająć trochę czasu. Nie przełączaj się do innego narzędzia w Centrum administracyjnym systemu Windows, gdy proces jest uruchomiony. W okienku Powiadomienia pasek stanu poniżej powiadomienia Weryfikuj klaster wskazuje, kiedy proces jest wykonywany.

Weryfikowanie klastra przy użyciu programu PowerShell

Za pomocą programu Windows PowerShell można również uruchamiać testy weryfikacyjne w klastrze serwerów i wyświetlać wyniki. Testy można uruchamiać zarówno przed, jak i po skonfigurowaniu klastra.

Aby uruchomić test weryfikacyjny w klastrze serwerów, wydaj polecenia cmdlet programu PowerShell get-cluster i< cluster-cluster i Get-Cluster server clustername> lub uruchom tylko polecenie cmdlet Test-Cluster bezpośrednio w klastrze:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Aby uzyskać więcej przykładów i informacji o użyciu, zobacz dokumentację referencyjną klastra testowego.

Test-NetStack to narzędzie do testowania opartego na programie PowerShell dostępne w witrynie GitHub, którego można użyć do przeprowadzania testów ruchu ICMP, TCP i RDMA sieci oraz identyfikowania potencjalnych błędów konfiguracji sieci szkieletowej i hosta lub niestabilności operacyjnej. Użyj platformy Test-NetStack, aby zweryfikować ścieżki danych sieciowych przez testowanie ścieżek danych sieciowych natywnych, syntetycznych i sprzętowych (RDMA) w przypadku problemów z łącznością, fragmentacją pakietów, niską przepływnością i przeciążeniem.

Weryfikowanie replikacji dla repliki magazynu

Jeśli używasz repliki magazynu do replikowania woluminów w klastrze rozproszonym lub klastrze, istnieje kilka zdarzeń i poleceń cmdlet, których można użyć do uzyskania stanu replikacji.

W poniższym scenariuszu skonfigurowaliśmy replikę magazynu przez utworzenie grup replikacji (RG) dla dwóch lokacji, a następnie określono woluminy danych i woluminy dziennika dla obu węzłów serwera źródłowego w lokacji Site1 (Server1, Server2) i docelowych (replikowanych) węzłów serwera w lokacji 2 (Server3, Server4).

Aby określić postęp replikacji serwera Server1 w lokacji1, uruchom polecenie Get-WinEvent i zbadaj zdarzenia 5015, 5002, 5004, 1237, 5001 i 2200:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

W przypadku serwera Server3 w lokacji 2 uruchom następujące Get-WinEvent polecenie, aby wyświetlić zdarzenia repliki magazynu pokazujące tworzenie partnerstwa. To zdarzenie podaje liczbę skopiowanych bajtów i czas trwania. Na przykład:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

W przypadku serwera Server3 w lokacji2 uruchom Get-WinEvent polecenie i sprawdź zdarzenia 5009, 1237, 5001, 5015, 5005 i 2200, aby zrozumieć postęp przetwarzania. W tej sekwencji nie powinny wystąpić żadne ostrzeżenia dotyczące błędów. Będzie wiele zdarzeń 1237 — oznacza to postęp.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Alternatywnie docelowa grupa serwerów repliki określa liczbę bajtów pozostałych do skopiowania przez cały czas i można wykonywać zapytania za pomocą programu PowerShell za Get-SRGrouppomocą polecenia . Na przykład:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

W przypadku węzła Server3 w lokacji2 uruchom następujące polecenie i sprawdź zdarzenia 5009, 1237, 5001, 5015, 5005 i 2200, aby zrozumieć postęp replikacji. Nie powinno być żadnych ostrzeżeń o błędach. Jednak będzie wiele zdarzeń "1237" - te po prostu wskazują postęp.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Jako skrypt postępu, który nie zostanie zakończony:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Aby uzyskać stan replikacji w klastrze rozproszony, użyj polecenia Get-SRGroup i Get-SRPartnership:

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

Po potwierdzeniu pomyślnej replikacji danych między lokacjami można utworzyć maszyny wirtualne i inne obciążenia.

Zobacz też