Scenariusze trybu failover platformy Kubernetes na klastrowanych urządzeniach Azure Stack Edge

Artykuł
10/26/2023

Klaster Kubernetes jest wdrażany jako popularna platforma typu open source do organizowania konteneryzowanych aplikacji. W tym artykule opisano sposób działania rozwiązania Kubernetes na urządzeniu Azure Stack Edge z 2 węzłami, w tym tryby awarii i odpowiednie odpowiedzi urządzenia.

Informacje o rozwiązaniu Kubernetes w usłudze Azure Stack Edge

Na urządzeniu Azure Stack Edge możesz utworzyć klaster Kubernetes, konfigurując obliczenia. Po skonfigurowaniu roli obliczeniowej klaster Kubernetes, w tym węzły główne i robocze, są wdrażane i konfigurowane dla Ciebie. Ten klaster jest następnie używany do wdrażania obciążeń za pośrednictwem usługi kubectl, usługi IoT Edge lub usługi Azure Arc.

Urządzenie Azure Stack Edge jest dostępne jako konfiguracja 1 węzła lub konfiguracja 2 węzła, która stanowi klaster infrastruktury. Klaster Kubernetes jest oddzielony od klastra infrastruktury i jest wdrażany na podstawie klastra infrastruktury. Klaster infrastruktury zapewnia trwały magazyn dla urządzenia Azure Stack Edge, podczas gdy klaster Kubernetes jest odpowiedzialny wyłącznie za aranżację aplikacji.

Klaster Kubernetes składa się z węzła głównego i węzłów procesu roboczego. Węzły Kubernetes w klastrze to maszyny wirtualne, które uruchamiają aplikacje i przepływy pracy w chmurze.

Węzeł główny kubernetes jest odpowiedzialny za utrzymanie żądanego stanu klastra. Węzeł główny kontroluje również węzeł roboczy.
Węzły procesu roboczego uruchamiają konteneryzowane aplikacje.

Klaster Kubernetes na urządzeniu z dwoma węzłami

Klaster Kubernetes na urządzeniu z 2 węzłami ma jeden węzeł główny i dwa węzły robocze. Urządzenie z 2 węzłami jest wysoce dostępne, a jeśli jeden z węzłów ulegnie awarii, zarówno urządzenie, jak i klaster Kubernetes będą działać. Aby uzyskać więcej informacji na temat architektury klastra Kubernetes, zobacz Podstawowe pojęcia dotyczące platformy Kubernetes.

Na 2-węzłowym urządzeniu Azure Stack Edge główna maszyna wirtualna kubernetes i maszyna wirtualna procesu roboczego Kubernetes są uruchomione w węźle A urządzenia. W węźle B jest uruchomiona pojedyncza maszyna wirtualna procesu roboczego Kubernetes.

Każda maszyna wirtualna procesu roboczego w klastrze Kubernetes jest przypiętą maszyną wirtualną funkcji Hyper-V. Przypięta maszyna wirtualna jest powiązana z określonym węzłem, na którym jest uruchomiona. Jeśli węzeł A na urządzeniu ulegnie awarii, główna maszyna wirtualna ulegnie awarii do węzła B. Jednak maszyna wirtualna procesu roboczego w węźle A, która jest przypiętą maszyną wirtualną, nie przełączy się w tryb failover do węzła B i odwrotnie. Zamiast tego zasobniki z maszyny wirtualnej procesu roboczego w węźle A są ponownie zrównoważone na węźle B.

Aby ponownie zrównoważone zasobniki miały wystarczającą pojemność do uruchomienia w węźle urządzenia B, system wymusza, że nie więcej niż 50% pojemności każdego węzła środowiska ASE jest używane podczas zwykłych 2-węzłowych operacji klastra usługi Azure Stack Edge. To użycie pojemności jest wykonywane w oparciu o najlepsze wysiłki i istnieją okoliczności (na przykład obciążenia wymagające niedostępnych zasobów procesora GPU, gdy są one ponownie zrównoważone do węzła ASE B), w których ponownie zrównoważone zasobniki mogą nie mieć wystarczających zasobów do uruchomienia.

Te scenariusze zostały szczegółowo omówione w następnej sekcji dotyczącej trybów awarii i zachowania.

Tryby awarii i zachowanie

Węzły urządzeń usługi Azure Stack Edge mogą zakończyć się niepowodzeniem w pewnych warunkach. W tej sekcji opisano różne tryby awarii i odpowiednie odpowiedzi urządzenia.

Błędy węzłów usługi Azure Stack Edge lub ponowne uruchomienie

Węzeł	Błędy	Odpowiedzi
Węzeł A ma błędy (Węzeł B nie ma błędów)	Mogą wystąpić następujące możliwe błędy: Oba jednostki PSU kończą się niepowodzeniem Jeden lub oba porty 3, port 4 kończy się niepowodzeniem Składnik podstawowy kończy się niepowodzeniem, obejmuje płytę główną, DIMM, dysk systemu operacyjnego Cały węzeł kończy się niepowodzeniem	Dla każdego z tych błędów są widoczne następujące odpowiedzi: Główna maszyna wirtualna platformy Kubernetes w trybie failover z węzła A do węzła B Tworzenie głównej maszyny wirtualnej na węźle B zajmuje kilka minut Zasobniki z węzła A są ponownie zrównoważone w węźle B Obciążenia procesora GPU działają, jeśli procesor GPU jest dostępny w węźle B
Node A reboots (Ponowne uruchomienie węzła) (Węzeł B nie ma błędów)	Ponowne uruchomienie węzła	Po zakończeniu ponownego uruchamiania węzła A, a maszyna wirtualna procesu roboczego jest dostępna, główna maszyna wirtualna ponownie zrównoważy zasobniki z węzła B.
Węzeł B ma błędy (Węzeł A nie ma błędów)	Mogą wystąpić następujące możliwe błędy: Oba jednostki PSU kończą się niepowodzeniem Jeden lub oba porty 3, port 4 kończy się niepowodzeniem Składnik podstawowy kończy się niepowodzeniem, obejmuje płytę główną, DIMM, dysk systemu operacyjnego Cały węzeł kończy się niepowodzeniem	Dla każdego z tych błędów są widoczne następujące odpowiedzi: Główne zasobniki maszyn wirtualnych platformy Kubernetes ponownie równoważą z węzła B. Może to potrwać kilka minut.
Ponowne uruchomienie węzła B (Węzeł A nie ma błędów)	Ponowne uruchomienie węzła	Po zakończeniu ponownego uruchamiania węzła B, a maszyna wirtualna procesu roboczego jest dostępna, główna maszyna wirtualna ponownie zrównoważy zasobniki z węzła B.

Aktualizacje węzła usługi Azure Stack Edge

Typ aktualizacji	Odpowiedzi
Aktualizacja węzła urządzenia	Aktualizacje stopniowe są stosowane do węzłów urządzeń, a węzły zostaną uruchomione ponownie.
Aktualizacja usługi Kubernetes	Aktualizacja usługi Kubernetes obejmuje: Przejście w tryb failover głównej maszyny wirtualnej kubernetes z węzła urządzenia A do węzła urządzenia B Aktualizacja wzorca platformy Kubernetes. Aktualizacje węzła roboczego platformy Kubernetes (niekoniecznie w tej kolejności). Cały proces aktualizacji może potrwać co najmniej 30 minut, a w tym oknie klaster Kubernetes jest dostępny dla wszystkich operacji zarządzania (takich jak wdrażanie nowego obciążenia). Chociaż zasobniki zostaną opróżnione z węzła urządzenia podczas aktualizacji, obciążenia mogą być w trybie offline przez kilka sekund podczas tego procesu.

Typ aktualizacji

Odpowiedzi

Aktualizacja węzła urządzenia

Aktualizacje stopniowe są stosowane do węzłów urządzeń, a węzły zostaną uruchomione ponownie.

Aktualizacja usługi Kubernetes

Aktualizacja usługi Kubernetes obejmuje:

Przejście w tryb failover głównej maszyny wirtualnej kubernetes z węzła urządzenia A do węzła urządzenia B
Aktualizacja wzorca platformy Kubernetes.
Aktualizacje węzła roboczego platformy Kubernetes (niekoniecznie w tej kolejności).

Cały proces aktualizacji może potrwać co najmniej 30 minut, a w tym oknie klaster Kubernetes jest dostępny dla wszystkich operacji zarządzania (takich jak wdrażanie nowego obciążenia). Chociaż zasobniki zostaną opróżnione z węzła urządzenia podczas aktualizacji, obciążenia mogą być w trybie offline przez kilka sekund podczas tego procesu.

Następne kroki

Dowiedz się więcej o magazynie Kubernetes na urządzeniu Azure Stack Edge.
Zapoznaj się z modelem sieci platformy Kubernetes na urządzeniu Azure Stack Edge.
Wdrażanie usługi Azure Stack Edge w witrynie Azure Portal.

Udostępnij za pośrednictwem