Udostępnij za pośrednictwem


Scenariusze trybu failover platformy Kubernetes na klastrowanych urządzeniach Azure Stack Edge

Klaster Kubernetes jest wdrażany jako popularna platforma typu open source do organizowania konteneryzowanych aplikacji. W tym artykule opisano sposób działania rozwiązania Kubernetes na urządzeniu Azure Stack Edge z 2 węzłami, w tym tryby awarii i odpowiednie odpowiedzi urządzenia.

Informacje o rozwiązaniu Kubernetes w usłudze Azure Stack Edge

Na urządzeniu Azure Stack Edge możesz utworzyć klaster Kubernetes, konfigurując obliczenia. Po skonfigurowaniu roli obliczeniowej klaster Kubernetes, w tym węzły główne i robocze, są wdrażane i konfigurowane dla Ciebie. Ten klaster jest następnie używany do wdrażania obciążeń za pośrednictwem usługi kubectl, usługi IoT Edge lub usługi Azure Arc.

Urządzenie Azure Stack Edge jest dostępne jako konfiguracja 1 węzła lub konfiguracja 2 węzła, która stanowi klaster infrastruktury. Klaster Kubernetes jest oddzielony od klastra infrastruktury i jest wdrażany na podstawie klastra infrastruktury. Klaster infrastruktury zapewnia trwały magazyn dla urządzenia Azure Stack Edge, podczas gdy klaster Kubernetes jest odpowiedzialny wyłącznie za aranżację aplikacji.

Klaster Kubernetes składa się z węzła głównego i węzłów procesu roboczego. Węzły Kubernetes w klastrze to maszyny wirtualne, które uruchamiają aplikacje i przepływy pracy w chmurze.

  • Węzeł główny kubernetes jest odpowiedzialny za utrzymanie żądanego stanu klastra. Węzeł główny kontroluje również węzeł roboczy.
  • Węzły procesu roboczego uruchamiają konteneryzowane aplikacje.

Klaster Kubernetes na urządzeniu z dwoma węzłami

Klaster Kubernetes na urządzeniu z 2 węzłami ma jeden węzeł główny i dwa węzły robocze. Urządzenie z 2 węzłami jest wysoce dostępne, a jeśli jeden z węzłów ulegnie awarii, zarówno urządzenie, jak i klaster Kubernetes będą działać. Aby uzyskać więcej informacji na temat architektury klastra Kubernetes, zobacz Podstawowe pojęcia dotyczące platformy Kubernetes.

Na 2-węzłowym urządzeniu Azure Stack Edge główna maszyna wirtualna kubernetes i maszyna wirtualna procesu roboczego Kubernetes są uruchomione w węźle A urządzenia. W węźle B jest uruchomiona pojedyncza maszyna wirtualna procesu roboczego Kubernetes.

Każda maszyna wirtualna procesu roboczego w klastrze Kubernetes jest przypiętą maszyną wirtualną funkcji Hyper-V. Przypięta maszyna wirtualna jest powiązana z określonym węzłem, na którym jest uruchomiona. Jeśli węzeł A na urządzeniu ulegnie awarii, główna maszyna wirtualna ulegnie awarii do węzła B. Jednak maszyna wirtualna procesu roboczego w węźle A, która jest przypiętą maszyną wirtualną, nie przełączy się w tryb failover do węzła B i odwrotnie. Zamiast tego zasobniki z maszyny wirtualnej procesu roboczego w węźle A są ponownie zrównoważone na węźle B.

Aby ponownie zrównoważone zasobniki miały wystarczającą pojemność do uruchomienia w węźle urządzenia B, system wymusza, że nie więcej niż 50% pojemności każdego węzła środowiska ASE jest używane podczas zwykłych 2-węzłowych operacji klastra usługi Azure Stack Edge. To użycie pojemności jest wykonywane w oparciu o najlepsze wysiłki i istnieją okoliczności (na przykład obciążenia wymagające niedostępnych zasobów procesora GPU, gdy są one ponownie zrównoważone do węzła ASE B), w których ponownie zrównoważone zasobniki mogą nie mieć wystarczających zasobów do uruchomienia.

Te scenariusze zostały szczegółowo omówione w następnej sekcji dotyczącej trybów awarii i zachowania.

Tryby awarii i zachowanie

Węzły urządzeń usługi Azure Stack Edge mogą zakończyć się niepowodzeniem w pewnych warunkach. W tej sekcji opisano różne tryby awarii i odpowiednie odpowiedzi urządzenia.

Błędy węzłów usługi Azure Stack Edge lub ponowne uruchomienie

Węzeł Błędy Odpowiedzi
Węzeł A ma błędy
(Węzeł B nie ma błędów)
Mogą wystąpić następujące możliwe błędy:
  • Oba jednostki PSU kończą się niepowodzeniem
  • Jeden lub oba porty 3, port 4 kończy się niepowodzeniem
  • Składnik podstawowy kończy się niepowodzeniem, obejmuje płytę główną, DIMM, dysk systemu operacyjnego
  • Cały węzeł kończy się niepowodzeniem
    Dla każdego z tych błędów są widoczne następujące odpowiedzi:
    • Główna maszyna wirtualna platformy Kubernetes w trybie failover z węzła A do węzła B
    • Tworzenie głównej maszyny wirtualnej na węźle B zajmuje kilka minut
    • Zasobniki z węzła A są ponownie zrównoważone w węźle B
    • Obciążenia procesora GPU działają, jeśli procesor GPU jest dostępny w węźle B
    Node A reboots (Ponowne uruchomienie węzła)
    (Węzeł B nie ma błędów)
    Ponowne uruchomienie węzła Po zakończeniu ponownego uruchamiania węzła A, a maszyna wirtualna procesu roboczego jest dostępna, główna maszyna wirtualna ponownie zrównoważy zasobniki z węzła B.
    Węzeł B ma błędy
    (Węzeł A nie ma błędów)
    Mogą wystąpić następujące możliwe błędy:
    • Oba jednostki PSU kończą się niepowodzeniem
    • Jeden lub oba porty 3, port 4 kończy się niepowodzeniem
    • Składnik podstawowy kończy się niepowodzeniem, obejmuje płytę główną, DIMM, dysk systemu operacyjnego
    • Cały węzeł kończy się niepowodzeniem
      Dla każdego z tych błędów są widoczne następujące odpowiedzi:
      • Główne zasobniki maszyn wirtualnych platformy Kubernetes ponownie równoważą z węzła B. Może to potrwać kilka minut.
      Ponowne uruchomienie węzła B
      (Węzeł A nie ma błędów)
      Ponowne uruchomienie węzła Po zakończeniu ponownego uruchamiania węzła B, a maszyna wirtualna procesu roboczego jest dostępna, główna maszyna wirtualna ponownie zrównoważy zasobniki z węzła B.

      Aktualizacje węzła usługi Azure Stack Edge

      Typ aktualizacji Odpowiedzi
      Aktualizacja węzła urządzenia Aktualizacje stopniowe są stosowane do węzłów urządzeń, a węzły zostaną uruchomione ponownie.
      Aktualizacja usługi Kubernetes Aktualizacja usługi Kubernetes obejmuje:
      • Przejście w tryb failover głównej maszyny wirtualnej kubernetes z węzła urządzenia A do węzła urządzenia B
      • Aktualizacja wzorca platformy Kubernetes.
      • Aktualizacje węzła roboczego platformy Kubernetes (niekoniecznie w tej kolejności).
      Cały proces aktualizacji może potrwać co najmniej 30 minut, a w tym oknie klaster Kubernetes jest dostępny dla wszystkich operacji zarządzania (takich jak wdrażanie nowego obciążenia). Chociaż zasobniki zostaną opróżnione z węzła urządzenia podczas aktualizacji, obciążenia mogą być w trybie offline przez kilka sekund podczas tego procesu.

      Następne kroki