Udostępnij za pośrednictwem


Zarządzanie nowoczesnymi klastrami platformy aplikacji

Cloud Adoption Framework zawiera podstawową metodologię definiowania procesów zarządzania operacjami dla chmury w niezależnym sensie. Jej wskazówki pomagają w ustanowieniu linii bazowej zarządzania operacjami i innych wyspecjalizowanych warstwach operacji. Te wskazówki mogą nadal dotyczyć organizacji, które mają połączenie infrastruktury jako usługi (IaaS), platformy jako usługi (PaaS) i konteneryzowanych obciążeń. W tym artykule opisano, co należy zintegrować z istniejącymi operacjami, aby przygotować się do zarządzania kontenerami. Wyróżnia również zalety integracji Azure Kubernetes Service (AKS) ze strategią zarządzania kontenerami.

Dopasowanie biznesowe do potrzeb związanych z zarządzaniem operacjami

Kontenery usuwają zależności na kilku warstwach infrastruktury, co prowadzi do zwiększenia możliwości zarządzania operacjami. Aby zrealizować te ulepszenia operacyjne, może być konieczne poprawienie ogólnej strategii zarządzania chmurą, począwszy od dopasowania biznesowego.

Aby ustanowić odpowiednie rozwiązania w zakresie zarządzania operacjami, musisz zrozumieć, w jaki sposób kontenery będą używane w planach wdrażania chmury i jakie korzyści mają zostać osiągnięte z tej zmiany do konteneryzowanych obciążeń.

  • Czy będziesz zarządzać wieloma rozwiązaniami technologicznymi, takimi jak kontenery, IaaS i PaaS, na platformie w chmurze?
  • Czy scentralizowane zespoły będą obsługiwać operacje i zarządzanie kontenerem lub platformą AKS? Czy ta odpowiedzialność jest zmieniana na poszczególne zespoły obciążeń?
  • Czy scentralizowane zespoły będą obsługiwać operacje i zarządzanie obciążeniami uruchomionymi w każdym kontenerze lub zasobniku? Czy ta odpowiedzialność jest zmieniana na poszczególne zespoły obciążeń?
  • Czy używasz kontenerów dla obciążeń o znaczeniu krytycznym?
  • Czy używasz tylko kontenerów dla obciążeń o mniejszym znaczeniu lub narzędzi, aby zmniejszyć koszty?
  • Jak ważna jest wydajność i niezawodność poszczególnych obciążeń?
  • Czy aplikacje w kontenerach są bezstanowe? Czy musisz zachować stan, aby chronić i odzyskiwać obciążenia w kontenerach?

Te podstawowe pytania będą kształtować sposób, w jaki najlepiej zintegrować kontenery i usługę AKS ze strategią zarządzania operacjami.

Punkt odniesienia operacji

Implementacja punktu odniesienia operacji zapewnia scentralizowany dostęp do narzędzi wymaganych do obsługi wszystkich zasobów w środowisku chmury i zarządzania nimi. Jeśli nie masz planu bazowego operacji dla niekontenerowanych zasobów, możesz zaimplementować plan bazowy operacji zdefiniowany w metodologii zarządzania.

Plan bazowy operacji powinien obejmować narzędzia i konfiguracje, aby zapewnić widoczność, monitorowanie, zgodność operacyjną, optymalizację i ochronę/odzyskiwanie.

Punkt odniesienia zarządzania operacjami

Plan bazowy operacji opisany w powyższych artykułach nie zapewnia obsługi kontenerów ani platformy AKS. Zapewni to jednak podstawy narzędzi, które można rozszerzyć w celu obsługi kontenerów, takich jak Azure Monitor, Azure Backup i inne narzędzia.

Jeśli większość portfolio w chmurze jest hostowana w kontenerach, rozważ uwzględnienie wyspecjalizowanych operacji platformy w następnej sekcji do planu bazowego operacji.

Operacje platformy

O ile ta implementacja nie jest pierwszym lub jedynym wdrożeniem organizacji w chmurze, należy mieć plan bazowy operacji. W tej sekcji przedstawiono kilka narzędzi, które warto uwzględnić, aby ułatwić zarządzanie wdrożeniem kontenera lub usługi AKS.

Spis i widoczność

Monitorowanie kontenerów i klastrów usługi AKS korzysta z narzędzi, pulpitów nawigacyjnych i alertów uwzględnionych w punkcie odniesienia operacji. Może jednak być konieczne skonfigurowanie większej ilości danych w celu pobrania danych z kontenerów do narzędzi do monitorowania operacji, takich jak usługa Azure Monitor dla kontenerów. Zapoznaj się z omówieniem usługi Azure Monitor dla kontenerów , aby zebrać dane potrzebne do dodania operacji kontenera i platformy AKS do punktu odniesienia operacji.

Po skonfigurowaniu usługi Azure Monitor do zbierania danych w kontenerach można monitorować następujące obszary w ramach scentralizowanych procesów zarządzania:

  • Identyfikowanie klastrów działających w różnych regionach, najlepiej powiązanych z wpisem drzewa usług i identyfikowanie kluczowych faktów w tych klastrach
    • Identyfikowanie topologii puli węzłów klastra, sieci i magazynu tych klastrów
    • Identyfikowanie warstwy wersji obrazu usługi AKS i węzła.
  • Identyfikowanie wykorzystania zasobów węzła klastra (proces, pamięć i magazyn)
  • Identyfikowanie kontenerów uruchomionych w węzłach i ich współtworzenie użycia węzłów
  • Omówienie zachowania klastrów w przypadku średnich i najcięższych obciążeń. Ta wiedza może pomóc w zidentyfikowaniu potrzeb dotyczących pojemności i określeniu maksymalnego obciążenia, które może utrzymać klaster.
  • Skonfiguruj alerty, aby proaktywnie powiadamiać użytkownika lub rejestrować, gdy użycie procesora CPU i pamięci w węzłach lub kontenerach przekracza progi, lub gdy zmiana stanu kondycji występuje w klastrze w zestawie kondycji infrastruktury lub węzłów.
  • Używanie zapytań do tworzenia wspólnego zestawu alertów, pulpitów nawigacyjnych i szczegółowej analizy

Te dane będą również obsługiwać zespoły ds. operacji obciążeń, dostarczając szczegółowe informacje o obciążeniach uruchomionych na platformie konteneryzowanej:

  • Przejrzyj wykorzystanie zasobów obciążeń uruchomionych na hoście, które nie są powiązane ze standardowymi procesami obsługującymi zasobnik.
  • Integracja z rozwiązaniem Prometheus w celu wyświetlania metryk aplikacji.
  • Monitorowanie obciążeń kontenerów wdrożonych w aks aparatu lokalnego i aparatu AKS w usłudze Azure Stack.
  • Monitorowanie obciążeń kontenerów wdrożonych w usłudze Azure Red Hat OpenShift.
  • Monitorowanie obciążeń kontenerów wdrożonych na platformie Kubernetes z włączoną usługą Azure Arc (wersja zapoznawcza).

Zgodność operacji

Stosowanie poprawek, dostrajanie i ustalanie rozmiaru odbywa się na kilku różnych poziomach w środowisku konteneryzowanym. Operatorzy mogą znajdować się w wielu różnych zespołach, w zależności od żądanego podejścia do operacji. Aby zachować zgodność operacji, operator będzie monitorować użycie, zmieniać rozmiar zasobów w celu równoważenia wydajności i kosztów oraz stosować poprawki do podstawowych systemów, aby zminimalizować ryzyko i dryf konfiguracji. Centralne organizacje IT zwykle dostarczają te zadania w ramach planu bazowego operacji dla rozwiązań IaaS i PaaS.

W środowisku klastra na platformie Azure te zadania są wykonywane na wielu poziomach: klaster AKS, obraz węzła i system operacyjny węzła. Wszystkie te zadania operacyjne stają się bardziej zależne od zrozumienia i pracy relacji obciążeń uruchomionych w klastrach lub w poszczególnych pulach węzłów. Poniższe instrukcje pomogą ocenić, co i jeśli chcesz wykonać operacje w środowiskach kontenerów.

  • Jeśli ustalanie rozmiaru i poprawianie rozmiaru klastra usługi AKS, obrazu węzła lub systemu operacyjnego węzła jest dostarczane jako część potoku wdrażania aplikacji lub zależy od architektury lub konfiguracji aplikacji, najlepszym rozwiązaniem jest przeniesienie zgodności operacyjnej do zespołu ds. obciążeń w celu uzyskania szczegółowej kontroli. Ponieważ obciążenia często są zależne od funkcji orkiestracji, jest to najbardziej typowy wzorzec, ponieważ nieoczekiwana zmiana wersji usługi AKS lub zmiana obrazu węzła może być katastrofalna dla obciążenia lub jego narzędzi środowiska uruchomieniowego.
  • W przypadku mniej typowych klastrów scentralizowanych, obsługujących portfolio obciążeń i różnych aplikacji, scentralizowany zespół operacyjny może nadal odpowiadać za zadania zgodności operacyjnej, poniższe przewodniki pomogą w dostarczaniu tych zadań w klastrach. Wykonywanie tych zadań cyklicznie instills operacji specyficznych dla platformy. Istnieje ryzyko związane z centralnym podejściem do operacji, a dokładne testowanie uaktualnień w środowiskach przedprodukcyjnych, jasne i zgodne z zaplanowaną konserwacją oraz plany awaryjne dla niezgodnych obciążeń muszą być stosowane. Jednym z nieprawidłowych uaktualnień może być pojedynczy punkt awarii i podobnie jedno obciążenie, którego nie można uaktualnić, może spowodować, że klaster nie będzie obsługiwał. Planowanie klastrów wielodostępnych i zarządzanie nimi z należytą starannością.

W przypadku obu typów klastrów postępuj zgodnie ze wskazówkami dotyczącymi uaktualnień, obrazów węzłów i aktualizacji systemu operacyjnego węzła znajdujących się poniżej:

Ochrona i odzyskiwanie

Węzły usługi AKS są efemeryczne i w związku z tym nie są tworzone kopie zapasowe w sposób, który można przywrócić indywidualnie. Odzyskiwanie po zdarzeniu może obejmować ponowne wdrażanie obciążeń w nowej puli węzłów lub zupełnie nowy klaster w zależności od zakresu zdarzenia.

  • Wybierz dodanie umowy SLA dotyczącej czasu pracy do klastra.
  • W przypadku wyższych umów SLA warto również rozważyć wieloregionowe najlepsze rozwiązania bcDR , aby zapewnić dodatkową ochronę.
  • Ponieważ klastry nie powinny zawierać stanu, przywracanie stanu zewnętrznego jest obsługiwane przy użyciu istniejących wskazówek dotyczących linii bazowej operacji. Jeśli stan został przeniesiony do klastrów, upewnij się, że następujące operatory są najlepszym rozwiązaniem w zakresie magazynowania i mają strategię tworzenia kopii zapasowych i przywracania tych danych dla danego obciążenia. Korzystanie z narzędzi, takich jak Velero , jest przykładem operacji specyficznych dla platformy, które rozszerzają plan bazowy operacji.
    • Jeśli portfolio aplikacji stale stosuje stan, centralny zespół operacyjny nie powinien próbować obsługiwać obu rozwiązań. Zamiast tego standaryzacja łańcucha narzędzi żądanego stanu dla wszystkich kontenerów, ale przeniesienie odpowiedzialności za alternatywne rozwiązania odzyskiwania do zespołów operacyjnych obciążeń. Takie podejście umożliwia deweloperom swobodę projektowania, obniża koszty centralne i zapewnia zachętę do redukcji kosztów dla zespołów obciążeń w celu zachowania zgodności ze standardem.

Operacje obciążeń

W powyższej sekcji operacje platformy przedstawiono wspólną konwersację podczas zarządzania klastrami usługi AKS. Czy klastry Kubernetes są zarządzane centralnie przez platformę technologiczną? Czy są one narzędziem roboczym, które powinno być zarządzane przez zespoły, które są właścicielami poszczególnych obciążeń? To pytanie różni się w przypadku różnych organizacji. Stała w większości organizacji polega na tym, że kontenery i usługa AKS są zaprojektowane tak, aby zapewnić zespołom obciążeń większą elastyczność w sposobie działania poszczególnych obciążeń i zapewnić konkretne funkcje dla tych obciążeń, które mają być używane w swojej architekturze, aby przynieść korzyści właścicielom i klientom aplikacji.

Operacje obciążeń mogą opierać się na istniejących operacjach odniesienia i operacjach specyficznych dla platformy. Można również bezpiecznie obsługiwać klaster usługi AKS przy użyciu całkowicie zdecentralizowanych operacji obciążeń. W obu przypadkach, gdy trzeba podnieść poziom operacji, aby skoncentrować się na konkretnych wynikach dla określonego obciążenia, możesz użyć platformy Azure Well-Architected Framework i platformy Microsoft Azure Well-Architected Review , aby uzyskać bardzo szczegółowe informacje na temat typów procesów operacyjnych i narzędzi do użycia dla obciążenia.

Następny krok: Następna iteracja migracji

Po zakończeniu migracji nowoczesnej platformy aplikacji zespół wdrożeniowy ds. chmury może rozpocząć kolejną migrację specyficzną dla scenariusza. Alternatywnie, jeśli istnieją dodatkowe platformy do migracji, ta seria artykułów może służyć ponownie do kierowania następną nowoczesną migracją lub wdrożeniem platformy aplikacji.