Reguły autoskalowania

Ukończone

W tej lekcji przyjrzymy się pojęciom reguł skalowania automatycznego. Następnie w następnym ćwiczeniu wyzwolimy reguły.

Reguły

Skalowanie automatyczne jest oparte na zestawie warunków, reguł i limitów skalowania. Warunek skalowania łączy czas i zestaw reguł skalowania. Jeśli bieżąca godzina przypada w okresie zdefiniowanym w warunku skalowania, zostaną ocenione reguły skalowania warunku. Wyniki tej oceny określają, czy należy dodawać lub usuwać wystąpienia. Warunek skalowania definiuje również limity skalowania określające maksymalną i minimalną liczbę wystąpień.

Skalowanie automatyczne usługi Azure Spring Apps umożliwia skalowanie liczby uruchomionych wystąpień na podstawie metryk. Reguły skalowania automatycznego przetwarzają te metryki. Możesz utworzyć złożone nakładające się reguły zgodnie z potrzebami w danej sytuacji.

Warunki autoskalowania

Istnieją dwa typy reguł:

  • Reguły oparte na metryce
  • Reguły oparte na harmonogramie

W typach opartych na metrykach liczba aplikacji i zasobów jest skalowana w poziomie do ilości niezbędnej do obsługi obciążenia bez przekraczania limitów maksymalnych, które ustanowić. Podobnie liczba aplikacji i zasobów jest skalowana w poziomie do ilości niezbędnej do obsługi obciążenia bez spadku poniżej ustawionych wartości minimalnych.

W regułach opartych na harmonogramie aplikacje są skalowane w poziomie i na podstawie wstępnie zdefiniowanego harmonogramu i limitów. Ten typ reguły jest przydatny w przypadku przypadków, które często są zgodne z przewidywalnym wzorcem i ustanowienia punktu odniesienia w celu uzyskania większego skalowania opartego na metryce.

Możesz utworzyć wiele warunków autoskalowania w celu obsługi różnych harmonogramów i metryk. Platforma Azure automatycznie skaluje usługę, gdy obowiązują dowolne z tych warunków. Można również zdefiniować warunek domyślny, który ma być używany, jeśli żaden z innych warunków nie ma zastosowania. Ten warunek jest zawsze aktywny i nie ma harmonogramu.

Akcje autoskalowania

Gdy reguła autoskalowania wykryje, że metryka przekroczyła próg, wykonuje akcję autoskalowania. Akcją autoskalowania może być zwiększanie skali w poziomie lub zmniejszanie skali w poziomie. Akcja skalowania w poziomie zwiększa liczbę wystąpień, a akcja skalowania w poziomie zmniejsza liczbę wystąpień. Akcja autoskalowania korzysta z operatora (takiego jak mniejsze niż, większe niż, równe itd.) w celu określenia sposobu reagowania na wartość progową. Akcje skalowania w poziomie zwykle używają operatora większego niż , aby porównać wartość metryki z progiem. Akcje skalowania w poziomie mają tendencję do porównywania wartości metryki z progiem z operatorem mniejszym niż . Akcja autoskalowania może również ustawiać liczbę wystąpień na określony poziom zamiast przyrostowo zwiększać lub zmniejszać dostępną liczbę.

Akcja automatycznego skalowania ma okres ochładzania określony w minutach. W tym interwale reguła skalowania nie może zostać ponownie wyzwolona. Ten okres ochładzania pozwala systemowi ustabilizować się między zdarzeniami autoskalowania. Należy pamiętać, że uruchomienie lub zamknięcie wystąpienia chwilę trwa, a więc zbierane metryki mogą nie pokazywać żadnych znaczących zmian przez kilka minut.

Szacowanie podczas skalowania w poziomie ma na celu uniknięcie sytuacji flappingu , w których akcje skalowania i skalowania w poziomie stale przechodzą tam i z powrotem. Należy pamiętać o tym zachowaniu podczas wybierania tych samych progów dla skalowania w poziomie i skalowania w poziomie.