Udostępnij za pośrednictwem


Limity ograniczania mocy obliczeniowej

Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows ✔️ — elastyczne zestawy ✔️ skalowania

Usługa Microsoft Compute implementuje mechanizm ograniczania przepustowości, aby ułatwić ogólną wydajność usługi i zapewnić spójne środowisko klientom. Żądania interfejsu API, które przekraczają maksymalne dozwolone limity, są ograniczane, a użytkownicy otrzymują błąd HTTP 429. Wszystkie zasady ograniczania zasobów obliczeniowych są implementowane dla poszczególnych regionów.

Jak działają zasady ograniczania przepustowości?

Usługa Microsoft Compute implementuje zasady ograniczania przepustowości, które ograniczają liczbę żądań interfejsu API na zasób i subskrypcję na region na minutę. Jeśli liczba żądań interfejsu API przekracza te limity, żądania są ograniczane. Oto jak działają te limity:

  • Limit zasobów — każdy zasób, taki jak maszyna wirtualna, ma określony limit dla żądań interfejsu API. Załóżmy na przykład, że użytkownik tworzy 10 maszyn wirtualnych w ramach subskrypcji. Użytkownik może wywołać maksymalnie 12 żądań aktualizacji dla każdej maszyny wirtualnej w ciągu jednej minuty. Jeśli użytkownik przekroczy limit dla maszyny wirtualnej, żądania interfejsu API są ograniczane. Ten limit gwarantuje, że kilka zasobów nie korzysta z limitów poziomu subskrypcji i ogranicza inne zasoby.

  • Limit subskrypcji — oprócz limitów zasobów istnieje nadrzędny limit liczby żądań interfejsu API we wszystkich zasobach w ramach subskrypcji. Wszelkie żądania interfejsu API wykraczające poza ten limit są ograniczane, niezależnie od tego, czy osiągnięto limit dla pojedynczego zasobu. Załóżmy na przykład, że użytkownik ma 200 maszyn wirtualnych w subskrypcji. Mimo że użytkownik ma prawo inicjować maksymalnie 12 żądań aktualizacji maszyn wirtualnych dla każdej maszyny wirtualnej, limit agregacji żądań interfejsu API aktualizacji jest ograniczony do 1500 na minutę. Wszystkie żądania interfejsu API aktualizacji maszyn wirtualnych dla subskrypcji przekraczającej 1500 są ograniczane.

Jak usługa Microsoft Compute określa limity ograniczania przepustowości?

Aby określić limity dla każdego zasobu i subskrypcji, usługa Microsoft Compute używa algorytmu zasobnika tokenu. Ten algorytm tworzy zasobniki dla każdego limitu i przechowuje określoną liczbę tokenów w każdym zasobniku. Liczba tokenów w zasobniku reprezentuje limit ograniczania w danej chwili.

Na początku okna ograniczania przepływności po utworzeniu zasobu zasobnik zostanie wypełniony do maksymalnej pojemności. Każde żądanie interfejsu API zainicjowane przez użytkownika korzysta z jednego tokenu. Gdy liczba tokenów wyczerpała się do zera, kolejne żądania interfejsu API są ograniczane. Zasobnik jest uzupełniany nowymi tokenami co minutę z stałą szybkością o nazwie Wskaźnik ponownego wypełniania zasobnika dla zasobu i subskrypcji.

Na przykład: rozważmy "zasady ograniczania przepustowości dla interfejsu API aktualizacji maszyny wirtualnej", które określają współczynnik wypełniania zasobnika wynoszący cztery tokeny na minutę i maksymalną pojemność zasobnika wynoszącą 12 tokenów. Użytkownik wywołuje żądanie interfejsu API aktualizacji maszyny wirtualnej dla maszyny wirtualnej zgodnie z poniższą tabelą. Początkowo zasobnik jest wypełniony 12 tokenami na początku okna ograniczania. W czwartej minucie użytkownik korzysta ze wszystkich 12 tokenów, pozostawiając zasobnik pusty. W piątej minucie zasobnik jest uzupełniany czterema nowymi tokenami zgodnie z współczynnikiem uzupełniania zasobnika. Dlatego cztery żądania interfejsu API mogą być wykonywane w piątej minucie, podczas gdy usługa Microsoft Compute ogranicza jedno żądanie interfejsu API z powodu niewystarczających tokenów.

(min) 1. 2. trzeci 4. 5. 6.
Liczba tokenów na początku (A) 12 12 8 12 4 4
Żądania na minutę (B) 0 8 0 13 5 0
Żądania ograniczone (C) 0 0 0 1 1 0
Pozostałe tokeny na końcu okresu
D = Max(A-B, 0)
12 4 8 0 0 100

Podobny proces jest obserwowany w celu określenia limitów ograniczania przepustowości na poziomie subskrypcji. W poniższych sekcjach szczegółowo opisano szybkość uzupełniania zasobnika i maksymalną pojemność zasobnika, która jest używana do określania limitów ograniczania dla maszyn wirtualnych, zestawów skalowania maszyn wirtualnych i maszyn wirtualnych zestawu skalowania maszyn wirtualnych.

Limity ograniczania przepustowości dla maszyn wirtualnych

Żądania interfejsu API dla maszyn wirtualnych są podzielone na siedem odrębnych zasad. Każda zasada ma własne limity, w zależności od tego, jak intensywnie korzystają z zasobów żądań interfejsu API w ramach tych zasad. Poniższa tabela zawiera kompleksową listę tych zasad, odpowiednie interfejsy API REST i ich odpowiednie limity ograniczania:

Kategoria zasad Interfejsy API REST Poziom zasobu Poziom zasobu Poziom subskrypcji Poziom subskrypcji
Szybkość wypełniania zasobnika (na minutę) Maksymalna pojemność zasobnika
(na minutę)
Szybkość wypełniania zasobnika
(na minutę)
Maksymalna pojemność zasobnika
(na minutę)
Umieszczanie maszyny wirtualnej
(Tworzenie nowych maszyn wirtualnych)
Utwórz 4 12 500 1500
Aktualizowanie maszyny wirtualnej
(Aktualizowanie istniejących maszyn wirtualnych)
Update
Ponowne ponowne uruchamianie
Wyłącz zasilanie
Uruchom
Uogólnij
Konwertowanie na Dyski zarządzane
Ponowne wdrożenie
Wykonywanie konserwacji
Schwytać
Uruchom polecenie
Tworzenie lub aktualizowanie
Rozszerzenia — aktualizacja
Rozszerzenia — usuwanie
Reimage
Update
Uruchamianie poleceń — aktualizacja
Uruchamianie poleceń — usuwanie
Uruchamianie poleceń — tworzenie lub aktualizowanie
4 12 500 1500
Usuwanie maszyny wirtualnej
(Usuwanie maszyn wirtualnych)
Usuń
Symulowanie eksmisji
Cofnij przydział:
4 12 500 1500
Uzyskiwanie maszyny wirtualnej o niskich kosztach
(Uzyskiwanie informacji na temat pojedynczej maszyny wirtualnej)
Pobierz
Widok wystąpienia
Rozszerzenia — pobierz
Dostępne rozmiary listy
Pobieranie danych diagnostycznych rozruchu
Uruchamianie poleceń — uzyskiwanie przez maszynę wirtualną
Uruchamianie poleceń — lista według maszyny wirtualnej
12 36 8000 24,000
Wysokie koszty uzyskiwania maszyny wirtualnej1
(Uzyskaj informacje o wielu maszynach wirtualnych)
Lista
Wyświetl wszystko
Lista według lokalizacji
ND ND 300 900
Pobierz operację
(Uzyskaj informacje na temat operacji asynchronicznych maszyn wirtualnych)
Stan operacji asynchronicznych 15 45 5,000 15 000
Operacje poprawek gościa maszyny wirtualnej
(Ocenianie i instalowanie poprawek gościa)
Ocena poprawek
Instalowanie poprawek
2 6 200 600

1 Dotyczy to tylko zasad na poziomie subskrypcji.

Limity ograniczania przepustowości dla zestawów skalowania maszyn wirtualnych

Żądania interfejsu API dla zestawu skalowania maszyn wirtualnych (Uniform & Flex) są podzielone na 5 odrębnych zasad. Każda zasada ma własne limity, w zależności od tego, jak intensywnie korzystają z zasobów żądań interfejsu API w ramach tych zasad. Te zasady mają zastosowanie zarówno do trybów aranżacji Flex, jak i Uniform. Poniższa tabela zawiera kompleksową listę tych zasad, odpowiednie interfejsy API REST i ich odpowiednie limity ograniczania:

Kategoria zasad Interfejsy API REST Poziom zasobu Poziom zasobu Poziom subskrypcji Poziom subskrypcji
Szybkość wypełniania zasobnika
(na minutę)
Maksymalna pojemność zasobnika
(na minutę)
Szybkość wypełniania zasobnika (na minutę) Maksymalna pojemność zasobnika
(na minutę)
Odłożenie
(Utwórz nowy zestaw skalowania)
Utwórz 4 12 125 375
Zaktualizuj
(Aktualizowanie istniejącego zestawu skalowania)
Update
Początek2
Uruchom ponownie2
Ponowne wdrażanie2
Wykonywanie konserwacji2
Reimage2
Reimage All2
Tworzenie lub aktualizowanie
Uaktualnienia stopniowe — anulowanie
Rozszerzenia — tworzenie
Rozszerzenia — aktualizacja
Rozszerzenia — usuwanie
Force Recovery Service Fabric Platform Update Domain Walk
Konwertowanie na pojedynczą grupę umieszczania
Ustawianie stanu usługi orkiestracji
4 12 500 1500
Delete
(Usuń zestaw skalowania)
Usuń
Wyłączzasilanie 2
Cofnij przydział:
4 12 175 525
Uzyskiwanie niskich kosztów
(Uzyskiwanie informacji na temat pojedynczego zestawu skalowania)
Pobierz
Wyświetlanie listy jednostek SKU
Uaktualnienia stopniowe — pobierz najnowsze
Uzyskiwanie historii uaktualniania systemu operacyjnego
12 36 800 2,400
Uzyskiwanie wysokich kosztów
(Uzyskiwanie informacji intensywnie korzystających z zasobów)
Pobieranie widoku wystąpienia
Lista2
Wyświetl listę wszystkich2
Lista według lokalizacji2
10 30 360 1,080

2 Dotyczy to tylko zasad na poziomie subskrypcji.

Limity ograniczania przepustowości dla maszyn wirtualnych zestawu skalowania maszyn wirtualnych

Żądania interfejsu API dla maszyn wirtualnych zestawu skalowania maszyn wirtualnych są podzielone na 3 odrębne zasady. Każda zasada ma własne limity, w zależności od tego, jak intensywnie korzystają z zasobów żądań interfejsu API w ramach tych zasad. Poniższa tabela zawiera kompleksową listę tych zasad, odpowiednie interfejsy API REST i ich odpowiednie limity ograniczania:

Kategoria zasad Interfejsy API REST Poziom zasobu Poziom zasobu Poziom subskrypcji Poziom subskrypcji
Szybkość wypełniania zasobnika
(na minutę)
Maksymalna pojemność zasobnika
(na minutę)
Szybkość wypełniania zasobnika
(na minutę)
Maksymalna pojemność zasobnika
(na minutę)
Aktualizowanie maszyn wirtualnych zestawu skalowania
(Aktualizowanie istniejących maszyn wirtualnych w zestawie skalowania)
Uruchom
Restart
Reimage
ReimageAll
Update
Symulowanie eksmisji
Rozszerzenia — tworzenie lub aktualizowanie
RunCommands — tworzenie lub aktualizowanie
RunCommands — aktualizacja
4 12 500 1500
Usuwanie maszyn wirtualnych zestawu skalowania
(Usuwanie maszyn wirtualnych zestawu skalowania)
Usuń
PowerOff
Cofnij przydział:
Rozszerzenia — usuwanie
RunCommands — usuwanie
4 12 500 1500
Pobieranie maszyn wirtualnych zestawu skalowania
(Uzyskiwanie informacji na temat maszyn wirtualnych zestawu skalowania)
Pobierz
Widok GetInstance
Rozszerzenia — pobierz
RunCommands — Pobierz
Pobieranie danych diagnostycznychboot
12 36 2000 6000

Wskazówki dotyczące rozwiązywania problemów

Jeśli użytkownicy nadal napotykają problemy z powodu ograniczania zasobów obliczeniowych, zapoznaj się z tematem Rozwiązywanie problemów z błędami ograniczania przepustowości na platformie Azure — Virtual Machines. Zawiera szczegółowe informacje na temat rozwiązywania problemów z ograniczaniem przepustowości oraz najlepszych rozwiązań, aby uniknąć ograniczania przepustowości.

Często zadawane pytania

Czy istnieją jakieś działania wymagane od użytkowników?

Użytkownicy nie muszą nic zmieniać w swojej konfiguracji ani obciążeniach. Wszystkie istniejące interfejsy API nadal działają tak, jak to jest.

Jakie korzyści zapewniają zasady ograniczania przepustowości?

Zasady ograniczania przepustowości oferują kilka korzyści:

  • Wszystkie zasoby obliczeniowe mają jednolite okno o wartości 1 minut. Użytkownicy mogą pomyślnie wywoływać wywołania interfejsu API, 1 minutę po ograniczaniu.

  • Żaden pojedynczy zasób nie może używać wszystkich limitów w ramach subskrypcji, ponieważ limity są definiowane na poziomie zasobu.

  • Usługa Microsoft Compute wprowadza nowy algorytm, algorytm zasobnika tokenu do określania limitów. Algorytm zapewnia dodatkowy bufor dla klientów, jednocześnie wykonując dużą liczbę żądań interfejsu API.

Czy klient otrzymuje alert, gdy osiągnie limity ograniczania przepustowości?

W ramach każdej odpowiedzi usługa Microsoft Compute zwraca wartość x-ms-ratelimit-remaining-resource , która może służyć do określania limitów ograniczania przepustowości względem zasad. Lista odpowiednich zasad ograniczania przepływności jest zwracana jako odpowiedź na nagłówki informacyjne liczby wywołań.