Limity ograniczania mocy obliczeniowej
Dotyczy: ✔️ Maszyny wirtualne z systemem Linux Maszyny ✔️ wirtualne z systemem Windows ✔️ — elastyczne zestawy ✔️ skalowania
Usługa Microsoft Compute implementuje mechanizm ograniczania przepustowości, aby ułatwić ogólną wydajność usługi i zapewnić spójne środowisko klientom. Żądania interfejsu API, które przekraczają maksymalne dozwolone limity, są ograniczane, a użytkownicy otrzymują błąd HTTP 429. Wszystkie zasady ograniczania zasobów obliczeniowych są implementowane dla poszczególnych regionów.
Jak działają zasady ograniczania przepustowości?
Usługa Microsoft Compute implementuje zasady ograniczania przepustowości, które ograniczają liczbę żądań interfejsu API na zasób i subskrypcję na region na minutę. Jeśli liczba żądań interfejsu API przekracza te limity, żądania są ograniczane. Oto jak działają te limity:
Limit zasobów — każdy zasób, taki jak maszyna wirtualna, ma określony limit dla żądań interfejsu API. Załóżmy na przykład, że użytkownik tworzy 10 maszyn wirtualnych w ramach subskrypcji. Użytkownik może wywołać maksymalnie 12 żądań aktualizacji dla każdej maszyny wirtualnej w ciągu jednej minuty. Jeśli użytkownik przekroczy limit dla maszyny wirtualnej, żądania interfejsu API są ograniczane. Ten limit gwarantuje, że kilka zasobów nie korzysta z limitów poziomu subskrypcji i ogranicza inne zasoby.
Limit subskrypcji — oprócz limitów zasobów istnieje nadrzędny limit liczby żądań interfejsu API we wszystkich zasobach w ramach subskrypcji. Wszelkie żądania interfejsu API wykraczające poza ten limit są ograniczane, niezależnie od tego, czy osiągnięto limit dla pojedynczego zasobu. Załóżmy na przykład, że użytkownik ma 200 maszyn wirtualnych w subskrypcji. Mimo że użytkownik ma prawo inicjować maksymalnie 12 żądań aktualizacji maszyn wirtualnych dla każdej maszyny wirtualnej, limit agregacji żądań interfejsu API aktualizacji jest ograniczony do 1500 na minutę. Wszystkie żądania interfejsu API aktualizacji maszyn wirtualnych dla subskrypcji przekraczającej 1500 są ograniczane.
Jak usługa Microsoft Compute określa limity ograniczania przepustowości?
Aby określić limity dla każdego zasobu i subskrypcji, usługa Microsoft Compute używa algorytmu zasobnika tokenu. Ten algorytm tworzy zasobniki dla każdego limitu i przechowuje określoną liczbę tokenów w każdym zasobniku. Liczba tokenów w zasobniku reprezentuje limit ograniczania w danej chwili.
Na początku okna ograniczania przepływności po utworzeniu zasobu zasobnik zostanie wypełniony do maksymalnej pojemności. Każde żądanie interfejsu API zainicjowane przez użytkownika korzysta z jednego tokenu. Gdy liczba tokenów wyczerpała się do zera, kolejne żądania interfejsu API są ograniczane. Zasobnik jest uzupełniany nowymi tokenami co minutę z stałą szybkością o nazwie Wskaźnik ponownego wypełniania zasobnika dla zasobu i subskrypcji.
Na przykład: rozważmy "zasady ograniczania przepustowości dla interfejsu API aktualizacji maszyny wirtualnej", które określają współczynnik wypełniania zasobnika wynoszący cztery tokeny na minutę i maksymalną pojemność zasobnika wynoszącą 12 tokenów. Użytkownik wywołuje żądanie interfejsu API aktualizacji maszyny wirtualnej dla maszyny wirtualnej zgodnie z poniższą tabelą. Początkowo zasobnik jest wypełniony 12 tokenami na początku okna ograniczania. W czwartej minucie użytkownik korzysta ze wszystkich 12 tokenów, pozostawiając zasobnik pusty. W piątej minucie zasobnik jest uzupełniany czterema nowymi tokenami zgodnie z współczynnikiem uzupełniania zasobnika. Dlatego cztery żądania interfejsu API mogą być wykonywane w piątej minucie, podczas gdy usługa Microsoft Compute ogranicza jedno żądanie interfejsu API z powodu niewystarczających tokenów.
(min) | 1. | 2. | trzeci | 4. | 5. | 6. |
---|---|---|---|---|---|---|
Liczba tokenów na początku (A) | 12 | 12 | 8 | 12 | 4 | 4 |
Żądania na minutę (B) | 0 | 8 | 0 | 13 | 5 | 0 |
Żądania ograniczone (C) | 0 | 0 | 0 | 1 | 1 | 0 |
Pozostałe tokeny na końcu okresu D = Max(A-B, 0) |
12 | 4 | 8 | 0 | 0 | 100 |
Podobny proces jest obserwowany w celu określenia limitów ograniczania przepustowości na poziomie subskrypcji. W poniższych sekcjach szczegółowo opisano szybkość uzupełniania zasobnika i maksymalną pojemność zasobnika, która jest używana do określania limitów ograniczania dla maszyn wirtualnych, zestawów skalowania maszyn wirtualnych i maszyn wirtualnych zestawu skalowania maszyn wirtualnych.
Limity ograniczania przepustowości dla maszyn wirtualnych
Żądania interfejsu API dla maszyn wirtualnych są podzielone na siedem odrębnych zasad. Każda zasada ma własne limity, w zależności od tego, jak intensywnie korzystają z zasobów żądań interfejsu API w ramach tych zasad. Poniższa tabela zawiera kompleksową listę tych zasad, odpowiednie interfejsy API REST i ich odpowiednie limity ograniczania:
Kategoria zasad | Interfejsy API REST | Poziom zasobu | Poziom zasobu | Poziom subskrypcji | Poziom subskrypcji |
---|---|---|---|---|---|
Szybkość wypełniania zasobnika (na minutę) | Maksymalna pojemność zasobnika (na minutę) |
Szybkość wypełniania zasobnika (na minutę) |
Maksymalna pojemność zasobnika (na minutę) |
||
Umieszczanie maszyny wirtualnej (Tworzenie nowych maszyn wirtualnych) |
Utwórz | 4 | 12 | 500 | 1500 |
Aktualizowanie maszyny wirtualnej (Aktualizowanie istniejących maszyn wirtualnych) |
Update Ponowne ponowne uruchamianie Wyłącz zasilanie Uruchom Uogólnij Konwertowanie na Dyski zarządzane Ponowne wdrożenie Wykonywanie konserwacji Schwytać Uruchom polecenie Tworzenie lub aktualizowanie Rozszerzenia — aktualizacja Rozszerzenia — usuwanie Reimage Update Uruchamianie poleceń — aktualizacja Uruchamianie poleceń — usuwanie Uruchamianie poleceń — tworzenie lub aktualizowanie |
4 | 12 | 500 | 1500 |
Usuwanie maszyny wirtualnej (Usuwanie maszyn wirtualnych) |
Usuń Symulowanie eksmisji Cofnij przydział: |
4 | 12 | 500 | 1500 |
Uzyskiwanie maszyny wirtualnej o niskich kosztach (Uzyskiwanie informacji na temat pojedynczej maszyny wirtualnej) |
Pobierz Widok wystąpienia Rozszerzenia — pobierz Dostępne rozmiary listy Pobieranie danych diagnostycznych rozruchu Uruchamianie poleceń — uzyskiwanie przez maszynę wirtualną Uruchamianie poleceń — lista według maszyny wirtualnej |
12 | 36 | 8000 | 24,000 |
Wysokie koszty uzyskiwania maszyny wirtualnej1 (Uzyskaj informacje o wielu maszynach wirtualnych) |
Lista Wyświetl wszystko Lista według lokalizacji |
ND | ND | 300 | 900 |
Pobierz operację (Uzyskaj informacje na temat operacji asynchronicznych maszyn wirtualnych) |
Stan operacji asynchronicznych | 15 | 45 | 5,000 | 15 000 |
Operacje poprawek gościa maszyny wirtualnej (Ocenianie i instalowanie poprawek gościa) |
Ocena poprawek Instalowanie poprawek |
2 | 6 | 200 | 600 |
1 Dotyczy to tylko zasad na poziomie subskrypcji.
Limity ograniczania przepustowości dla zestawów skalowania maszyn wirtualnych
Żądania interfejsu API dla zestawu skalowania maszyn wirtualnych (Uniform & Flex) są podzielone na 5 odrębnych zasad. Każda zasada ma własne limity, w zależności od tego, jak intensywnie korzystają z zasobów żądań interfejsu API w ramach tych zasad. Te zasady mają zastosowanie zarówno do trybów aranżacji Flex, jak i Uniform. Poniższa tabela zawiera kompleksową listę tych zasad, odpowiednie interfejsy API REST i ich odpowiednie limity ograniczania:
Kategoria zasad | Interfejsy API REST | Poziom zasobu | Poziom zasobu | Poziom subskrypcji | Poziom subskrypcji |
---|---|---|---|---|---|
Szybkość wypełniania zasobnika (na minutę) |
Maksymalna pojemność zasobnika (na minutę) |
Szybkość wypełniania zasobnika (na minutę) | Maksymalna pojemność zasobnika (na minutę) |
||
Odłożenie (Utwórz nowy zestaw skalowania) |
Utwórz | 4 | 12 | 125 | 375 |
Zaktualizuj (Aktualizowanie istniejącego zestawu skalowania) |
Update Początek2 Uruchom ponownie2 Ponowne wdrażanie2 Wykonywanie konserwacji2 Reimage2 Reimage All2 Tworzenie lub aktualizowanie Uaktualnienia stopniowe — anulowanie Rozszerzenia — tworzenie Rozszerzenia — aktualizacja Rozszerzenia — usuwanie Force Recovery Service Fabric Platform Update Domain Walk Konwertowanie na pojedynczą grupę umieszczania Ustawianie stanu usługi orkiestracji |
4 | 12 | 500 | 1500 |
Delete (Usuń zestaw skalowania) |
Usuń Wyłączzasilanie 2 Cofnij przydział: |
4 | 12 | 175 | 525 |
Uzyskiwanie niskich kosztów (Uzyskiwanie informacji na temat pojedynczego zestawu skalowania) |
Pobierz Wyświetlanie listy jednostek SKU Uaktualnienia stopniowe — pobierz najnowsze Uzyskiwanie historii uaktualniania systemu operacyjnego |
12 | 36 | 800 | 2,400 |
Uzyskiwanie wysokich kosztów (Uzyskiwanie informacji intensywnie korzystających z zasobów) |
Pobieranie widoku wystąpienia Lista2 Wyświetl listę wszystkich2 Lista według lokalizacji2 |
10 | 30 | 360 | 1,080 |
2 Dotyczy to tylko zasad na poziomie subskrypcji.
Limity ograniczania przepustowości dla maszyn wirtualnych zestawu skalowania maszyn wirtualnych
Żądania interfejsu API dla maszyn wirtualnych zestawu skalowania maszyn wirtualnych są podzielone na 3 odrębne zasady. Każda zasada ma własne limity, w zależności od tego, jak intensywnie korzystają z zasobów żądań interfejsu API w ramach tych zasad. Poniższa tabela zawiera kompleksową listę tych zasad, odpowiednie interfejsy API REST i ich odpowiednie limity ograniczania:
Kategoria zasad | Interfejsy API REST | Poziom zasobu | Poziom zasobu | Poziom subskrypcji | Poziom subskrypcji |
---|---|---|---|---|---|
Szybkość wypełniania zasobnika (na minutę) |
Maksymalna pojemność zasobnika (na minutę) |
Szybkość wypełniania zasobnika (na minutę) |
Maksymalna pojemność zasobnika (na minutę) |
||
Aktualizowanie maszyn wirtualnych zestawu skalowania (Aktualizowanie istniejących maszyn wirtualnych w zestawie skalowania) |
Uruchom Restart Reimage ReimageAll Update Symulowanie eksmisji Rozszerzenia — tworzenie lub aktualizowanie RunCommands — tworzenie lub aktualizowanie RunCommands — aktualizacja |
4 | 12 | 500 | 1500 |
Usuwanie maszyn wirtualnych zestawu skalowania (Usuwanie maszyn wirtualnych zestawu skalowania) |
Usuń PowerOff Cofnij przydział: Rozszerzenia — usuwanie RunCommands — usuwanie |
4 | 12 | 500 | 1500 |
Pobieranie maszyn wirtualnych zestawu skalowania (Uzyskiwanie informacji na temat maszyn wirtualnych zestawu skalowania) |
Pobierz Widok GetInstance Rozszerzenia — pobierz RunCommands — Pobierz Pobieranie danych diagnostycznychboot |
12 | 36 | 2000 | 6000 |
Wskazówki dotyczące rozwiązywania problemów
Jeśli użytkownicy nadal napotykają problemy z powodu ograniczania zasobów obliczeniowych, zapoznaj się z tematem Rozwiązywanie problemów z błędami ograniczania przepustowości na platformie Azure — Virtual Machines. Zawiera szczegółowe informacje na temat rozwiązywania problemów z ograniczaniem przepustowości oraz najlepszych rozwiązań, aby uniknąć ograniczania przepustowości.
Często zadawane pytania
Czy istnieją jakieś działania wymagane od użytkowników?
Użytkownicy nie muszą nic zmieniać w swojej konfiguracji ani obciążeniach. Wszystkie istniejące interfejsy API nadal działają tak, jak to jest.
Jakie korzyści zapewniają zasady ograniczania przepustowości?
Zasady ograniczania przepustowości oferują kilka korzyści:
Wszystkie zasoby obliczeniowe mają jednolite okno o wartości 1 minut. Użytkownicy mogą pomyślnie wywoływać wywołania interfejsu API, 1 minutę po ograniczaniu.
Żaden pojedynczy zasób nie może używać wszystkich limitów w ramach subskrypcji, ponieważ limity są definiowane na poziomie zasobu.
Usługa Microsoft Compute wprowadza nowy algorytm, algorytm zasobnika tokenu do określania limitów. Algorytm zapewnia dodatkowy bufor dla klientów, jednocześnie wykonując dużą liczbę żądań interfejsu API.
Czy klient otrzymuje alert, gdy osiągnie limity ograniczania przepustowości?
W ramach każdej odpowiedzi usługa Microsoft Compute zwraca wartość x-ms-ratelimit-remaining-resource , która może służyć do określania limitów ograniczania przepustowości względem zasad. Lista odpowiednich zasad ograniczania przepływności jest zwracana jako odpowiedź na nagłówki informacyjne liczby wywołań.