Begränsningar för beräkningsbegränsning

Artikel
08/25/2024

Gäller för: ✔️ Virtuella Linux-datorer ✔️ med virtuella Windows-datorer ✔️ – flexibla skalningsuppsättningar ✔️ Enhetliga skalningsuppsättningar

Microsoft Compute implementerar begränsningsmekanismen för att hjälpa till med tjänstens övergripande prestanda och för att ge kunderna en konsekvent upplevelse. API-begäranden som överskrider de högsta tillåtna gränserna begränsas och användarna får ett HTTP 429-fel. Alla principer för beräkningsbegränsning implementeras per region.

Hur fungerar begränsningsprinciperna?

Microsoft Compute implementerar begränsningsprinciper som begränsar antalet API-begäranden som görs per resurs och per prenumeration per region och minut. Om antalet API-begäranden överskrider dessa gränser begränsas begäranden. Så här fungerar dessa gränser:

Per resursgräns – Varje resurs, till exempel en virtuell dator (VM), har en specifik gräns för API-begäranden. Anta till exempel att en användare skapar 10 virtuella datorer i en prenumeration. Användaren kan anropa upp till 12 uppdateringsbegäranden för varje virtuell dator på en minut. Om användaren överskrider gränsen för den virtuella datorn begränsas API-begäranden. Den här gränsen säkerställer att några resurser inte använder prenumerationsnivåns gränser och begränsar andra resurser.
Prenumerationsgräns – Förutom resursgränser finns det en övergripande gräns för antalet API-begäranden för alla resurser i en prenumeration. Alla API-begäranden som överskrider den här gränsen begränsas, oavsett om gränsen för en enskild resurs har nåtts. Låt oss till exempel anta att en användare har 200 virtuella datorer i en prenumeration. Även om användaren har rätt att initiera upp till 12 begäranden om att uppdatera virtuella datorer för varje virtuell dator, är den sammanlagda gränsen för API-begäranden för uppdatering av virtuella datorer begränsad till 1 500 per minut. Alla API-begäranden om uppdatering av virtuella datorer för prenumerationen som överstiger 1 500 begränsas.

Hur fastställer Microsoft Compute begränsningsgränser?

För att fastställa gränserna för varje resurs och prenumeration använder Microsoft Compute Token Bucket Algorithm. Den här algoritmen skapar bucketar för varje gräns och innehåller ett visst antal token i varje bucket. Antalet token i en bucket representerar begränsningsgränsen vid en viss minut.

När resursen skapas i början av begränsningsfönstret fylls bucketen till sin maximala kapacitet. Varje API-begäran som initieras av användaren använder en token. När antalet token tar slut till noll begränsas efterföljande API-begäranden. Bucket fylls på med nya token varje minut med en konsekvent hastighet som kallas Bucket Refill Rate för en resurs och en prenumeration.

Till exempel: Låt oss överväga begränsningsprincipen för API:et för VM-uppdatering som stipulerar en Bucket Refill-hastighet på fyra token per minut och en maximal bucketkapacitet på 12 token. Användaren anropar API-begäran om uppdatering av virtuell dator för en virtuell dator (VM) enligt följande tabell. Inledningsvis fylls bucketen med 12 token i början av begränsningsfönstret. I den fjärde minuten använder användaren alla 12 token, vilket lämnar bucketen tom. I den femte minuten fylls bucketen på med fyra nya token i enlighet med Bucket Refill Rate( Bucket Refill Rate). Fyra API-begäranden kan därför göras under den femte minuten, medan Microsoft Compute begränsar en API-begäran på grund av otillräckliga token.

(min)	1:a	2.00	Tredje	4:e	5:e	6:e
Antal token i början (A)	12	12	8	12	4	4
Begäranden per minut (B)	0	8	0	13	5	0
Begränsade begäranden (C)	0	0	0	1	1	0
Återstående token i slutet av perioden D = Max(A-B, 0)	12	4	8	0	0	4

Liknande process följs för att fastställa begränsningsgränserna på prenumerationsnivå. I följande avsnitt beskrivs bucketens påfyllningshastighet och maximal bucketkapacitet som används för att fastställa begränsningsgränser för virtuella datorer, vm-skalningsuppsättningar och virtuella datorers skalningsuppsättningar.

Begränsningsgränser för virtuella datorer

API-begäranden för virtuella datorer kategoriseras i sju olika principer. Varje princip har sina egna gränser, beroende på hur resursintensiva API-begäranden under principen är. Följande tabell innehåller en omfattande lista över dessa principer, motsvarande REST-API:er och deras respektive begränsningsgränser:

Principkategori	REST API:er	Resursnivå	Resursnivå	Prenumerationsnivå	Prenumerationsnivå
		Bucketpåfyllningshastighet (per min)	Maximal bucketkapacitet (Per min)	Bucketpåfyllningshastighet (Per min)	Maximal bucketkapacitet (Per min)
Placera virtuell dator (Skapa nya virtuella datorer)	Skapa	4	12	500	1 500
Uppdatera virtuell dator (Uppdatera befintliga virtuella datorer)	Uppdatering Starta om igen Stäng av Start Generalisera Konvertera till hanterade diskar Omdistribuera Utföra underhåll Fånga Kör kommando Skapa eller uppdatera Tillägg – Uppdatera Tillägg – Ta bort Reimage Uppdatering Kör kommandon – Uppdatera Kör kommandon – Ta bort Kör kommandon – Skapa eller uppdatera	4	12	500	1 500
Ta bort virtuell dator (Ta bort virtuella datorer)	Ta bort Simulera avlägsnande Frigör	4	12	500	1 500
Hämta virtuell dator med låg kostnad (Hämta information om en enskild virtuell dator)	Hämta Instansvy Tillägg – Hämta Lista tillgängliga storlekar Hämta startdiagnostikdata Kör kommandon – Hämta efter virtuell dator Kör kommandon – lista efter virtuell dator	12	36	8,000	24,000
Hög kostnad Hämta virtuell dator¹ (Hämta information om flera virtuella datorer)	Lista Visa en lista över alla Lista efter plats	Inte tillämpligt	Inte tillämpligt	300	900
Hämta åtgärd (Hämta information om asynkrona VM-åtgärder)	Status för asynkrona åtgärder	15	45	5 000	15 000
Åtgärder för vm-gästkorrigering (Utvärdera och installera gästkorrigeringar)	Utvärdera korrigeringar Installera korrigeringar	2	6	200	600

¹ Endast principer på prenumerationsnivå gäller.

Begränsningsgränser för VM-skalningsuppsättningar

API-begäranden för VM-skalningsuppsättningar (uniform och flex) kategoriseras i 5 distinkta principer. Varje princip har sina egna gränser, beroende på hur resursintensiva API-begäranden under principen är. Dessa principer gäller för både Flex- och Uniform-orkestreringslägen. Följande tabell innehåller en omfattande lista över dessa principer, motsvarande REST-API:er och deras respektive begränsningsgränser:

Principkategori	REST API:er	Resursnivå	Resursnivå	Prenumerationsnivå	Prenumerationsnivå
		Bucketpåfyllningshastighet (Per min)	Maximal bucketkapacitet (Per min)	Bucketpåfyllningshastighet (per min)	Maximal bucketkapacitet (Per min)
Placera (Skapa ny skalningsuppsättning)	Skapa	4	12	125	375
Uppdatera (Uppdatera befintlig skalningsuppsättning)	Uppdatering Start² Starta om² Distribuera om² Utföra underhåll² ^{Återskapa 2} Ändra storlek på alla² Skapa eller uppdatera Löpande uppgraderingar – Avbryt Tillägg – Skapa Tillägg – Uppdatera Tillägg – Ta bort Force Recovery Service Fabric Platform Update Domain Walk Konvertera till en placeringsgrupp Ange orkestreringstjänsttillstånd	4	12	500	1 500
Delete (Ta bort skalningsuppsättning)	Ta bort Ström av² Frigör	4	12	175	525
Låg kostnad hämta (Hämta information om en skalningsuppsättning)	Hämta Lista sku:er Löpande uppgraderingar – Hämta senaste Hämta historik för operativsystemuppgradering	12	36	800	2,400
Hög kostnad hämta (Hämta resursintensiv information)	Hämta instansvy Lista² Lista alla² Lista efter plats²	10	30	360	1,080

² Endast principer på prenumerationsnivå gäller.

Begränsningsgränser för virtuella datorskalningsuppsättningar för virtuella datorer

API-begäranden för virtuella datorskalningsuppsättningar Virtuella datorer kategoriseras i tre olika principer. Varje princip har sina egna gränser, beroende på hur resursintensiva API-begäranden under principen är. Följande tabell innehåller en omfattande lista över dessa principer, motsvarande REST-API:er och deras respektive begränsningsgränser:

Principkategori	REST API:er	Resursnivå	Resursnivå	Prenumerationsnivå	Prenumerationsnivå
		Bucketpåfyllningshastighet (Per min)	Maximal bucketkapacitet (Per min)	Bucketpåfyllningshastighet (Per min)	Maximal bucketkapacitet (Per min)
Uppdatera virtuella datorer för skalningsuppsättning (Uppdatera befintliga virtuella datorer i en skalningsuppsättning)	Start Starta om Reimage ReimageAll Uppdatering SimulateEviction Tillägg – Skapa eller uppdatera RunCommands – Skapa eller uppdatera RunCommands – Uppdatera	4	12	500	1 500
Ta bort virtuella skalningsuppsättningar (Ta bort virtuella skalningsuppsättningar)	Ta bort PowerOff Frigör Tillägg – Ta bort RunCommands – Ta bort	4	12	500	1 500
Hämta virtuella datorer för skalningsuppsättning (Hämta information om virtuella skalningsuppsättningsdatorer)	Hämta GetInstance-vy Tillägg – Hämta RunCommands – Hämta RetrieveBoot-diagnostikdata	12	36	2 000	6 000

Felsökningsriktlinjer

Om användarna fortfarande står inför utmaningar på grund av beräkningsbegränsning kan du läsa Felsöka begränsningsfel i Azure – Virtuella datorer. Den innehåller information om hur du felsöker begränsningsproblem och metodtips för att undvika begränsning.

Vanliga frågor och svar

Krävs det någon åtgärd från användarna?

Användarna behöver inte ändra något i sin konfiguration eller sina arbetsbelastningar. Alla befintliga API:er fortsätter att fungera som de är.

Vilka fördelar ger begränsningsprinciperna?

Begränsningsprinciperna har flera fördelar:

Alla beräkningsresurser har ett enhetligt fönster på 1 min. Användare kan anropa API-anrop, 1 min när de har begränsats.
Ingen enskild resurs kan använda upp alla gränser under en prenumeration eftersom gränser definieras på resursnivå.
Microsoft Compute introducerar en ny algoritm, Token Bucket Algorithm, för att fastställa gränserna. Algoritmen ger extra buffert till kunderna, samtidigt som ett stort antal API-begäranden görs.

Får kunden en avisering när de är på väg att nå sina begränsningsgränser?

Som en del av varje svar returnerar Microsoft Compute x-ms-ratelimit-remaining-resource som kan användas för att fastställa begränsningsgränserna mot principerna. En lista över tillämpliga begränsningsprinciper returneras som ett svar på informationshuvuden för samtalsfrekvens.

Dela via