Kvoter och begränsningar för tjänsten
Det här innehållet gäller för:v2.1 | Senaste version:
v4.0 (GA)
Den här artikeln innehåller både en snabbreferens och en detaljerad beskrivning av kvoter och gränser för Azure AI Document Intelligence-tjänsten för alla prisnivåer. Den innehåller också några metodtips för att undvika begränsning av begäranden.
Modellanvändning
Dokumenttyper som stöds | Lästa | Layout | Inbyggda modeller | Anpassade modeller | Tilläggsfunktioner |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = stöds ✖️ = stöds inte
För Document Intelligence v4.0 2024-11-30
(GA) har stöd för sid- och linjefunktioner med följande begränsningar:
- Vinkel, bredd/höjd och enhet stöds inte.
- För varje objekt som identifieras stöds inte avgränsning av polygon- eller avgränsningsregioner.
- Sidintervall (
pages
) stöds inte som en parameter. - Objektet
lines
stöds inte.
Dokumenttyper som stöds | Lästa | Layout | Inbyggda modeller | Anpassade modeller |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = stöds ✖️ = stöds inte
Fakturering
Fakturering av dokumentinformation beräknas varje månad baserat på modelltypen och antalet sidor som analyseras. Du hittar användningsstatistik på instrumentpanelen för mått i Azure Portal. Instrumentpanelen visar antalet sidor som Azure AI Document Intelligence bearbetar. Du kan kontrollera den uppskattade kostnaden för resursen med hjälp av Priskalkylatorn för Azure. Detaljerade anvisningar finns i Kontrollera användning och beräkna kostnader. Här följer några detaljer:
När du skickar ett dokument för analys analyserar tjänsten alla sidor såvida du inte anger ett sidintervall med hjälp av parametern
pages
i din begäran. När tjänsten analyserar Microsoft Excel- och PowerPoint-dokument via läs-, OCR- eller layoutmodellen räknas varje Excel-kalkylblad och PowerPoint-bild som en sida.När tjänsten analyserar PDF- och TIFF-filer räknas varje sida i PDF-filen eller varje bild i TIFF-filen som en sida utan maximala teckengränser.
När tjänsten analyserar Microsoft Word- och HTML-filer som läs- och layoutmodellerna stöder räknar den sidor i block med 3 000 tecken vardera. Om dokumentet till exempel innehåller 7 000 tecken blir de två sidorna med 3 000 tecken vardera och en sida med 1 000 tecken upp till totalt tre sidor.
Läs- och layoutmodellerna stöder inte analys av inbäddade eller länkade bilder i Microsoft Word-, Excel-, PowerPoint- och HTML-filer. Därför räknar inte tjänsten dem som tillagda bilder.
Det är alltid kostnadsfritt att träna en anpassad modell med Dokumentinformation. Avgifter debiteras endast när tjänsten använder en modell för att analysera ett dokument.
Containerpriser är desamma som prissättningen för molntjänster.
Document Intelligence erbjuder en kostnadsfri nivå (F0) där du kan testa alla funktioner för dokumentinformation. Begränsningarna på den kostnadsfria nivån analyserar endast svar på de två första sidorna i en begäran.
Document Intelligence har en åtagandebaserad prismodell för stora arbetsbelastningar.
Layoutmodellen krävs för att generera etiketter för din datauppsättning för anpassad träning. Om den datauppsättning som du använder för anpassad träning inte har etikettfiler tillgängliga, genererar tjänsten dem åt dig och debiterar dig för användning av layoutmodell.
Kvot | Gratis (F0)1 | Standard (S0) |
---|---|---|
Analysera transaktioner per sekund-gräns | 1 | 15 (standardvärde) |
Justerbar | Nej | Ja 2 |
Hämta åtgärder per sekund | 1 | 50 (standardvärde) |
Justerbar | Nej | Ja 2 |
Modellhanteringsåtgärder per sekund | 1 | 5 (standardvärde) |
Justerbar | Nej | Ja 2 |
Lista åtgärder per sekund gräns | 1 | 10 (standardvärde) |
Justerbar | Nej | Ja 2 |
Maximal dokumentstorlek | 4 MB | 500 MB |
Justerbar | Nej | Nej |
Maximalt antal sidor (analys) | 2 | 2000 |
Justerbar | Nej | Nej |
Maximal storlek på etikettfilen | 10 MB | 10 MB |
Justerbar | Nej | Nej |
Maximal storlek på OCR json-svar | 500 MB | 500 MB |
Justerbar | Nej | Nej |
Maximalt antal mallmodeller | 500 | 5000 |
Justerbar | Nej | Nej |
Maximalt antal neurala modeller | 100 | 500 |
Justerbar | Nej | Nej |
Användning av anpassad modell
Kvot | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Skriv modellgräns | 5 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Neural och Generativ | 1 GB 3 | 1 GB (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Mall | 50 MB 4 | 50 MB (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * mall | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * Neurala och generativa | 50,000 | 50 000 (standardvärde) |
Justerbar | Nej | Nej |
Träna anpassad neural modell | 10 timmar per månad 5 | ingen gräns (betala per timme), börja med 10 lediga timmar varje månad |
Justerbar | Nej | Ja 3 |
Maximalt antal sidor (träning) * Klassificerare | 10,000 | 10 000 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal dokumenttyper (klasser) * Klassificerare | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Klassificerare | 1 GB | 2 GB (standardvärde) |
Justerbar | Nej | Nej |
Minsta antal exempel per klass * Klassificerare | 5 | 5 (standardvärde) |
Justerbar | Nej | Nej |
Användning av anpassad modell
Kvot | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Skriv modellgräns | 5 | 200 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Neural | 1 GB 3 | 1 GB (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Mall | 50 MB 4 | 50 MB (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * mall | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * Neuralt | 50,000 | 50 000 (standardvärde) |
Justerbar | Nej | Nej |
Träna anpassad neural modell | 10 per månad | 20 per månad |
Justerbar | Nej | Ja 3 |
Maximalt antal sidor (träning) * Klassificerare | 10,000 | 10 000 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal dokumenttyper (klasser) * Klassificerare | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Klassificerare | 1 GB | 1 GB (standardvärde) |
Justerbar | Nej | Nej |
Minsta antal exempel per klass * Klassificerare | 5 | 5 (standardvärde) |
Justerbar | Nej | Nej |
Användning av anpassad modell
Kvot | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Skriv modellgräns | 5 | 200 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Neural | 1 GB 3 | 1 GB (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Mall | 50 MB 4 | 50 MB (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * mall | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * Neuralt | 50,000 | 50 000 (standardvärde) |
Justerbar | Nej | Nej |
Träna anpassad neural modell | 10 per månad | 20 per månad |
Justerbar | Nej | Ja 3 |
Maximalt antal sidor (träning) * Klassificerare | 10,000 | 10 000 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal dokumenttyper (klasser) * Klassificerare | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Klassificerare | 1 GB | 1 GB (standardvärde) |
Justerbar | Nej | Nej |
Minsta antal exempel per klass * Klassificerare | 5 | 5 (standardvärde) |
Justerbar | Nej | Nej |
Anpassade modellgränser
Kvot | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Skriv modellgräns | 5 | 200 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning | 50 MB | 50 MB (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
1 Prisnivån Kostnadsfri (F0) finns även månadsbidrag på prissidan.
2 Se metodtips och justeringsinstruktioner.
3 Träningsantalet neurala modeller återställs varje kalendermånad. Öppna en supportbegäran för att öka den månatliga träningsgränsen. Från och med v4.0-API:et debiteras träningsbegäranden över 20 begäranden under en kalendermånad på träningsnivån. Mer information finns i priser .
4 Den här gränsen gäller för alla dokument som finns i mappen för träningsdatauppsättningen före eventuella etiketteringsrelaterade uppdateringar.
5 Den här gränsen gäller endast för
v 4.0 (2024-11-30 GA)
anpassade neurala modeller.v 4.0
Från och med stöder vi utbildning av större dokument under längre perioder (upp till 10 timmar utan kostnad och avgifter efter). Mer information finns på sidan anpassad neural modell.
Detaljerad beskrivning, kvotjustering och metodtips
Standardgränserna kan utökas genom att begära en ökning via ett supportärende. Innan du begär en kvotökning (om tillämpligt) kontrollerar du att det är nödvändigt. Document Intelligence-tjänsten använder automatisk skalning för att ta med de nödvändiga beräkningsresurserna on-demand
, hålla kundkostnaderna låga och avetablera oanvända resurser genom att inte upprätthålla en alltför stor mängd maskinvarukapacitet.
Om ditt program returnerar svarskod 429 (för många begäranden) överskrider du tröskelvärdet för en eller flera av transaktionerna per sekunds gränser (TPS):
- Analysera transaktioner per sekund gränsen TPS för att skicka analysera begäranden (POST)
- Hämta åtgärder per sekund gränsen TPS för avsökning för resultat på analysåtgärder (GET)
- Modellhanteringsåtgärder per sekund begränsar åtgärder relaterade till modellhantering som build/train och copy.
- Lista åtgärder per sekund gräns Åtgärder som rör listning av modeller, åtgärder.
Allmänna metodtips för att minska begränsningen vid automatisk skalning
För att minimera problem relaterade till begränsning (svarskod 429) rekommenderar vi att du använder följande tekniker:
- Implementera logik för omprövning i ditt program
- Undvik stora plötsliga ändringar i arbetsbelastningen. Öka arbetsbelastningen gradvis
Exempel. Ditt program använder Dokumentinformation och din aktuella arbetsbelastning är 10 TPS (transaktioner per sekund). Nästa sekund ökar du belastningen till 40 TPS. Resultatet är en 429-svarskod för vissa begäranden eftersom du överskrider gränsen på 15 TPS för att skicka analysåtgärder. Du kan antingen backa från bearbetningen för att hålla dig under 15 TPS eller begära en ökning av TPS för att stödja dina högre volymer.
I nästa avsnitt beskrivs specifika fall av justering av kvoter. Hoppa till Dokumentinformation: öka gränsen för samtidiga begäranden
Öka gränsen för begäranden per sekund
Som standard är antalet transaktioner per sekund begränsat till 15 transaktioner per sekund för en Document Intelligence-resurs. För prisnivån Standard kan antalet ökas. Innan du skickar begäran ska du se till att du är bekant med materialet i det här avsnittet och känner till de här metodtipsen.
Knytnävesteget skulle vara att aktivera automatisk skalning. Följ det här dokumentet om du vill aktivera automatisk skalning på resursen * aktivera automatisk skalning. Med automatisk skalning aktiverad kan resursen fortsätta att acceptera begäranden över de TPS-gränser som konfigurerats om det finns kapacitet för tjänsten. Det kan fortfarande leda till att begäran begränsas.
Att öka gränsen för samtidig begäran påverkar inte dina kostnader direkt. Document Intelligence Service använder modellen "Betala endast för det du använder". Gränsen definierar hur högt tjänsten kan skalas innan den börjar begränsa dina begäranden.
Det befintliga värdet för olika kategorier för begäranden är tillgängligt via Azure Portal, under fliken Övervakning på bladet Resursöversikt.
Skapa och skicka supportbegäran för TPS-ökning
Initiera ökningen av transaktioner per sekund (TPS) för din resurs genom att skicka supportbegäran:
- Logga in på Azure-portalen
- Välj den dokumentinformationsresurs som du vill öka TPS-gränsen för
- Välj -New support request- (-Support + troubleshooting- group). Ett nytt fönster visas med information som fylls i automatiskt om din Azure-prenumeration och Azure-resurs
- Ange -Summary – (t.a. "Öka TPS-gränsen för dokumentinformation")
- Välj "Kvot- eller användningsverifiering" för fältet problemtyp.
- Välj -Next: Solutions-
- Fortsätt med att skapa begäran
- Ange följande information i fältet -Description- under fliken Information:
- en anteckning om att begäran handlar om kvot för dokumentinformation.
- Ange en TPS-förväntan som du vill skala för att uppfylla. Även om TPS-ökningar är kostnadsfria bör du bara begära en TPS som är rimlig för din arbetsbelastning.
- Azure-resursinformation
- Slutför inmatningen av nödvändig information och välj knappen -Create- i fliken Granska + skapa
- Anteckna numret för supportbegäran i Azure Portal-meddelanden. Leta efter support för att kontakta dig inom kort för vidare bearbetning.
Exempel på metodtips för arbetsbelastningsmönster
I det här exemplet visas den metod som vi rekommenderar för att minimera eventuell begränsning av begäranden på grund av att automatisk skalning pågår. Det är inte ett exakt recept, utan bara en mall som vi bjuder in att följa och justera efter behov.
Låt oss anta att en dokumentinformationsresurs har standardgränsen inställd. Starta arbetsbelastningen för att skicka dina analysbegäranden. Om du upptäcker att du ser frekventa begränsningar med svarskod 429 när du söker efter slutförande börjar du med att implementera en exponentiell backoff på get-analyssvarsbegäran. Genom att använda en progressivt längre väntetid mellan återförsök för efterföljande felsvar, till exempel ett 2-5-13-34 mönster av fördröjningar mellan begäranden. I allmänhet rekommenderar vi att du inte anropar svaret get analyze mer än en gång var 2:e sekund för en motsvarande POST-begäran. Svaret analyze
innehåller också ett återförsökshuvud som anger hur länge du ska vänta i sekunder innan du kontrollerar att begäran har slutförts.
Om du upptäcker att du begränsas av antalet POST-begäranden för dokument som skickas kan du överväga att lägga till en fördröjning mellan begäranden. Om din arbetsbelastning kräver en högre grad av samtidig bearbetning måste du skapa en supportbegäran för att öka tjänstgränserna för transaktioner per sekund.
I allmänhet rekommenderar vi att du testar arbetsbelastningen och arbetsbelastningsmönstren innan du går till produktion.