Servicequota en -limieten
Deze inhoud is van toepassing op:v2.1 | Nieuwste versie:
v4.0 (GA)
Dit artikel bevat zowel een beknopt overzicht als een gedetailleerde beschrijving van de Quota's en limieten van de Azure AI Document Intelligence-service voor alle prijscategorieën. Het bevat ook enkele aanbevolen procedures om aanvraagbeperking te voorkomen.
Modelgebruik
Ondersteunde documenttypen | Read | Indeling | Vooraf samengestelde modellen | Aangepaste modellen | Mogelijkheden voor invoegtoepassingen |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Afbeeldingen: JPEG/JPG , PNG , BMP , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = ondersteund ✖️ = Niet ondersteund
Voor Document Intelligence v4.0 2024-11-30
(GA) worden pagina- en regelfuncties ondersteund met de volgende beperkingen:
- Hoek, breedte/hoogte en eenheid worden niet ondersteund.
- Voor elk gedetecteerd object worden begrenzings- of begrenzingsregio's niet ondersteund.
- Paginabereik (
pages
) wordt niet ondersteund als parameter. - Het
lines
object wordt niet ondersteund.
Ondersteunde documenttypen | Read | Indeling | Vooraf samengestelde modellen | Aangepaste modellen |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Afbeeldingen: JPEG/JPG , PNG , BMP , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = ondersteund ✖️ = Niet ondersteund
Billing
Document Intelligence-facturering wordt maandelijks berekend op basis van het modeltype en het aantal geanalyseerde pagina's. U vindt metrische gegevens over gebruik op het dashboard met metrische gegevens in Azure Portal. In het dashboard wordt het aantal pagina's weergegeven dat door Azure AI Document Intelligence wordt verwerkt. U kunt de geschatte kosten voor de resource controleren met behulp van de Azure-prijscalculator. Zie Gebruik controleren en kosten schatten voor gedetailleerde instructies. Hier volgen enkele details:
Wanneer u een document verzendt voor analyse, analyseert de service alle pagina's, tenzij u een paginabereik opgeeft met behulp van de
pages
parameter in uw aanvraag. Wanneer de service Microsoft Excel- en PowerPoint-documenten analyseert via het lees-, OCR- of indelingsmodel, wordt elke Excel-werkblad en PowerPoint-dia als één pagina geteld.Wanneer de service PDF- en TIFF-bestanden analyseert, wordt elke pagina in het PDF-bestand of elke afbeelding in het TIFF-bestand geteld als één pagina zonder maximale tekenlimieten.
Wanneer de service Microsoft Word- en HTML-bestanden analyseert die door de lees- en indelingsmodellen worden ondersteund, worden pagina's in blokken van elk 3000 tekens geteld. Als uw document bijvoorbeeld 7000 tekens bevat, worden de twee pagina's met elk 3000 tekens en één pagina met 1000 tekens opgetellen tot een totaal van drie pagina's.
De lees- en indelingsmodellen bieden geen ondersteuning voor analyse van ingesloten of gekoppelde afbeeldingen in Microsoft Word-, Excel-, PowerPoint- en HTML-bestanden. Daarom telt de service ze niet als toegevoegde installatiekopieën.
Het trainen van een aangepast model is altijd gratis met Document Intelligence. Er worden alleen kosten in rekening gebracht wanneer de service een model gebruikt om een document te analyseren.
Containerprijzen zijn hetzelfde als de prijzen van cloudservices.
Document Intelligence biedt een gratis laag (F0) waar u alle functies van Document Intelligence kunt testen. De limieten voor de gratis laag analyseren alleen reacties op de eerste twee pagina's in een aanvraag.
Document Intelligence heeft een prijsmodel op basis van toezeggingen voor grote workloads.
Het indelingsmodel is vereist voor het genereren van labels voor uw gegevensset voor aangepaste training. Als de gegevensset die u gebruikt voor aangepaste training geen labelbestanden beschikbaar heeft, genereert de service deze voor u en factureert u voor het gebruik van het indelingsmodel.
Quotum | Gratis (F0)1 | Standard (S0) |
---|---|---|
Limiet voor transacties per seconde analyseren | 1 | 15 (standaardwaarde) |
Verstelbaar | Nee | Ja 2 |
Limiet voor bewerkingen per seconde ophalen | 1 | 50 (standaardwaarde) |
Verstelbaar | Nee | Ja 2 |
Limiet voor modelbeheerbewerkingen per seconde | 1 | 5 (standaardwaarde) |
Verstelbaar | Nee | Ja 2 |
Limiet voor lijstbewerkingen per seconde | 1 | 10 (standaardwaarde) |
Verstelbaar | Nee | Ja 2 |
Maximale documentgrootte | 4 MB | 500 MB |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (analyse) | 2 | 2000 |
Verstelbaar | Nee | Nr. |
Maximale grootte van labelsbestand | 10 MB | 10 MB |
Verstelbaar | Nee | Nr. |
Maximale grootte van OCR json-antwoord | 500 MB | 500 MB |
Verstelbaar | Nee | Nr. |
Maximum aantal sjabloonmodellen | 500 | 5000 |
Verstelbaar | Nee | Nr. |
Maximum aantal neurale modellen | 100 | 500 |
Verstelbaar | Nee | Nr. |
Aangepast modelgebruik
Quotum | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Limiet voor opstellen model | 5 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Neurale en Generatieve | 1 GB 3 | 1 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Sjabloon | 50 MB 4 | 50 MB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * sjabloon | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * Neurale en Generatieve | 50,000 | 50.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Aangepaste neurale model trainen | 10 uur per maand 5 | geen limiet (betalen per uur), beginnen met 10 gratis uren per maand |
Verstelbaar | Nee | Ja 3 |
Maximum aantal pagina's (training) * Classificatie | 10,000 | 10.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal documenttypen (klassen) * Classificatie | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Classificatie | 1 GB | 2 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Minimum aantal steekproeven per klasse * Classificatie | 5 | 5 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Aangepast modelgebruik
Quotum | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Limiet voor opstellen model | 5 | 200 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Neuraal | 1 GB 3 | 1 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Sjabloon | 50 MB 4 | 50 MB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * sjabloon | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * Neurale | 50,000 | 50.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Aangepaste neurale model trainen | 10 per maand | 20 per maand |
Verstelbaar | Nee | Ja 3 |
Maximum aantal pagina's (training) * Classificatie | 10,000 | 10.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal documenttypen (klassen) * Classificatie | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Classificatie | 1 GB | 1 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Minimum aantal steekproeven per klasse * Classificatie | 5 | 5 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Aangepast modelgebruik
Quotum | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Limiet voor opstellen model | 5 | 200 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Neuraal | 1 GB 3 | 1 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Sjabloon | 50 MB 4 | 50 MB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * sjabloon | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * Neurale | 50,000 | 50.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Aangepaste neurale model trainen | 10 per maand | 20 per maand |
Verstelbaar | Nee | Ja 3 |
Maximum aantal pagina's (training) * Classificatie | 10,000 | 10.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal documenttypen (klassen) * Classificatie | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Classificatie | 1 GB | 1 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Minimum aantal steekproeven per klasse * Classificatie | 5 | 5 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Limieten voor aangepaste modellen
Quotum | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Limiet voor opstellen model | 5 | 200 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset | 50 MB | 50 MB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
1 Prijscategorie Gratis (F0) zie ook maandelijkse vergoedingen op de pagina met prijzen.
2 Zie best practices en aanpassingsinstructies.
3 Trainingsaantal neurale modellen wordt elke kalendermaand opnieuw ingesteld. Open een ondersteuningsaanvraag om de maandelijkse trainingslimiet te verhogen. Vanaf de v4.0-API worden trainingsaanvragen van meer dan 20 aanvragen in een kalendermaand gefactureerd op de trainingslaag. Zie prijzen voor meer informatie.
4 Deze limiet geldt voor alle documenten in uw map met trainingsgegevenssets voordat er updates met betrekking tot labels worden bijgewerkt.
5 Deze limiet geldt alleen voor
v 4.0 (2024-11-30 GA)
aangepaste neurale modellen.v 4.0
Vanaf 10 uur ondersteunen we het trainen van grotere documenten voor langere duur (maximaal 10 uur gratis en worden er kosten in rekening gebracht). Raadpleeg de pagina aangepast neuraal model voor meer informatie.
Gedetailleerde beschrijving, quotaaanpassing en best practices
De standaardlimieten kunnen worden verlengd door een verhoging aan te vragen via een ondersteuningsticket. Voordat u een quotumverhoging aanvraagt (indien van toepassing), moet u controleren of het noodzakelijk is. De Document Intelligence-service maakt gebruik van automatisch schalen om de vereiste rekenbronnen on-demand
te brengen, de klantkosten laag te houden en ongebruikte resources ongedaan te maken door een overmatige hoeveelheid hardwarecapaciteit niet te onderhouden.
Als uw toepassing antwoordcode 429 (te veel aanvragen) retourneert, overschrijdt u de drempelwaarde voor een of meer transacties per secondelimiet (TPS):
- Transacties per seconde analyseren De TPS voor het verzenden van analyseaanvragen (POST)
- Bewerkingen per seconde ophalen De TPS voor polling voor resultaten bij analysebewerkingen (GET)
- Modelbeheerbewerkingen per seconde beperken bewerkingen met betrekking tot modelbeheer, zoals bouwen/trainen en kopiëren.
- Bewerkingen per seconde weergeven met betrekking tot het weergeven van modellen, bewerkingen.
Algemene aanbevolen procedures om beperking tijdens automatisch schalen te beperken
Als u problemen met betrekking tot beperking wilt minimaliseren (antwoordcode 429), raden we u aan de volgende technieken te gebruiken:
- Logica implementeren voor opnieuw proberen in uw toepassing
- Vermijd grote wijzigingen in de workload. De workload geleidelijk verhogen
Voorbeeld. Uw toepassing gebruikt Document Intelligence en uw huidige workload is 10 TPS (transacties per seconde). De volgende seconde verhoogt u de belasting tot 40 TPS. Het resultaat is een 429-antwoordcode voor sommige aanvragen omdat u de limiet van 15 TPS overschrijdt voor het verzenden van analysebewerkingen. U kunt de verwerking uitschakelen om onder de 15 TPS te blijven of een verhoging van de TPS aanvragen om uw hogere volumes te ondersteunen.
In de volgende secties worden specifieke gevallen beschreven van het aanpassen van quota. Ga naar Document Intelligence: limiet voor gelijktijdige aanvragen verhogen
Limiet voor transacties per seconde aanvragen verhogen
Standaard is het aantal transacties per seconde beperkt tot 15 transacties per seconde voor een documentanalyseresource. Voor de prijscategorie Standard kan dit aantal worden verhoogd. Voordat u de aanvraag indient, moet u ervoor zorgen dat u bekend bent met het materiaal in deze sectie en op de hoogte bent van deze aanbevolen best practices.
De eerste stap is om automatisch schalen in te schakelen. Volg dit document om automatisch schalen in te schakelen voor uw resource * automatisch schalen in te schakelen. Als automatisch schalen is ingeschakeld, kan uw resource aanvragen blijven accepteren via de TPS-limieten die zijn geconfigureerd als er capaciteit op de service is. Dit kan nog steeds leiden tot een beperking van de aanvraag.
Het verhogen van de limiet voor gelijktijdige aanvragen heeft geen directe invloed op uw kosten. Document Intelligence-service maakt gebruik van het model 'Alleen betalen voor wat u gebruikt'. De limiet bepaalt hoe hoog de service kan worden geschaald voordat uw aanvragen worden beperkt.
De bestaande waarde van verschillende aanvraaglimietcategorieën is beschikbaar via Azure Portal, onder het tabblad Bewaking op de blade Resourceoverzicht.
Ondersteuningsaanvraag voor TPS-verhoging maken en indienen
Initieer de verhoging van de limiet voor transacties per seconde (TPS) voor uw resource door de ondersteuningsaanvraag in te dienen:
- Meld u aan bij het Azure Portal
- Selecteer de Document Intelligence-resource waarvoor u de TPS-limiet wilt verhogen
- Selecteer -Nieuwe ondersteuningsaanvraag- (-Ondersteuning en probleemoplossing- groep). Er wordt een nieuw venster weergegeven met automatisch ingevulde informatie over uw Azure-abonnement en Azure-resource
- Voer -Samenvatting in (zoals 'TPS-limiet voor documentinformatie verhogen')
- Selecteer Quotum of gebruiksvalidatie voor het veld probleemtype.
- Selecteer -Volgende: Oplossingen-
- Ga verder met het maken van de aanvraag
- Voer de volgende informatie in het veld -Description- in, onder het tabblad Details:
- een opmerking: de aanvraag gaat over het quotum voor documentinformatie.
- Geef een TPS-verwachting die u wilt schalen om te voldoen. Hoewel TPS-verhogingen gratis zijn, moet u alleen een TPS aanvragen die redelijk is voor uw workload.
- Azure-resourcegegevens
- Voltooi het invoeren van de vereiste gegevens en selecteer de knop -Maken in -Beoordelen en maken- tabblad
- Noteer het nummer van de ondersteuningsaanvraag in Azure Portal-meldingen. Zoek naar ondersteuning om binnenkort contact met u op te nemen voor verdere verwerking.
Voorbeeld van een best practice voor een workloadpatroon
In dit voorbeeld wordt de aanbevolen aanpak te volgen om mogelijke aanvraagbeperking te beperken omdat automatische schaalaanpassing wordt uitgevoerd. Het is geen exact recept, maar slechts een sjabloon die we nodig hebben om te volgen en aan te passen.
Stel dat voor een Document Intelligence-resource de standaardlimiet is ingesteld. Start de workload om uw analyseaanvragen in te dienen. Als u merkt dat u regelmatig beperkingen ondervindt met antwoordcode 429 bij het controleren op voltooiing, begint u met het implementeren van een exponentiële uitstel op de GET-antwoordaanvraag. Door een geleidelijk langere wachttijd te gebruiken tussen nieuwe pogingen voor opeenvolgende foutreacties, bijvoorbeeld een 2-5-13-34-patroon van vertragingen tussen aanvragen. Over het algemeen raden we aan om het antwoord voor een analyse meer dan één keer per 2 seconden aan te roepen voor een bijbehorende POST-aanvraag. Het analyze
antwoord bevat ook een header voor opnieuw proberen die aangeeft hoe lang u in seconden moet wachten voordat u controleert op voltooiing van die aanvraag.
Als u merkt dat u wordt beperkt tot het aantal POST-aanvragen voor documenten dat wordt ingediend, kunt u overwegen om een vertraging tussen de aanvragen toe te voegen. Als uw workload een hogere mate van gelijktijdige verwerking vereist, moet u vervolgens een ondersteuningsaanvraag maken om uw servicelimieten voor transacties per seconde te verhogen.
Over het algemeen raden we u aan om de workload en de workloadpatronen te testen voordat u naar productie gaat.