Quote e limiti del servizio

Articolo
01/15/2025

Questo contenuto si applica a:v4.0 (GA) | Versioni precedenti: v3.1 (GA) v3.0 (GA)

Questo contenuto si applica a:versione 2.1 | più recente:v4.0 (GA)

Questo articolo contiene un riferimento rapido e una descrizione dettagliata delle quote e dei limiti del servizio Informazioni sui documenti di Azure AI per tutti i piani tariffari. Include anche alcune procedure consigliate per evitare la limitazione delle richieste.

Uso dei modelli

Tipi di documento supportati	Lettura	Layout	Modelli predefiniti	Modelli personalizzati	Funzionalità dei componenti aggiuntivi
PDF	✔️	✔️	✔️	✔️	✔️
Immagini: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = supportato ✖️ = non supportato

Per Document Intelligence v4.0 2024-11-30 (GA) supporta le funzionalità di pagina e riga con le restrizioni seguenti:

Angolo, larghezza/altezza e unità non sono supportati.
Per ogni oggetto rilevato, i poligoni di delimitazione o le aree di delimitazione non sono supportati.
L'intervallo di pagine (pages) non è supportato come parametro.
L'oggetto lines non è supportato.

Tipi di documento supportati	Lettura	Layout	Modelli predefiniti	Modelli personalizzati
PDF	✔️	✔️	✔️	✔️
Immagini: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = supportato ✖️ = non supportato

Fatturazione

La fatturazione di Informazioni sui documenti viene calcolata mensilmente in base al tipo di modello e al numero di pagine analizzate. È possibile trovare le metriche di utilizzo nel dashboard delle metriche del portale di Azure. Il dashboard visualizza il numero di pagine elaborate da Informazioni sui documenti di Azure AI. È possibile controllare il costo stimato speso per la risorsa usando il Calcolatore dei prezzi di Azure. Per istruzioni dettagliate, vedere Controllare l'utilizzo e stimare il costo. Ecco alcune informazioni:

Quando si invia un documento per l'analisi, il servizio analizza tutte le pagine a meno che non si specifichi un intervallo di pagine usando il parametro pages nella richiesta. Quando il servizio analizza i documenti di Microsoft Excel e PowerPoint tramite il modello di lettura, OCR o layout, conta ogni foglio di lavoro di Excel e diapositiva di PowerPoint come una pagina.
Quando il servizio analizza i file PDF e TIFF, conta ogni pagina nel file PDF o ogni immagine nel file TIFF come una pagina senza limiti massimi di caratteri.
Quando il servizio analizza i file HTML e di Microsoft Word supportati dai modelli di lettura e layout, conta le pagine in blocchi di 3.000 caratteri ciascuno. Ad esempio, se il documento contiene 7.000 caratteri, vengono conteggiate le due pagine con 3.000 caratteri ciascuno e una pagina con 1.000 caratteri, fino a un totale di tre pagine.
I modelli di lettura e layout non supportano l'analisi delle immagini incorporate o collegate nei file Microsoft Word, Excel, PowerPoint e HTML. Di conseguenza, il servizio non li conta come immagini aggiunte.
Il training di un modello personalizzato è sempre gratuito con Informazioni sui documenti. L'addebito viene effettuato solo quando il servizio usa un modello per analizzare un documento.
I prezzi dei contenitori corrispondono ai prezzi dei servizi cloud.
Informazioni sui documenti offre un livello gratuito (F0) in cui è possibile testare tutte le funzionalità di Informazioni sui documenti. I limiti del livello gratuito analizzano la risposta solo alle prime due pagine di una richiesta.
Informazioni sui documenti ha un modello di determinazione dei prezzi basato sull'impegno per carichi di lavoro di grandi dimensioni.
Il modello Layout è necessario per generare etichette per il set di dati per il training personalizzato. Se il set di dati usato per il training personalizzato non dispone di file di etichetta disponibili, il servizio li genera automaticamente ed effettua l’addebito per l’utilizzo del modello di layout.

Obiettivo di vendita	Gratuito (F0)¹	Standard (S0)
Analizzare il limite di transazioni al secondo	1	15 (valore predefinito)
Regolabili	No	Sì ²
Limite di operazioni get al secondo	1	50 (valore predefinito)
Regolabili	No	Sì ²
Limite di operazioni di gestione dei modelli al secondo	1	5 (valore predefinito)
Regolabili	No	Sì ²
Limite di operazioni di elenco al secondo	1	10 (valore predefinito)
Regolabili	No	Sì ²
Dimensioni massime del documento	4 MB	500 MB
Regolabili	No	No
Numero massimo di pagine (analisi)	2	2000
Regolabili	No	No
Dimensioni massime del file delle etichette	10 MB	10 MB
Regolabili	No	No
Dimensioni massime della risposta JSON del riconoscimento ottico dei caratteri (OCR)	500 MB	500 MB
Regolabili	No	No
Numero massimo di modelli	500	5000
Regolabili	No	No
Numero massimo di modelli neurali	100	500
Regolabili	No	No

Uso del modello personalizzato

Obiettivo di vendita	Gratuito (F0) ¹	Standard (S0)
Limiti al numero di modelli composti	5	500 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Neurale e generativo**	1 GB ³	1 GB (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Modello**	50 MB ⁴	50 MB (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Modello**	500	500 (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Neurale e generativo**	50,000	50.000 (valore predefinito)
Regolabili	No	No
Training del modello neurale personalizzato	10 ore al mese ⁵	nessun limite (pagamento in base all'ora), iniziare con 10 ore gratuite ogni mese
Regolabili	No	Sì ³
*Numero massimo di pagine (training) Classificatore**	10,000	10.000 (valore predefinito)
Regolabili	No	No
*Numero massimo di tipi di documento (classi) Classificatore**	500	500 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Classificatore**	1 GB	2 GB (valore predefinito)
Regolabili	No	No
*Numero minimo di esempi per classe Classificatore**	5	5 (valore predefinito)
Regolabili	No	No

Uso del modello personalizzato

Obiettivo di vendita	Gratuito (F0) ¹	Standard (S0)
Limiti al numero di modelli composti	5	200 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Neurale**	1 GB ³	1 GB (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Modello**	50 MB ⁴	50 MB (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Modello**	500	500 (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Neurale**	50,000	50.000 (valore predefinito)
Regolabili	No	No
Training del modello neurale personalizzato	10 al mese	20 al mese
Regolabili	No	Sì ³
*Numero massimo di pagine (training) Classificatore**	10,000	10.000 (valore predefinito)
Regolabili	No	No
*Numero massimo di tipi di documento (classi) Classificatore**	500	500 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Classificatore**	1 GB	1 GB (valore predefinito)
Regolabili	No	No
*Numero minimo di esempi per classe Classificatore**	5	5 (valore predefinito)
Regolabili	No	No

Uso del modello personalizzato

Obiettivo di vendita	Gratuito (F0) ¹	Standard (S0)
Limiti al numero di modelli composti	5	200 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Neurale**	1 GB ³	1 GB (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Modello**	50 MB ⁴	50 MB (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Modello**	500	500 (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Neurale**	50,000	50.000 (valore predefinito)
Regolabili	No	No
Training del modello neurale personalizzato	10 al mese	20 al mese
Regolabili	No	Sì ³
*Numero massimo di pagine (training) Classificatore**	10,000	10.000 (valore predefinito)
Regolabili	No	No
*Numero massimo di tipi di documento (classi) Classificatore**	500	500 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Classificatore**	1 GB	1 GB (valore predefinito)
Regolabili	No	No
*Numero minimo di esempi per classe Classificatore**	5	5 (valore predefinito)
Regolabili	No	No

Limiti del modello personalizzato

Obiettivo di vendita	Gratuito (F0) ¹	Standard (S0)
Limiti al numero di modelli composti	5	200 (valore predefinito)
Regolabili	No	No
Dimensioni del set di dati training	50 MB	50 MB (valore predefinito)
Regolabili	No	No
Numero massimo di pagine (training)	500	500 (valore predefinito)
Regolabili	No	No

¹ Per il piano tariffario Gratuito (F0), vedere anche le quote mensili nella pagina dei prezzi.
² Vedere procedure consigliatee istruzioni per la modifica.
³Il numero di training dei modelli neurali viene reimpostato a ogni mese di calendario. Aprire una richiesta di supporto per aumentare il limite di training mensile. A partire dall'API v4.0, le richieste di training oltre 20 richieste in un mese di calendario vengono fatturate al livello di training. Per informazioni dettagliate, vedere i prezzi.

⁴ Questo limite si applica a tutti i documenti presenti nella cartella del set di dati di training prima di eventuali aggiornamenti correlati all'etichettatura.

⁵ Questo limite si applica solo per v 4.0 (2024-11-30 GA) modelli neurali personalizzati. A partire da v 4.0, è supportato il training di documenti più grandi per durate più lunghe (fino a 10 ore gratuitamente e successivamente con addebito). Per altre informazioni, vedere la pagina del modello neurale personalizzato.

Descrizione dettagliata, modifica delle quote e procedure consigliate

I limiti predefiniti possono essere estesi richiedendo un aumento tramite un ticket di supporto. Prima di richiedere un aumento della quota (se applicabile), assicurarsi che sia necessario. Il servizio Informazioni sui documenti usa la scalabilità automatica per fornire le risorse di calcolo necessarie on-demand, mantenere bassi i costi per il cliente ed effettuare il deprovisioning delle risorse inutilizzate evitando di mantenere una quantità eccessiva di capacità hardware.

Se l'applicazione restituisce il codice di risposta 429 (troppe richieste) si supera la soglia per una o più transazioni al secondo (TPS):

Analizzare le transazioni al secondo limite tps per l'invio di richieste di analisi (POST)
Get operations al secondo limit The TPS for polling for results on analyze operations (GET)
Le operazioni di gestione dei modelli al secondo limitano le operazioni correlate alla gestione dei modelli, ad esempio compilazione/training e copia.
Le operazioni elenco al secondo limitano le operazioni correlate all'elenco di modelli, operazioni.

Procedure consigliate generali per ridurre la limitazione delle richieste durante la scalabilità automatica

Per ridurre al minimo i problemi relativi alla limitazione delle richieste (codice di risposta 429), è consigliabile usare le tecniche seguenti:

Implementare la logica di ripetizione dei tentativi nell'applicazione
Evitare modifiche brusche nel carico di lavoro. Aumentare gradualmente il carico di lavoro
Esempio. L'applicazione usa Informazioni sui documenti e il carico di lavoro corrente è 10 TPS (transazioni al secondo). Il secondo successivo si aumenta il carico a 40 TPS. Il risultato è un codice di risposta 429 per alcune richieste quando si supera il limite di 15 TPS per l'invio di operazioni di analisi. È possibile eseguire il back-off dell'elaborazione per rimanere sotto i 15 TPS o richiedere un aumento del TPS per supportare i volumi più elevati.

Le sezioni successive descrivono casi specifici di modifica delle quote. Passare a Informazioni sui documenti: aumento del limite di richieste simultanee

Aumento del limite di richieste di transazioni al secondo

Per impostazione predefinita, il numero di transazioni al secondo è limitato a 15 transazioni per una risorsa di Informazioni sui documenti. Per il piano tariffario Standard, questo limite può essere aumentato. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in questa sezione e di conoscere queste procedure consigliate.

Il primo passaggio consiste nell'abilitare il ridimensionamento automatico. Leggere questo documento per abilitare il ridimensionamento automatico per la propria risorsa * Abilitare il ridimensionamento automatico. Con il ridimensionamento automatico abilitato, la risorsa può continuare ad accettare richieste oltre i limiti TPS configurati se è presente capacità nel servizio. Può comunque comportare una limitazione della richiesta.

L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il servizio Informazioni sui documenti usa il modello con pagamento in base all'utilizzo. Il limite definisce il livello di scalabilità del servizio prima che inizi la limitazione delle richieste.

Il valore esistente di diverse categorie di limiti delle richieste è disponibile tramite portale di Azure, nella scheda monitoraggio del pannello panoramica delle risorse.

Creare e inviare una richiesta di supporto per l'aumento di TPS

Per avviare l'aumento del limite di transazioni al secondo (TPS) per la risorsa, inviare la richiesta di supporto:

Accedere al portale di Azure
Selezionare la risorsa di Informazioni sui documenti per cui si vuole aumentare il limite TPS
Selezionare -Nuova richiesta di supporto- (gruppo Supporto e risoluzione dei problemi). Viene visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
Immettere un -Riepilogo-, ad esempio "Aumentare il limite TPS di Informazioni sui documenti"
Selezionare "Convalida quota o utilizzo" per il campo del tipo di problema.
Selezionare -Avanti: Soluzioni-.
Procedere con la creazione della richiesta
Nella scheda Dettagli, immettere le informazioni seguenti nel campo -Descrizione-:
- una nota, che la richiesta riguarda la quota di Informazioni sui documenti.
- Fornire un valore previsto di TPS che si vuole ottenere con la scalabilità. Anche se gli aumenti tps sono gratuiti, è consigliabile richiedere solo un TPS ragionevole per il carico di lavoro.
- Informazioni sulle risorse di Azure
- Completare l'immissione delle informazioni necessarie e selezionare il pulsante -Crea- nella scheda -Rivedi e crea-
- Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Cercare Supporto per contattare l'utente a breve per un'ulteriore elaborazione.

Esempio di procedura consigliata per un modello di carico di lavoro

Questo esempio illustra l'approccio che si consiglia di seguire per attenuare la possibile limitazione delle richieste dovuta all'operazione di scalabilità automatica in corso. Non si tratta di una ricetta esatta, ma semplicemente di un modello che si invita a seguire e a modificare in base alle esigenze.

Si supponga che per una risorsa di Informazioni sui documenti sia impostato il limite predefinito. Avviare il carico di lavoro per inviare le richieste di analisi. Se si rileva che viene visualizzata una limitazione frequente con il codice di risposta 429 quando si verifica il completamento, iniziare implementando un backoff esponenziale nella richiesta di risposta di analisi GET. Usando un tempo di attesa progressivamente più lungo tra i tentativi per risposte di errore consecutive, ad esempio un modello 2-5-13-34 per i ritardi tra le richieste. In generale, è consigliabile non chiamare l'operazione GET di analisi della risposta più di una volta ogni due secondi per una richiesta POST corrispondente. La analyze risposta contiene anche un'intestazione retry-after che indica per quanto tempo è necessario attendere in secondi prima di verificare il completamento della richiesta.

Se si rileva una limitazione del numero di richieste POST per i documenti inviati, provare ad aggiungere un ritardo tra le richieste. Se il carico di lavoro richiede un livello superiore di elaborazione simultanea, è necessario creare una richiesta di supporto per aumentare i limiti di servizio per il numero di transazioni al secondo.

In genere, è consigliabile testare il carico di lavoro e i modelli di carico di lavoro prima di passare all'ambiente di produzione.

Passaggi successivi

Informazioni sui codici errore e sulla risoluzione dei problemi

Condividi tramite

Quote e limiti del servizio

Uso dei modelli

Fatturazione

Uso del modello personalizzato

Uso del modello personalizzato

Uso del modello personalizzato

Limiti del modello personalizzato

Descrizione dettagliata, modifica delle quote e procedure consigliate

Procedure consigliate generali per ridurre la limitazione delle richieste durante la scalabilità automatica

Aumento del limite di richieste di transazioni al secondo

Creare e inviare una richiesta di supporto per l'aumento di TPS

Esempio di procedura consigliata per un modello di carico di lavoro

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive