Condividi tramite


Quote e limiti del servizio

Questo contenuto si applica a:segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale) blue-checkmark v3.0 (disponibilità generale)

Questo contenuto si applica a: segno di spunta v2.1 | Versione più recente: blue-checkmark v4.0 (anteprima)

Questo articolo contiene un riferimento rapido e una descrizione dettagliata delle quote e dei limiti del servizio Informazioni sui documenti di Azure AI per tutti i piani tariffari. Include anche alcune procedure consigliate per evitare la limitazione delle richieste.

Uso dei modelli

Tipi di documento supportati Lettura Layout Modelli predefiniti Modelli personalizzati Funzionalità dei componenti aggiuntivi
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Immagini: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = supportato ✖️ = non supportato

Tipi di documento supportati Lettura Layout Modelli predefiniti Modelli personalizzati
PDF ✔️ ✔️ ✔️ ✔️
Immagini: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = supportato ✖️ = non supportato

Fatturazione

La fatturazione di Informazioni sui documenti viene calcolata mensilmente in base al tipo di modello e al numero di pagine analizzate. È possibile trovare le metriche di utilizzo nel dashboard delle metriche del portale di Azure. Il dashboard visualizza il numero di pagine elaborate da Informazioni sui documenti di Azure AI. È possibile controllare il costo stimato speso per la risorsa usando il Calcolatore dei prezzi di Azure. Per istruzioni dettagliate, vedere Controllare l'utilizzo e stimare il costo. Ecco alcune informazioni:

  • Quando si invia un documento per l'analisi, il servizio analizza tutte le pagine a meno che non si specifichi un intervallo di pagine usando il parametro pages nella richiesta. Quando il servizio analizza i documenti di Microsoft Excel e PowerPoint tramite il modello di lettura, OCR o layout, conta ogni foglio di lavoro di Excel e diapositiva di PowerPoint come una pagina.

  • Quando il servizio analizza i file PDF e TIFF, conta ogni pagina nel file PDF o ogni immagine nel file TIFF come una pagina senza limiti massimi di caratteri.

  • Quando il servizio analizza i file HTML e di Microsoft Word supportati dai modelli di lettura e layout, conta le pagine in blocchi di 3.000 caratteri ciascuno. Ad esempio, se il documento contiene 7.000 caratteri, vengono conteggiate le due pagine con 3.000 caratteri ciascuno e una pagina con 1.000 caratteri, fino a un totale di tre pagine.

  • I modelli di lettura e layout non supportano l'analisi delle immagini incorporate o collegate nei file Microsoft Word, Excel, PowerPoint e HTML. Di conseguenza, il servizio non li conta come immagini aggiunte.

  • Il training di un modello personalizzato è sempre gratuito con Informazioni sui documenti. L'addebito viene effettuato solo quando il servizio usa un modello per analizzare un documento.

  • I prezzi dei contenitori corrispondono ai prezzi dei servizi cloud.

  • Informazioni sui documenti offre un livello gratuito (F0) in cui è possibile testare tutte le funzionalità di Informazioni sui documenti.

  • Informazioni sui documenti ha un modello di determinazione dei prezzi basato sull'impegno per carichi di lavoro di grandi dimensioni.

  • Il modello Layout è necessario per generare etichette per il set di dati per il training personalizzato. Se il set di dati usato per il training personalizzato non dispone di file di etichetta disponibili, il servizio li genera automaticamente ed effettua l’addebito per l’utilizzo del modello di layout.

Obiettivo di vendita Gratuito (F0)1 Standard (S0)
Limite di transazioni al secondo 1 15 (valore predefinito)
Regolabili No 2
Dimensioni massime del documento 4 MB 500 MB
Regolabili No No
Numero massimo di pagine (analisi) 2 2000
Regolabili No No
Dimensioni massime del file delle etichette 10 MB 10 MB
Regolabili No No
Dimensioni massime della risposta JSON del riconoscimento ottico dei caratteri (OCR) 500 MB 500 MB
Regolabili No No
Numero massimo di modelli 500 5000
Regolabili No No
Numero massimo di modelli neurali 100 500
Regolabili No No

Uso del modello personalizzato

Obiettivo di vendita Gratuito (F0) 1 Standard (S0)
Limiti al numero di modelli composti 5 500 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training *Neurale e generativo 1 GB 3 1 GB (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Modello 50 MB 4 50 MB (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Modello 500 500 (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Neurale e generativo 50,000 50.000 (valore predefinito)
Regolabili No No
Training del modello neurale personalizzato 10 ore al mese 5 nessun limite (pagamento su base oraria)
Regolabili No 3
Numero massimo di pagine (training) * Classificatore 10,000 10.000 (valore predefinito)
Regolabili No No
Numero massimo di tipi di documento (classi) * Classificatore 500 500 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Classificatore 1 GB 2 GB (valore predefinito)
Regolabili No No
Numero minimo di esempi per classe * Classificatore 5 5 (valore predefinito)
Regolabili No No

Uso del modello personalizzato

Obiettivo di vendita Gratuito (F0) 1 Standard (S0)
Limiti al numero di modelli composti 5 200 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Neurale 1 GB 3 1 GB (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Modello 50 MB 4 50 MB (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Modello 500 500 (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Neurale 50,000 50.000 (valore predefinito)
Regolabili No No
Training del modello neurale personalizzato 10 al mese 20 al mese
Regolabili No 3
Numero massimo di pagine (training) * Classificatore 10,000 10.000 (valore predefinito)
Regolabili No No
Numero massimo di tipi di documento (classi) * Classificatore 500 500 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Classificatore 1 GB 1 GB (valore predefinito)
Regolabili No No
Numero minimo di esempi per classe * Classificatore 5 5 (valore predefinito)
Regolabili No No

Uso del modello personalizzato

Obiettivo di vendita Gratuito (F0) 1 Standard (S0)
Limiti al numero di modelli composti 5 200 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Neurale 1 GB 3 1 GB (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Modello 50 MB 4 50 MB (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Modello 500 500 (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Neurale 50,000 50.000 (valore predefinito)
Regolabili No No
Training del modello neurale personalizzato 10 al mese 20 al mese
Regolabili No 3
Numero massimo di pagine (training) * Classificatore 10,000 10.000 (valore predefinito)
Regolabili No No
Numero massimo di tipi di documento (classi) * Classificatore 500 500 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Classificatore 1 GB 1 GB (valore predefinito)
Regolabili No No
Numero minimo di esempi per classe * Classificatore 5 5 (valore predefinito)
Regolabili No No

Limiti del modello personalizzato

Obiettivo di vendita Gratuito (F0) 1 Standard (S0)
Limiti al numero di modelli composti 5 200 (valore predefinito)
Regolabili No No
Dimensioni del set di dati training 50 MB 50 MB (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) 500 500 (valore predefinito)
Regolabili No No

1 Per il piano tariffario Gratuito (F0), vedere anche le quote mensili nella pagina dei prezzi.
2 Vedere procedure consigliatee istruzioni per la modifica.
3Il numero di training dei modelli neurali viene reimpostato a ogni mese di calendario. Aprire una richiesta di supporto per aumentare il limite di training mensile.

4 Questo limite si applica a tutti i documenti presenti nella cartella del set di dati di training prima di eventuali aggiornamenti correlati all'etichettatura.

5 Questo limite si applica solo per v 4.0 (2024-07-31) modelli neurali personalizzati. A partire da v 4.0, è supportato il training di documenti più grandi per durate più lunghe (fino a 10 ore gratuitamente e successivamente con addebito). Per altre informazioni, vedere la pagina del modello neurale personalizzato.

Descrizione dettagliata, modifica delle quote e procedure consigliate

Prima di richiedere un aumento della quota (se applicabile), assicurarsi che sia necessario. Il servizio Informazioni sui documenti usa la scalabilità automatica per fornire le risorse di calcolo necessarie on-demand, mantenere bassi i costi per il cliente ed effettuare il deprovisioning delle risorse inutilizzate evitando di mantenere una quantità eccessiva di capacità hardware.

Quando l'applicazione restituisce un codice di risposta 429 (Troppe richieste) e il carico di lavoro rientra nei limiti definiti, la spiegazione più probabile è che il servizio stia aumentando le prestazioni per soddisfare la domanda ma non abbia ancora raggiunto la scalabilità necessaria. Di conseguenza, il servizio non ha immediatamente risorse sufficienti per gestire la richiesta. Questo stato è temporaneo e non dovrebbe durare molto.

Procedure consigliate generali per ridurre la limitazione delle richieste durante la scalabilità automatica

Per ridurre al minimo i problemi relativi alla limitazione delle richieste (codice di risposta 429), è consigliabile usare le tecniche seguenti:

  • Implementare la logica di ripetizione dei tentativi nell'applicazione
  • Evitare modifiche brusche nel carico di lavoro. Aumentare gradualmente il carico di lavoro
    Esempio. L'applicazione usa Informazioni sui documenti e il carico di lavoro corrente è 10 TPS (transazioni al secondo). Il secondo successivo, si aumenta il carico a 40 TPS (ovvero quattro volte di più). Il servizio inizia immediatamente ad aumentare le risorse per soddisfare il nuovo carico, ma probabilmente non riesce a farlo entro un secondo, quindi alcune delle richieste ottengono il codice di risposta 429.

Le sezioni successive descrivono casi specifici di modifica delle quote. Passare a Informazioni sui documenti: aumento del limite di richieste simultanee

Aumento del limite di richieste di transazioni al secondo

Per impostazione predefinita, il numero di transazioni al secondo è limitato a 15 transazioni per una risorsa di Informazioni sui documenti. Per il piano tariffario Standard, questo limite può essere aumentato. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in questa sezione e di conoscere queste procedure consigliate.

L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il servizio Informazioni sui documenti usa il modello con pagamento in base all'utilizzo. Il limite definisce il livello di scalabilità del servizio prima che inizi la limitazione delle richieste.

Il valore esistente del parametro relativo al limite di richieste simultanee non è visibile tramite il portale di Azure, gli strumenti da riga di comando o le richieste API. Per verificare il valore esistente, creare una richiesta di supporto di Azure.

Se si intende aumentare il numero di transazioni al secondo, è possibile abilitare la scalabilità automatica per la risorsa. Leggere questo documento per abilitare il ridimensionamento automatico per la propria risorsa * Abilitare il ridimensionamento automatico. È anche possibile inviare una richiesta di supporto per incrementare il valore di TPS.

Avere a disposizione le informazioni necessarie

  • ID risorsa di Informazioni sui documenti

  • Paese

  • Informazioni sul modello di base:

    • Accedere al portale di Azure
    • Selezionare la risorsa di Informazioni sui documenti per cui si vuole aumentare il limite di transazioni
    • Selezionare -Proprietà- (gruppo -Gestione risorse-)
    • Copiare e salvare i valori dei seguenti campi:
      • ID risorsa
      • Posizione (area dell'endpoint)

Creare e inviare una richiesta di supporto

Per avviare l'aumento del limite di transazioni al secondo (TPS) per la risorsa, inviare la richiesta di supporto:

  • Assicurarsi di avere a disposizione le informazioni necessarie
  • Accedere al portale di Azure
  • Selezionare la risorsa di Informazioni sui documenti per cui si vuole aumentare il limite TPS
  • Selezionare -Nuova richiesta di supporto- (gruppo Supporto e risoluzione dei problemi). Viene visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
  • Immettere un -Riepilogo-, ad esempio "Aumentare il limite TPS di Informazioni sui documenti"
  • Selezionare "Convalida quota o utilizzo" per il campo del tipo di problema.
  • Selezionare -Avanti: Soluzioni-.
  • Procedere con la creazione della richiesta
  • Nella scheda Dettagli, immettere le informazioni seguenti nel campo -Descrizione-:
    • una nota, che la richiesta riguarda la quota di Informazioni sui documenti.
    • Fornire un valore previsto di TPS che si vuole ottenere con la scalabilità.
    • Informazioni sulle risorse di Azure raccolte.
    • Completare l'immissione delle informazioni necessarie e selezionare il pulsante -Crea- nella scheda -Rivedi e crea-
    • Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Cercare Supporto per contattare l'utente a breve per un'ulteriore elaborazione.

Esempio di procedura consigliata per un modello di carico di lavoro

Questo esempio illustra l'approccio che si consiglia di seguire per attenuare la possibile limitazione delle richieste dovuta all'operazione di scalabilità automatica in corso. Non si tratta di una ricetta esatta, ma semplicemente di un modello che si invita a seguire e a modificare in base alle esigenze.

Si supponga che per una risorsa di Informazioni sui documenti sia impostato il limite predefinito. Avviare il carico di lavoro per inviare le richieste di analisi. Se si riscontra una frequente limitazione delle richieste con il codice di risposta 429, iniziare implementando un backoff esponenziale nella richiesta GET di analisi della risposta. Usando un tempo di attesa progressivamente più lungo tra i tentativi per risposte di errore consecutive, ad esempio un modello 2-5-13-34 per i ritardi tra le richieste. In generale, è consigliabile non chiamare l'operazione GET di analisi della risposta più di una volta ogni due secondi per una richiesta POST corrispondente.

Se si rileva una limitazione del numero di richieste POST per i documenti inviati, provare ad aggiungere un ritardo tra le richieste. Se il carico di lavoro richiede un livello superiore di elaborazione simultanea, è necessario creare una richiesta di supporto per aumentare i limiti di servizio per il numero di transazioni al secondo.

In genere, è consigliabile testare il carico di lavoro e i modelli di carico di lavoro prima di passare all'ambiente di produzione.

Passaggi successivi