Quote e limiti del Servizio cognitivo di Azure per la voce
Questo articolo contiene un riferimento rapido e una descrizione dettagliata delle quote e dei limiti per il Servizio cognitivo di Azure per la voce in Servizi di Azure AI. Le informazioni sono rilevanti per tutti i piani tariffari del servizio. Contengono anche alcune procedure consigliate per evitare la limitazione delle richieste.
Per il piano tariffario gratuito (F0), consultare anche le quote mensili nella pagina prezzi.
Informazioni di riferimento su quote e limiti
Le seguenti sezioni forniscono una guida rapida alle quote e ai limiti applicabili al Servizio cognitivo di Azure per la voce.
Per informazioni sulle quote regolabili per le risorse Voce Standard (S0), consultare ulteriori spiegazioni, procedure consigliatee istruzioni di rettifica. Le quote e i limiti per le risorse Voce Gratuite (F0) non sono rettificabili.
Importante
Se si passa una risorsa Voce dal piano tariffario Gratuito (F0) al piano tariffario Standard (S0), la modifica delle quote corrispondenti potrebbe richiedere fino a diverse ore.
Quote e limiti della conversione della voce in testo scritto per ogni risorsa
Questa sezione descrive le quote e i limiti della conversione della voce in testo scritto per ogni risorsa Voce. Se non diversamente specificato, i limiti non sono rettificabili.
Conversione della voce in testo scritto e traduzione vocale in tempo reale
È possibile usare la conversione della voce in testo scritto in tempo reale con SDK Voce o l'API REST Conversione della voce in testo scritto per audio brevi.
Importante
Questi limiti riguardano la somma delle richieste simultanee di conversione della voce in testo scritto e delle richieste di traduzione vocale in tempo reale. Ad esempio, se si hanno 60 richieste simultanee di conversione della voce in testo scritto e 40 richieste simultanee di traduzione vocale, si raggiungerà il limite di 100 richieste simultanee.
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Limite di richieste simultanee - Endpoint del modello di base | 1 Questo limite non è rettificabile. |
100 (valore predefinito) La frequenza è rettificabile per le risorse Standard (S0). Consultare ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica. |
Limite di richieste simultanee - Endpoint personalizzato | 1 Questo limite non è rettificabile. |
100 (valore predefinito) La frequenza è rettificabile per le risorse Standard (S0). Consultare ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica. |
Lunghezza massima dell'audio per la diarizzazione in tempo reale. | N/D | 240 minuti per file |
Trascrizione rapida
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Dimensioni massime del file di input audio | N/D | 200 MB |
Lunghezza massima dell’audio | N/D | 120 minuti per file |
Numero massimo di richieste al minuto | N/D | 600 |
Trascrizione batch
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Limite dell'API REST per la conversione della voce in testo scritto | Non disponibile per F0 | 100 richieste per 10 secondi (600 richieste al minuto) |
Dimensioni massime del file di input audio | N/D | 1 GB |
Numero massimo di BLOB per contenitore | N/D | 10000 |
Numero massimo di file per richiesta di trascrizione (quando si usano più URL di contenuto come input). | N/D | 1000 |
Lunghezza massima di audio per le trascrizioni con diarizzazione abilitata. | N/D | 240 minuti per file |
Personalizzazione del modello
I limiti in questa tabella sono validi per ogni risorsa Voce quando si crea un modello Voce personalizzato.
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Limite dell'API REST | 100 richieste per 10 secondi (600 richieste al minuto) | 100 richieste per 10 secondi (600 richieste al minuto) |
Numero massimo di distribuzioni di modelli personalizzati per risorsa Voce | 1 | 50 |
Numero massimo di set di dati vocali | 2 | 500 |
Dimensioni massime del file del set di dati acustico per l'importazione dei dati | 2 GB | 2 GB |
Dimensioni massime del file del set di dati linguistico per l'importazione dei dati | 200 MB | 1.5 GB |
Dimensioni massime del file del set di dati di pronuncia per l'importazione dei dati | 1 KB | 1 MB |
Dimensioni massime del testo quando si usa il parametro text nella richiesta API Models_Create |
200 kB | 500 KB |
Quote e limiti della sintesi vocale per ogni risorsa
Questa sezione illustra le quote e i limiti della sintesi vocale per ogni risorsa Voce.
Sintesi vocale in tempo reale
È possibile usare la sintesi vocale in tempo reale con SDK Voce o l'API REST Sintesi vocale. Se non diversamente specificato, i limiti non sono rettificabili.
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Numero massimo di transazioni per periodo di tempo per voci neurali predefinite e voci neurali personalizzate. | 20 transazioni per 60 secondi Questo limite non è rettificabile. |
200 transazioni al secondo (TPS) (valore predefinito) La velocità è rettificabile fino a 1000 TPS per le risorse Standard (S0). Consultare ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica. |
Lunghezza massima di audio prodotto per richiesta | 10 min | 10 min |
Numero totale massimo di tag <voice> e <audio> distinti in SSML |
50 | 50 |
Dimensioni massime di messaggi SSML per turno per ogni websocket | 64 kB | 64 kB |
Sintesi batch
Questi limiti non sono rettificabili. Per ulteriori informazioni sulla latenza di sintesi batch, consultare latenza di sintesi batch e procedure consigliate.
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Limite dell'API REST | Non disponibile per F0 | 100 richieste ogni 10 secondi |
Dimensioni massime del payload JSON per la creazione del processo di sintesi | N/D | 2 megabyte |
Processi di sintesi attivi simultanei | N/D | Nessun limite |
Numero massimo di input di testo per processo di sintesi | N/D | 10000 |
Tempo massimo di vita per un processo di sintesi dal momento in cui passa allo stato finale | N/D | Fino a 31 giorni (specificato tramite le proprietà) |
Sintesi vocale neurale - professionale
I limiti in questa tabella sono validi per ogni risorsa Voce quando si crea un modello di voce neurale personalizzato professionale.
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Numero massimo di transazioni al secondo (TPS) | Non disponibile per F0 | 200 transazioni al secondo (TPS) (valore predefinito) |
Numero massimo di set di dati | N/D | 500 |
Numero massimo di caricamenti simultanei dei set di dati | N/D | 5 |
Dimensioni massime del file di dati per l'importazione di dati per ogni set di dati | N/D | 2 GB |
Caricamento di audio o audio lunghi senza script | N/D | Sì |
Numero massimo di training di modelli simultanei | N/D | 4 |
Numero massimo di endpoint personalizzati | N/D | 50 |
Voce neurale personalizzata - voce personale
I limiti di questa tabella sono validi per ogni risorsa Voce quando si crea una voce personale.
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Limite dell'API REST (esclusa la sintesi vocale) | Non disponibile per F0 | 50 richieste per 10 secondi |
Numero massimo di transazioni al secondo (TPS) per la sintesi vocale | Non disponibile per F0 | 200 transazioni al secondo (TPS) (valore predefinito) |
Avatar per la sintesi vocale in batch
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Limite dell'API REST | Non disponibile per F0 | 2 richieste al minuto |
Avatar di sintesi vocale in tempo reale
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Nuove connessioni al minuto | Non disponibile per F0 | 2 nuove connessioni al minuto |
Durata massima della connessione con parlato | Non disponibile per F0 | 20 minuti1 |
Durata massima della connessione con stato inattivo | Non disponibile per F0 | 5 minuti |
1 Per garantire il funzionamento continuo dell'avatar in tempo reale per più di 20 minuti, è possibile abilitare la riconnessione automatica. Per informazioni su come configurare la riconnessione automatica, vedere questo codice di esempio (cercare “Riconnessione automatica”).
Strumento Creazione di contenuto audio
Obiettivo di vendita | Gratuito (F0) | Standard (S0) |
---|---|---|
Dimensioni del file (testo normale in SSML)1 | 3,000 caratteri per file | 20,000 caratteri per file |
Dimensioni file (file lessico)2 | 30 KB per file | 100 KB per file |
Caratteri fatturabili in SSML | 15,000 caratteri per file | 100,000 caratteri per file |
Esportare nella libreria audio | 1 attività simultanea | N/D |
1 Il limite riguarda solo il testo normale in SSML e non include tag.
2 I caratteri del file lessico non vengono addebitati. Solo gli elementi lessico in SSML vengono conteggiati come caratteri fatturabili. Per ulteriori informazioni, consultare i caratteri fatturabili.
Quote e limiti di riconoscimento del parlante per risorsa
Il riconoscimento del parlante è limitato a 20 transazioni al secondo (TPS).
Descrizione dettagliata, rettifica delle quote e procedure consigliate
Alcune quote del servizio Voce sono rettificabili. Questa sezione fornisce ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica.
Le seguenti quote sono rettificabili per risorse Standard (S0). I limiti delle richieste Gratuite (F0) non sono rettificabili.
- Limite di richieste simultanee di conversione della voce in testo scritto per l'endpoint del modello di base e l'endpoint personalizzato
- Numero massimo di transazioni per periodo di tempo di sintesi vocale per voci neurali predefinite e voci neurali personalizzate
- Limite di richieste simultanee per la traduzione vocale
Prima di richiedere un aumento della quota (se applicabile), controllare il valore TPS (transazioni al secondo) corrente e assicurarsi che sia necessario aumentare la quota. Il servizio cognitivo di Azure per la voce usa tecnologie di scalabilità automatica per portare le risorse di calcolo necessarie in modalità on demand. Allo stesso tempo, il servizio cognitivo di Azure per la voce tenta di tenere bassi i costi non mantenendo una quantità eccessiva di capacità hardware.
Di seguito è descritto un esempio. Si supponga che l'applicazione riceva il codice di risposta 429, che indica la presenza di troppe richieste. L'applicazione riceve questa risposta sebbene il carico di lavoro rientri nei limiti definiti dal Riferimento quote e limiti. La spiegazione più probabile è che il servizio cognitivo di Azure per la voce stia aumentando la propria scalabilità per poter soddisfare la domanda e non abbia ancora raggiunto la scalabilità necessaria. Di conseguenza, il servizio non dispone immediatamente di risorse sufficienti per gestire la richiesta. In questi casi, l'aumento della quota non sarà utile. Nella maggior parte dei casi, le prestazioni del servizio Voce verranno aumentate presto e il problema che causa il codice di risposta 429 verrà risolto.
Procedure consigliate generali per attenuare la limitazione durante la scalabilità automatica
Per ridurre al minimo i problemi relativi alla limitazione, è consigliabile usare le seguenti tecniche:
- Implementare la logica di ripetizione dei tentativi nell'applicazione.
- Evitare modifiche brusche nel carico di lavoro. Aumentare gradualmente il carico di lavoro. Si supponga, ad esempio, che l'applicazione stia usando la sintesi vocale e che il carico di lavoro corrente sia 5 TPS. Il secondo successivo, si aumenta il carico a 20 TPS (ovvero quattro volte di più). Il servizio cognitivo di Azure per la voce comincia immediatamente ad aumentare la scalabilità per soddisfare il nuovo carico, ma non è in grado di farlo entro un secondo. Alcune richieste ottengono il codice di risposta 429 (troppe richieste).
- Testare modelli di aumento del carico diversi. Per ulteriori informazioni, consultare l'esempio di criterio del carico di lavoro.
- Creare altre risorse del servizio cognitivo di Azure per la voce in aree diverse e distribuirne il carico di lavoro. La creazione di più risorse del servizio cognitivo di Azure per la voce nella stessa area non influisce sulle prestazioni, poiché tutte le risorse vengono gestite dallo stesso cluster back-end.
Le sezioni successive descrivono casi specifici di rettifica delle quote.
Conversione della voce in testo scritto: aumentare il limite di richieste simultanee per la conversione della voce in testo scritto
Per impostazione predefinita, la somma di richieste simultanee di conversione della voce in testo scritto e di traduzione vocale è limitata a 100 per risorsa nel modello di base e 100 per endpoint personalizzato nel modello personalizzato. È possibile aumentare questo numero per il piano tariffario standard. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in precedenza in questo articolo, ad esempio le procedure consigliate per attenuare la limitazione.
Nota
I limiti di richieste simultanee per i modelli di base e per quelli personalizzati devono essere rettificati separatamente. È possibile che una risorsa del servizio cognitivo di Azure per la voce sia associata a molti endpoint personalizzati che ospitano molte distribuzioni di modelli personalizzati. In base alle esigenze, le rettifiche del limite per ogni endpoint personalizzato devono essere richieste separatamente.
L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il modello di pagamento del servizio cognitivo di Azure per la voce richiede di pagare esclusivamente per quanto usato. Il limite definisce il livello di scalabilità del servizio prima che inizi la limitazione delle richieste.
Il valore esistente del parametro limite di richieste simultanee non è visibile tramite il portale di Azure, gli strumenti da riga di comando o le richieste API. Per verificare il valore esistente, creare una richiesta di supporto di Azure.
Nota
I contenitori Voce non richiedono un aumento del limite di richieste simultanee, poiché sono vincolati solo dalle CPU dell'hardware in cui sono ospitati. Tuttavia, i contenitori Voce, presentano limitazioni di capacità specifiche che devono essere prese in considerazione. Per ulteriori informazioni, consultare Domande frequenti sui contenitori Voce.
Preparare le informazioni necessarie
- Per il modello di base:
- ID risorsa Voce
- Area
- Per il modello personalizzato:
- Area
- ID endpoint personalizzato
Come ottenere informazioni per il modello di base:
- Vai al portale di Azure.
- Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare o controllare il limite di richieste simultanee.
- Nel gruppo Gestione risorse, selezionare Proprietà.
- Copiare e salvare i valori dei seguenti campi:
- ID risorsa
- Posizione (area dell'endpoint)
Come ottenere informazioni per il modello personalizzato:
- Passare al portale di Speech Studio.
- Accedere, se necessario, e passare a Servizio Voce personalizzato.
- Selezionare il progetto e passare a Distribuzione.
- Selezionare l'endpoint richiesto.
- Copiare e salvare i valori dei seguenti campi:
- Area del servizio (area dell'endpoint)
- ID endpoint
Creare e inviare una richiesta di supporto
Avviare l'aumento del limite di richieste simultanee per la risorsa o, se necessario, controllare il limite corrente inviando una richiesta di supporto. In tal caso, eseguire la procedura seguente:
- Assicurarsi di avere le informazioni necessarie elencate nella sezione precedente.
- Vai al portale di Azure.
- Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare (o controllare) il limite di richieste simultanee.
- Nel gruppo Supporto e risoluzione dei problemi, selezionare Nuova richiesta di supporto. Verrà visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
- In Riepilogo, descrivere l’azione desiderata (ad esempio, "Aumentare il limite di richieste simultanee per la conversione della voce in testo scritto").
- In Tipo di problema, selezionare Problemi relativi a quota o sottoscrizione.
- In Sottotipo problema, selezionare:
- Aumento della quota o del numero di richieste simultanee per effettuare una richiesta di aumento.
- Convalida della quota o dell'utilizzo per controllare il limite esistente.
- Selezionare Avanti: Soluzioni. Procedere con la creazione della richiesta.
- Nella scheda Dettagli, immettere quanto segue nel campo Descrizione:
- Notare che la richiesta riguarda la quota di conversione della voce in testo scritto.
- Scegliere il modello di base o quello personalizzato.
- Informazioni sulle risorse di Azure raccolte in precedenza.
- Qualsiasi altra informazione richiesta.
- Nella scheda Rivedi e crea selezionare Crea.
- Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Si verrà contattati a breve in proposito alla richiesta.
Esempio di procedura consigliata per il criterio di carico di lavoro
Ecco un esempio generale di un buon approccio da adottare. Questo esempio è inteso solo come modello che è possibile modificare in base alle proprie esigenze.
Si supponga che una risorsa del servizio cognitivo di Azure per la voce abbia il limite di richieste simultanee impostato su 300. Avviare il carico di lavoro da 20 connessioni simultanee e aumentare il carico di 20 connessioni simultanee ogni 90-120 secondi. Controllare le risposte del servizio e implementare la logica che esegue il fallback (riduce il carico) se si ottengono troppe richieste (codice di risposta 429). Ripetere quindi l'aumento del carico dopo un minuto e, se questo non dovesse funzionare, riprovare dopo due minuti. Usare un criterio di 1-2-4-4 minuti per gli intervalli.
In genere, è consigliabile testare il carico di lavoro e i criteri di carico di lavoro prima di passare alla produzione.
Sintesi vocale: aumentare il limite di richieste simultanee
È possibile aumentare questo numero per il piano tariffario standard. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in precedenza in questo articolo, ad esempio le procedure consigliate per attenuare la limitazione.
L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il modello di pagamento del servizio cognitivo di Azure per la voce richiede di pagare esclusivamente per quanto usato. Il limite definisce il livello di scalabilità del servizio prima che inizi la limitazione delle richieste.
Il valore esistente del parametro limite di richieste simultanee non è visibile tramite il portale di Azure, gli strumenti da riga di comando o le richieste API. Per verificare il valore esistente, creare una richiesta di supporto di Azure.
Nota
I contenitori Voce non richiedono un aumento del limite di richieste simultanee, poiché sono vincolati solo dalle CPU dell'hardware in cui sono ospitati.
Preparare le informazioni necessarie
Per creare una richiesta di aumento, è necessario fornire le proprie informazioni.
- Per la voce predefinita:
- ID risorsa Voce
- Area
- Per la voce personalizzata:
- Area di distribuzione
- ID endpoint personalizzato
Come ottenere informazioni per la voce predefinita:
- Vai al portale di Azure.
- Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare o controllare il limite di richieste simultanee.
- Nel gruppo Gestione risorse, selezionare Proprietà.
- Copiare e salvare i valori dei seguenti campi:
- ID risorsa
- Posizione (area dell'endpoint)
Come ottenere informazioni per la voce personalizzata:
- Passare al portale di Speech Studio.
- Accedere, se necessario, e passare a Voce personalizzata.
- Selezionare il progetto e passare a Distribuisci modello.
- Selezionare l'endpoint richiesto.
- Copiare e salvare i valori dei seguenti campi:
- Area del servizio (area dell'endpoint)
- ID endpoint
Creare e inviare una richiesta di supporto
Avviare l'aumento del limite di richieste simultanee per la risorsa o, se necessario, controllare il limite corrente inviando una richiesta di supporto. In tal caso, eseguire la procedura seguente:
- Assicurarsi di avere le informazioni necessarie elencate nella sezione precedente.
- Vai al portale di Azure.
- Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare (o controllare) il limite di richieste simultanee.
- Nel gruppo Supporto e risoluzione dei problemi, selezionare Nuova richiesta di supporto. Verrà visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
- In Riepilogo, descrivere l’azione desiderata (ad esempio, "Aumentare il limite di richieste simultanee per la sintesi vocale").
- In Tipo di problema, selezionare Problemi relativi a quota o sottoscrizione.
- In Sottotipo problema, selezionare:
- Aumento della quota o del numero di richieste simultanee per effettuare una richiesta di aumento.
- Convalida della quota o dell'utilizzo per controllare il limite esistente.
- Nella scheda Soluzione consigliata, selezionare Avanti.
- Nella scheda Dettagli aggiuntivi, compilare tutti gli elementi necessari. Nel campo Dettagli, immettere quanto segue:
- Notare che la richiesta riguarda la quota di sintesi vocale.
- Scegliere la voce predefinita o quella personalizzata.
- Informazioni sulle risorse di Azure raccolte in precedenza.
- Qualsiasi altra informazione richiesta.
- Nella scheda Rivedi e crea selezionare Crea.
- Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Si verrà contattati a breve in proposito alla richiesta.
Avatar di sintesi vocale: aumentare il limite delle nuove connessioni
Per aumentare il limite delle nuove connessioni al minuto per l'avatar di sintesi vocale, contattare il rappresentante di vendita e creare un ticket con le informazioni seguenti:
- URI risorsa Voce
- Richiesta di un nuovo limite per l’aumento a
- Giustificazione per l'aumento
- Data di inizio dell'aumento
- Data di fine dell'aumento
- Avatar predefinito o avatar personalizzato