Il servizio Voce consente alle applicazioni di convertire l'audio in testo, di eseguire la traduzione vocale e di eseguire la sintesi vocale. Il servizio è disponibile in più aree con endpoint univoci per Speech SDK e le API REST.
Tenere presente quanto segue:
Se l'applicazione usa Speech SDK, specificare l'identificatore di area, ad esempio westus, durante la creazione di un SpeechConfig. Assicurarsi che l'area corrisponda all'area della sottoscrizione.
Se l'applicazione usa una delle API REST del servizio Voce, l'area è parte dell'URI dell'endpoint usato quando si effettuano richieste.
Le chiavi create per un'area sono valide solo in quell'area. Se si tenta di usarli con altre aree, si verificano errori di autenticazione.
Nota
Il servizio Voce non archivia o elabora i dati all'esterno dell'area della risorsa Voce. I dati vengono archiviati o elaborati solo nell'area in cui viene creata la risorsa. Ad esempio, se si crea una risorsa Voce nell'area westus , i dati si trovano solo nell'area westus .
Aree
Le aree in queste tabelle supportano la maggior parte delle funzionalità principali del servizio Voce, ad esempio riconoscimento vocale, sintesi vocale, valutazione della pronuncia e traduzione. Alcune funzionalità, ad esempio la trascrizione rapida e l'API di sintesi batch, richiedono aree specifiche. Per le funzionalità che richiedono aree specifiche, la tabella indica le aree che le supportano.
1 L'area dispone di hardware dedicato per eseguire training di riconoscimento vocale personalizzato. Se si prevede di eseguire il training di un modello personalizzato con dati audio, è necessario usare una delle aree con hardware dedicato. È quindi possibile copiare il modello sottoposto a training in un'altra area.
Area
Sintesi vocale neurale
API di sintesi batch
Voci HD
Voci OpenAI di Azure
Sintesi vocale neurale
Training vocale neurale personalizzato
Endpoint a prestazioni elevate per la voce neurale personalizzata