Mithilfe des Speech-Diensts kann Ihre Anwendung Sprache in Text konvertieren, Sprachübersetzungen ausführen und Text in Sprache konvertieren. Der Dienst ist in mehreren Regionen mit eindeutigen Endpunkten für das Speech SDK und REST-APIs verfügbar.
Berücksichtigen Sie dabei Folgendes:
Wenn Ihre Anwendung ein Speech SDK verwendet, geben Sie beim Erstellen von SpeechConfig den Regionsbezeichner (z. B. westus) an. Achten Sie darauf, dass die Region mit der Region Ihres Abonnements übereinstimmt.
Wenn Ihre Anwendung eine der REST-APIs des Spracherkennungsdiensts verwendet, ist die Region Teil des Endpunkt-URI, den Sie bei der Anforderung verwenden.
Schlüssel, die für eine Region erstellt wurden, sind nur in dieser Region gültig. Wenn Sie versuchen, sie in anderen Regionen zu verwenden, werden Authentifizierungsfehler ausgegeben.
Hinweis
Speech Service speichert oder verarbeitet Ihre Daten nicht außerhalb der Region Ihrer Speech-Ressource. Die Daten werden nur in der Region gespeichert oder verarbeitet, in der die Ressource erstellt wird. Wenn Sie beispielsweise eine Speech-Ressource in der Region westus erstellen möchten, werden die Daten nur in der Region westus gespeichert.
Regions
Die Regionen in diesen Tabellen unterstützen die meisten Kernfunktionen des Speech-Diensts, darunter Spracherkennung, Sprachsynthese, Aussprachebewertung und Übersetzung. Für einige Funktionen, z. B. die schnelle Transkription und die Batch-Synthese-API, sind bestimmte Regionen erforderlich. In der Tabelle sind die Regionen angegeben, die die Funktionen unterstützen, für die bestimmte Regionen erforderlich sind.
1 Die Region verfügt über dedizierte Hardware für Custom Speech-Training. Wenn Sie ein benutzerdefiniertes Modell mit Audiodaten trainieren möchten, müssen Sie eine der Regionen mit dedizierter Hardware verwenden. Anschließend können Sie das trainierte Modell in eine andere Region kopieren.
Region
Neuronale Sprachsynthese
Batchsynthese-API
HD-Stimmen
Azure OpenAI-Stimmen
Benutzerdefinierte neuronale Stimme
Training für benutzerdefinierte neuronale Stimme
Hochleistungsendpunkt für eine benutzerdefinierte neuronale Stimme