Einführung

1 Minute

Mit Hilfe von KI-Sprachfunktionen können wir Haus- und Autosysteme mit Sprachanweisungen steuern, Antworten von Computern auf gesprochene Fragen erhalten, Untertitel aus Audioaufnahmen generieren und vieles mehr.

Um diese Art der Interaktion zu ermöglichen, muss das KI-System mindestens zwei Features unterstützen:

Spracherkennung: die Fähigkeit, gesprochene Eingaben zu erkennen und zu interpretieren
Sprachsynthese: die Fähigkeit, gesprochene Ausgaben zu generieren

Azure KI Speech bietet durch Spracherkennung und -synthese Funktionen für die Umwandlung von Sprache in Text, Text in Sprache und Sprachübersetzung. Sie können vorgefertigte und benutzerdefinierte Sprachdienstmodelle für eine Vielzahl von Aufgaben verwenden, von der Transkription von Audio in Text mit hoher Genauigkeit über die Identifizierung von Sprecher*innen in Gesprächen bis hin zur Erstellung benutzerdefinierter Stimmen und mehr. Als Nächstes erfahren Sie, wie KI-Sprachfunktionen funktionieren.

Einführung

Feedback