Was ist ein Sprachassistent?

Artikel
03/10/2025

Durch die Verwendung von Sprach-Assistenten mit dem Speech-Dienst können Entwickler natürliche Konversationsschnittstellen für ihre Anwendungen und Umgebungen erstellen, die der menschlichen Sprache nahekommen. Die Funktion für den Sprach-Assistentendienst ermöglicht die schnelle, zuverlässige Interaktion zwischen einem Gerät und einer Assistentenimplementierung.

Auswählen einer Assistenten-Lösung

Im ersten Schritt beim Erstellen eines Sprach-Assistenten entscheiden Sie, was er tun soll. Der Speech-Dienst verfügt über mehrere Lösungen für die Entwicklung von Assistenten-Interaktionen, die sich gegenseitig ergänzen. Vielleicht soll Ihre Anwendung eine offene Unterhaltung mit Ausdrücken wie „Ich muss nach Seattle“ oder „Welche Art von Pizza kann ich bestellen?“ unterstützen.

Referenzarchitektur zum Erstellen eines Sprach-Assistenten mithilfe des Speech SDK

Konzeptionelle Darstellung des Orchestrierungsdienstflows für den Sprach-Assistenten

Wichtige Funktionen

Sowohl bei der Nutzung von benutzerdefinierten Schlüsselwörtern als auch bei einer anderen Lösung zum Erstellen Ihrer Assistenten-Interaktionen können Sie auf umfassende Anpassungsfunktionen zurückgreifen, mit denen Sie Ihren Assistenten an Ihre Wünsche in Bezug auf Marke, Produkt und Persönlichkeit anpassen können.

Kategorie	Features
Benutzerdefiniertes Schlüsselwort	Benutzer können Konversationen mit Assistenten mithilfe eines benutzerdefinierten Schlüsselworts wie „Hey Contoso“ beginnen. Eine App führt dies mit einer benutzerdefinierten Schlüsselwort-Engine im Speech SDK durch, das Sie unter Erste Schritte mit dem benutzerdefinierten Schlüsselwort konfigurieren können. Sprach-Assistenten können eine dienstseitige Schlüsselwortüberprüfung nutzen, um die Genauigkeit der Schlüsselwortaktivierung zu verbessern (statt diesen Vorgang nur über das Gerät durchzuführen).
Spracherkennung	Sprach-Assistenten wandeln mithilfe der Spracherkennung des Speech-Diensts Audiodaten in Echtzeit in erkannten Text um. Dieser Text ist während der Transkription sowohl für Ihre Assistentenimplementierung als auch für Ihre Clientanwendung verfügbar.
Sprachsynthese	Textantworten von Ihrem Assistenten werden mithilfe der Sprachsynthese des Speech-Diensts synthetisiert. Diese Synthese wird dann Ihrer Clientanwendung als Audiostream zur Verfügung gestellt. Mit Microsoft haben Sie die Möglichkeit, eine eigene benutzerdefinierte, hochwertige neuronale TTS-Stimme (Text-to-Speech, Sprachsynthese) zu erstellen, die Ihrer Marke Persönlichkeit verleiht.

Beispielcode und Tutorials

Beispielcode zum Erstellen eines Sprachassistenten ist auf GitHub unter Azure-Samples/Cognitive-Services-Voice-Assistant verfügbar.

Anpassung

Sprach-Assistenten, die Sie mit dem Speech-Dienst erstellen, können eine Vielzahl von Anpassungsoptionen verwenden.

Hinweis

Anpassungsoptionen variieren je nach Sprache und Gebietsschema. Erfahren Sie mehr über unterstützte Sprachen.

Freigeben über

Was ist ein Sprachassistent?

Auswählen einer Assistenten-Lösung

Referenzarchitektur zum Erstellen eines Sprach-Assistenten mithilfe des Speech SDK

Wichtige Funktionen

Beispielcode und Tutorials

Anpassung

Feedback

Zusätzliche Ressourcen

Freigeben über

Was ist ein Sprachassistent?

Auswählen einer Assistenten-Lösung

Referenzarchitektur zum Erstellen eines Sprach-Assistenten mithilfe des Speech SDK

Wichtige Funktionen

Beispielcode und Tutorials

Anpassung

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen