Was ist ein Sprachassistent?
Durch die Verwendung von Sprach-Assistenten mit dem Speech-Dienst können Entwickler natürliche Konversationsschnittstellen für ihre Anwendungen und Umgebungen erstellen, die der menschlichen Sprache nahekommen. Die Funktion für den Sprach-Assistentendienst ermöglicht die schnelle, zuverlässige Interaktion zwischen einem Gerät und einer Assistentenimplementierung.
Auswählen einer Assistenten-Lösung
Im ersten Schritt beim Erstellen eines Sprach-Assistenten entscheiden Sie, was er tun soll. Der Speech-Dienst verfügt über mehrere Lösungen für die Entwicklung von Assistenten-Interaktionen, die sich gegenseitig ergänzen. Vielleicht soll Ihre Anwendung eine offene Unterhaltung mit Ausdrücken wie „Ich muss nach Seattle“ oder „Welche Art von Pizza kann ich bestellen?“ unterstützen.
Referenzarchitektur zum Erstellen eines Sprach-Assistenten mithilfe des Speech SDK
Wichtige Funktionen
Sowohl bei der Nutzung von benutzerdefinierten Schlüsselwörtern als auch bei einer anderen Lösung zum Erstellen Ihrer Assistenten-Interaktionen können Sie auf umfassende Anpassungsfunktionen zurückgreifen, mit denen Sie Ihren Assistenten an Ihre Wünsche in Bezug auf Marke, Produkt und Persönlichkeit anpassen können.
Kategorie | Features |
---|---|
Benutzerdefiniertes Schlüsselwort | Benutzer können Konversationen mit Assistenten mithilfe eines benutzerdefinierten Schlüsselworts wie „Hey Contoso“ beginnen. Eine App führt dies mit einer benutzerdefinierten Schlüsselwort-Engine im Speech SDK durch, das Sie unter Erste Schritte mit dem benutzerdefinierten Schlüsselwort konfigurieren können. Sprach-Assistenten können eine dienstseitige Schlüsselwortüberprüfung nutzen, um die Genauigkeit der Schlüsselwortaktivierung zu verbessern (statt diesen Vorgang nur über das Gerät durchzuführen). |
Spracherkennung | Sprach-Assistenten wandeln mithilfe der Spracherkennung des Speech-Diensts Audiodaten in Echtzeit in erkannten Text um. Dieser Text ist während der Transkription sowohl für Ihre Assistentenimplementierung als auch für Ihre Clientanwendung verfügbar. |
Sprachsynthese | Textantworten von Ihrem Assistenten werden mithilfe der Sprachsynthese des Speech-Diensts synthetisiert. Diese Synthese wird dann Ihrer Clientanwendung als Audiostream zur Verfügung gestellt. Mit Microsoft haben Sie die Möglichkeit, eine eigene benutzerdefinierte, hochwertige neuronale TTS-Stimme (Text-to-Speech, Sprachsynthese) zu erstellen, die Ihrer Marke Persönlichkeit verleiht. |
Beispielcode und Tutorials
Beispielcode zum Erstellen eines Sprachassistenten ist auf GitHub unter Azure-Samples/Cognitive-Services-Voice-Assistant verfügbar.
Anpassung
Sprach-Assistenten, die Sie mit dem Speech-Dienst erstellen, können eine Vielzahl von Anpassungsoptionen verwenden.
Hinweis
Anpassungsoptionen variieren je nach Sprache und Gebietsschema. Erfahren Sie mehr über unterstützte Sprachen.