Partage via


Qu’est-ce qu’un Assistant vocal ?

Avec les assistants vocaux qui utilisent le service Speech, les développeurs peuvent créer des interfaces conversationnelles naturelles pour leurs applications et leurs expériences. Le service d’assistant vocal permet une interaction rapide et fiable entre un appareil et une implémentation d’assistant.

Choix d’une solution d’Assistant

La première étape de la création d’un assistant vocal consiste à décider de ce que vous voulez faire. Le service Speech fournit plusieurs solutions complémentaires pour la création des interactions de votre Assistant. Vous souhaiterez peut-être que votre application prenne en charge une conversation ouverte avec des phrases telles que « Je dois aller à Seattle » ou « Quel type de pizza puis-je commander ? »

Architecture de référence pour la création d’un assistant vocal à l’aide du kit de développement logiciel (SDK) Speech

Diagramme conceptuel du flux du service d’orchestration de l’assistant vocal.

Fonctionnalités de base

Que vous choisissiez un mot-clé personnalisé ou une autre solution pour créer vos interactions d'assistant, vous pouvez utiliser un riche ensemble de fonctionnalités de personnalisation pour personnaliser votre assistant en fonction de votre marque, de votre produit et de votre personnalité.

Catégorie Fonctionnalités
Mot clé personnalisé Les utilisateurs peuvent démarrer des conversations avec des assistants à l’aide d’un mot clé personnalisé, tel que « Hey contoso ». Une application fait cela avec un moteur de mots clés personnalisé dans le kit de développement logiciel (SDK) Speech, que vous pouvez configurer en vous rendant dans prise en main des mots clés personnalisés. Les assistants vocaux peuvent utiliser la vérification des mots clés côté service pour améliorer la précision de l’activation des mots clés (par rapport à l’appareil seul).
Reconnaissance vocale Les assistants vocaux convertissent en temps réel le contenu audio en texte écrit à l’aide de la reconnaissance vocale du service Speech. Lors de sa transcription, ce texte est disponible pour l’implémentation de votre assistant et votre application cliente.
Synthèse vocale Les réponses textuelles de votre assistant seront synthétisées à l’aide de la synthèse vocale du service Speech. Cette synthèse est ensuite disponible pour votre application cliente sous forme de flux audio. Microsoft offre la possibilité de créer votre propre Synthèse vocale neuronale (TTS neuronale) personnalisée et de haute qualité qui donne une voix à votre marque.

Exemple de code et tutoriels

Un exemple de code pour la création d'un assistant vocal est disponible sur GitHub à l'adresse Azure-Samples/Cognitive-Services-Voice-Assistant.

Personnalisation

Les assistants vocaux que vous générez à l’aide du service Speech peuvent utiliser une gamme complète d’options de personnalisation.

Notes

Les options de personnalisation varient selon la langue et les paramètres régionaux. Pour en savoir plus, consultez Langages pris en charge.