Partager via


Configurer les fonctionnalités vocales

Cet article décrit les fonctionnalités disponibles dans Copilot Studio pour la réponse vocale interactive avec Dynamics 365 Customer Service.

Pour préparer votre agent pour les services vocaux, consultez Intégrer un agent activé par la voix à Dynamics 365 Customer Service.

Pour obtenir une vue d’ensemble des services vocaux, consultez Utiliser la réponse vocale interactive dans vos agents.

Modalité Voix et DTMF

Un agent activé pour la voix est différent d’un agent basé sur la conversation instantanée. L’agent activé par la voix inclut des rubriques système vocales spécifiques pour la gestion des scénarios vocaux. Un agent basé sur la conversation instantanée utilise la modalité Texte par défaut. Un agent activé par la voix utilise la modalité Voix et DTMF. Les deux modalités ne sont pas compatibles entre elles.

Optimiser pour la voix vous permet de créer des agents activés par la voix selon différentes modalités et garantit que les fonctionnalités vocales sont créées correctement.

Optimiser pour la voix

Si vous n’avez pas démarré votre agent avec le modèle vocal, vous devez activer l’option Optimiser pour la voix dans les Paramètres de l’agent.

  1. Avec un agent ouvert, accédez à Paramètres>Voix.

  2. Sélectionnez Optimiser pour la voix. L’option Utiliser la voix comme mode de création principal est également définie par défaut.

Votre agent reçoit les mises à jour suivantes lorsque vous activez les options Optimiser pour la voix et Utiliser la voix comme mode de création principal :

  • La possibilité de créer des fonctionnalités vocales lorsque vous passez de texte à Voix et DTMF.
  • Les rubriques système vocales Détection de silence, Voix non reconnue et Appui inconnu sur le pavé numérique sont automatiquement ajoutées pour gérer les scénarios liés à la voix.
  • Augmentez la précision avec les données de l’agent (activé par défaut), ce qui améliore la précision de la reconnaissance vocale.
  • Aucune modification n’est apportée au flux d’agent existant, comme la rubrique Menu principal permettant de démarrer des conversations avec des déclencheurs DTMF mappés.

Important

  • Le paramètre Optimiser pour la voix modifie uniquement les fonctionnalités de création vocale, et non le paramètre du canal. Activez le canal Téléphonie pour un agent entièrement activé par la voix.
  • De plus, si vous définissez l’option Optimiser pour la voix sur un agent qui n’a pas été configuré initialement pour les fonctionnalités vocales, cela signifie que l’agent ne disposera pas de la rubrique Menu principal (version préliminaire). Vous devez recréer cette rubrique, si nécessaire.

Désactiver l’optimisation pour la voix

Vous pouvez désactiver l’option Optimiser pour la voix dans la création d’agents si vous n’activez pas le canal de téléphonie. Après avoir désactivé Optimiser pour la voix, vous obtenez les modifications suivantes :

  • Aucune création d’agent pour les fonctionnalités vocales, telles que DTMF et l’interruption.
  • La modalité texte par défaut est définie.
  • Aucune amélioration de la reconnaissance vocale, puisqu’il n’y a pas de reconnaissance vocale.
  • Aucune rubrique système vocale ni rubrique DTMF globale.

    Note

    Certaines rubriques peuvent signaler des erreurs lors de la publication si la rubrique DTMF désactivée est référencée dans d’autres rubriques.

  • Aucune modification n’a été apportée au flux d’agent et au paramètre de canal, car la désactivation de l’optimisation ne désactive pas le canal de téléphonie.
  • L’activation ou la désactivation de l’option Optimiser pour la voix ne prend effet qu’une fois que vous avez publié votre agent. Si l’agent est activé ou désactivé accidentellement et passe d’une modalité à l’autre, vous avez le temps de le corriger.

Important

Si vos canaux de téléphonie sont activés, la désactivation de l’option Optimiser pour la voix peut interrompre votre agent, car tous les déclencheurs DTMF sont automatiquement désactivés.

Utiliser la voix comme mode de création principal

La modalité Voix et DTMF doit être sélectionnée pour chaque nœud lors de la création de la fonctionnalité vocale. Vous pouvez sélectionner la préférence de création de l’agent en tant que Utiliser la voix comme mode de création principal. Ce paramètre garantit que tous les champs de saisie ont la modalité correcte. Si vous avez déjà activé Optimiser pour la voix, l’option Utiliser la voix comme mode de création principal est activée par défaut.

Disponibilité du message

L’utilisation de la modalité de texte ou vocale peut affecter votre canal différemment.

Modalité de texte Modalité vocale Canal de texte et de voix de l’agent
Message disponible Message vide Message disponible
Message vide Message disponible Message non disponible

Personnalisation automatique de la reconnaissance vocale

Les agents activés par la voix d’un domaine spécifique, tel que la médecine ou la finance, peuvent voir les utilisateurs utiliser des termes financiers ou un jargon médical. Certains termes et jargons sont difficiles à convertir en reconnaissance vocale pour l’agent activé par la voix.

Pour garantir que l’entrée vocale est reconnue avec précision, vous pouvez améliorer la reconnaissance vocale :

  1. Avec votre agent ouvert, sélectionnez Paramètres>Voix.

  2. Sélectionnez Améliorer la précision avec les données de l’agent pour activer les paramètres de reconnaissance vocale automatiques personnalisés par défaut de l’agent.

  3. Sélectionnez Enregistrer pour valider vos modifications.

  4. Publiez votre agent pour voir les nouvelles modifications.

Référence des options vocales au niveau de l’agent

La page Détails de l’agent vous permet de configurer les délais d’expiration pour diverses fonctionnalités vocales. Les paramètres appliqués dans cette page deviennent les paramètres par défaut pour les rubriques créées dans votre agent.

Pour modifier les options de délai d’expiration au niveau de l’agent :

  1. Avec un agent ouvert, sélectionnez Paramètres>Voix.

    Capture d’écran des paramètres vocaux d’un agent activé par la voix.

  2. Sélectionnez les paramètres souhaités et ajustez les paramètres par défaut de l’agent.

  3. Sélectionnez Enregistrer pour valider vos modifications.

Paramètres au niveau de l’agent

Le tableau suivant répertorie chaque option et sa relation avec les paramètres au niveau du nœud.

Section au niveau de l’agent activé par la voix Paramètre Description Default value Remplacement au niveau du nœud
DTMF Délai d’expiration entre les chiffres Temps maximum (millisecondes) autorisé en attendant la prochaine entrée de la clé DTMF. Applique l’entrée DTMF à plusieurs chiffres uniquement lorsque les utilisateurs ne respectent pas la longueur maximale de l’entrée. 3000 ms Nœud de question avec propriétés vocales pour l’entrée DTMF à plusieurs chiffres
DTMF Délai d’expiration Durée d’attente maximale (en millisecondes) d’une clé de terminaison DTMF. La limite s’applique lorsque l’utilisateur atteint la longueur maximale de l’entrée et n’a pas appuyé sur la touche de terminaison. S’applique uniquement à l’entrée DTMF à plusieurs chiffres.

Une fois que la limite a expiré et que la clé DTMF de terminaison n’arrive pas, l’agent met fin à la reconnaissance et renvoie le résultat jusqu’à ce point.

S’il est défini sur « Continuer sans attendre », l’agent n’attend pas la clé de résiliation. L’agent renvoie immédiatement une fois que l’utilisateur a entré la longueur maximale.
2000 ms Nœud de question avec propriétés vocales pour l’entrée DTMF à plusieurs chiffres
Détection du silence Délai d’expiration de détection du silence Silence maximum (millisecondes) autorisé en attendant l’entrée de l’utilisateur. Une limite s’applique lorsque l’agent ne détecte aucune entrée utilisateur. La valeur par défaut est « Aucun délai d’expiration du silence ». L’agent attend indéfiniment l’entrée de l’utilisateur.

La détection de silence pour la voix calcule la période une fois que la voix a fini de parler.
Aucun délai d’expiration de silence Nœud de question avec propriétés vocales pour l’entrée DTMF à plusieurs chiffres

Rubrique système (propriétés du déclencheur de détection du silence) pour Configurer la détection du silence et les délais d’expiration
Collecte de données vocales Délai de fin d’énoncé La limite s’applique lorsque l’utilisateur fait une pause pendant ou après la prise de parole. Si la pause dépasse la limite du délai d’expiration, l’agent présume que l’utilisateur a fini de parler.

La valeur maximale du délai de fin de l’énoncé est de 3 000 millisecondes. Tout ce qui dépasse 3 000 ms est réduit à 3 000 millisecondes.
1500 ms Nœud de question avec propriétés vocales
Collecte de données vocales Délai d’expiration de reconnaissance vocale Détermine la durée accordée par l’agent à l’entrée de l’utilisateur une fois qu’il a commencé à parler. La valeur par défaut est 12 000 millisecondes (environ 12 secondes). Aucun délai de reconnaissance signifie que le temps est infini. L’agent répète la question. En l’absence de réponse, la voix a dépassé le Délai de reconnaissance vocale. 12,000 ms Nœud de question avec propriétés vocales
Messagerie de latence Délai d’envoi du message Détermine la durée d’attente de l’agent avant de délivrer le message de latence après le démarrage d’une demande d’opération en arrière-plan. Le temps est défini en millisecondes. 500 ms Propriétés du nœud d’action pour les opérations de longue durée
Messagerie de latence Durée minimale de lecture Le message de latence est lu pendant une durée minimale, même si l’opération en arrière-plan se termine pendant la lecture du message. Le temps est défini en millisecondes. 5000 ms Propriétés du mode d’action pour les opérations de longue durée
Sensibilité vocale Confidentialité Contrôle la manière dont le système équilibre la détection de la voix et du bruit de fond. Réduisez la sensibilité pour les environnements bruyants, les espaces publics et le fonctionnement mains libres. Augmentez la sensibilité pour les environnements calmes, les utilisateurs parlant à voix basse ou la détection de commandes vocales. Le paramètre par défaut est 0.5. 0.5 Il n’existe aucune remplacement au niveau du nœud pour ce contrôle.

Activer l’interruption

L’activation de l’interruption permet aux utilisateurs de votre agent d’interrompre votre agent. Cette fonctionnalité peut être utile lorsque vous n’avez pas besoin que l’utilisateur de l’agent entende l’intégralité du message. Par exemple, les appelants connaissent peut-être déjà les options du menu, car ils les ont déjà entendues. Avec l’interruption, l’utilisateur de l’agent peut entrer l’option souhaitée, même si l’agent n’a pas fini de lister toutes les options.

Scénarios de désactivation de l’interruption

  • Désactivez l’interruption si vous avez récemment mis à jour un message de l’agent ou si le message de conformité ne doit pas être interrompu.
  • Désactivez l’interruption pour le premier message de l’agent pour vous assurer que les utilisateurs de l’agent connaissent les informations nouvelles ou essentielles.

Spécifications

  • L’interruption prend en charge les interruptions DTMF et vocales de l’utilisateur de l’agent.

  • L’interruption peut être contrôlée avec chaque message, en un seul lot. Placez les nœuds barge-in-disabled dans la séquence avant chaque nœud où l’interruption est autorisée. Sinon, l’interruption désactivée est traitée comme un message d’autorisation de l’interruption.

    Capture d’écran des emplacements de l’interruption et de l’interruption désactivée dans les nœuds de message.

    Une fois qu’une file d’attente par lots est terminée, le paramètre d’interruption automatique est réinitialisé pour le lot suivant et contrôlé par l’indicateur d’interruption à chaque message suivant. Vous pouvez placer des nœuds d’interruption désactivée lorsque la séquence recommence.

Astuce

S’il existe des nœuds de messages consécutifs, suivis par un nœud de question, les messages vocaux pour ces nœuds sont définis comme un seul lot. Un lot commence par un nœud de message et s’arrête au nœud de question, qui attend l’entrée de l’utilisateur.

Évitez de désactiver l’interruption pour les messages longs, en particulier si les utilisateurs de l’agent doivent interagir souvent avec l’agent. Si l’utilisateur de votre agent connaît déjà les options du menu, laissez-le choisir de manière autonome là où il souhaite aller.

Configurer l’interruption

  1. Avec un nœud Message ou Question sélectionné, définissez la modalité souhaitée sur Voix et DTMF.

  2. Sélectionnez l’icône Plus () du nœud, puis sélectionnez Propriétés.

    1. Pour les nœuds Message, le volet Envoyer les propriétés de l’activité s’ouvre sur le côté du canevas de création.

      Sélectionnez Autoriser l’interruption.

    2. Pour les nœuds Question, le volet Propriétés de la question s’ouvre, puis sélectionnez Voix.

      Dans les propriétés Voix, sélectionnez Autoriser l’interruption.

  3. Enregistrez la rubrique pour valider vos modifications.

Configurer la détection de silence et les délais d’expiration

La détection de silence vous permet de configurer la durée d’attente de l’entrée utilisateur par l’agent et l’action qu’il effectue si aucune entrée n’est reçue. La détection du silence est particulièrement utile en réponse à une question au niveau du nœud ou lorsque l’agent attend une phrase déclencheur pour commencer une nouvelle rubrique.

Vous pouvez configurer les délais d’expiration par défaut pour les rubriques.

Pour remplacer les valeurs par défaut d’un nœud :

  1. Sélectionnez l’icône Plus () du nœud, puis sélectionnez Propriétés.

    Le volet Propriétés de la question s’ouvre.

  2. Sélectionnez Voix et ajustez les paramètres suivants :

    Option de délai d’expiration de la détection de silence Description
    Utiliser le paramètre de l’agent Le nœud utilise le paramètre global pour la détection de silence.
    Désactiver pour ce nœud L’agent attend indéfiniment une réponse.
    Personnaliser en millisecondes L’agent attend une durée spécifiée avant de répéter la question.

Action de secours

Vous pouvez configurer certains comportements comme action de secours :

  • Combien de fois l’agent doit-il répéter une question ?
  • Ce que le message de nouvelle invite doit dire
  • Ce que l’agent doit faire après un nombre spécifié de répétitions

Entrée vocale

Pour l’entrée vocale, vous pouvez spécifier :

  • Délai de fin d’énoncé : durée d’attente de l’agent une fois que l’utilisateur a fini de parler
  • Délai d’expiration de la reconnaissance vocale : durée que l’agent accorde à l’utilisateur une fois qu’il a commencé à répondre

Pour configurer le comportement de détection du silence lorsque votre agent attend une phrase déclencheur, ajustez les paramètres dans la rubrique système En silence .

Ajouter un message de latence pour les opérations de longue durée

Pour les opérations backend longues, votre agent peut envoyer un message aux utilisateurs pour les informer des processus plus longs. Les agents d’un canal de messagerie peuvent également envoyer un message de latence.

Lecture audio du message de latence Message de latence dans la conversation instantanée
Continue à s’exécuter en boucle jusqu’à ce que l’opération soit terminée. Envoyé une seule fois lorsque la latence spécifiée est atteinte.

Dans Copilot Studio, votre agent peut répéter un message après avoir déclenché un flux Power Automate :

  1. Ajoutez un nœud Action qui déclenche un flux.

  2. Sélectionnez l’icône Plus () du nœud, puis sélectionnez Propriétés. Le volet Propriétés de l’action s’ouvre.

  3. Sélectionnez Envoyer un message.

  4. Dans la section Message, entrez ce que vous voulez que l’agent dise. Vous pouvez utiliser SSML pour modifier le son du message. L’agent répète le message jusqu’à ce que le flux soit terminé.

Vous pouvez ajuster le temps d’attente de l’agent avant de répéter le message dans la section Délai. Vous pouvez définir une durée d’attente minimale, même si le flux se termine.

Configurer la terminaison de l’appel

Pour configurer votre agent pour qu’il mette fin à l’appel et raccroche, ajoutez un nouveau nœud (+), puis sélectionnez Gestion des rubriques>Terminer la conversation.

Capture d’écran d’un nouveau menu de nœud avec Gestion des rubriques et Terminer la conversation en évidence.

Formater la synthèse vocale avec SSML

Vous pouvez utiliser le langage SSML (Speech Synthesis Markup Language) pour modifier le son de l’agent lorsqu’il lit des messages à voix haute. Par exemple, vous pouvez modifier la tonalité ou la fréquence des mots prononcés, la vitesse et le volume.

SSML utilise des balises pour entourer le texte que vous souhaitez modifier, de la même manière que HTML. Vous pouvez utiliser les balises suivantes dans Copilot Studio :

Balise SSML Description Lien vers la documentation du service vocal
<audio src="_URL to an audio file_"/> Ajoutez l’URL à un fichier audio dans la balise. Le fichier doit être accessible par l’utilisateur de l’agent. Ajouter un audio enregistré
<break /> Insérez des pauses ou des interruptions entre les mots. Insérez des options d’interruption dans la balise. Ajouter une interruption
<emphasis> Texte que vous souhaitez modifier</emphasis> Ajoutez des niveaux d’accentuation aux mots ou aux phrases. Ajoutez des options d’accentuation dans la balise d’ouverture. Ajoutez la balise de fermeture après le texte que vous souhaitez modifier. Ajuster les options d’accentuation
<prosody> Texte que vous souhaitez modifier</prosody> Spécifiez les changements d’intonation, de contour, de plage, de débit et de volume. Ajoutez des options de prosodie dans la balise d’ouverture. Ajoutez la balise de fermeture après le texte que vous souhaitez modifier. Ajuster les options de prosodie
<lang xml:lang="xx-XX"> Texte que vous souhaitez modifier</lang> Ajustez la langue parlée dans le même message lors de l’utilisation d’une voix neuronale multilingue. Ajuster les langues parlées

Capture d’écran d’un message vocal avec des balises SSML ajoutées.

Rechercher et utiliser une balise

SSML utilise des balises pour entourer le texte que vous souhaitez modifier, comme HTML.

Vous pouvez utiliser les balises suivantes dans Copilot Studio :

  1. Avec un nœud Message ou Question sélectionné, modifiez le mode en Voix et DTMF.

  2. Sélectionnez le menu Balises SSML et sélectionnez une balise.

    La zone de message est remplie avec la balise. Si la zone de message contient déjà du texte, le code de la balise est ajouté à la fin de votre message.

  3. Entourez le texte que vous souhaitez modifier avec les balises d’ouverture et de fermeture. Vous pouvez combiner plusieurs balises et personnaliser des parties individuelles du message avec des balises individuelles.

Astuce

Vous pouvez saisir manuellement des balises SSML qui n’apparaissent pas dans le menu d’assistance. Pour en savoir plus sur les autres balises que vous pouvez utiliser, consultez Améliorer la synthèse avec le langage de balisage de synthèse vocale.

Transférer un appel à un représentant ou à un numéro de téléphone externe

Vous pouvez permettre à l’agent de transférer l’appel vers un numéro de téléphone externe. Copilot Studio prend en charge le transfert en aveugle vers un numéro de téléphone RTC et le numéro d’acheminement direct.

Pour transférer vers un numéro de téléphone externe :

  1. Dans la rubrique que vous souhaitez modifier, ajoutez un nouveau nœud (+). Dans le menu du nœud, sélectionnez Gestion des rubriques, puis Transférer la conversation.

  2. Sous Type de transfert, sélectionnez Transfert vers un numéro de téléphone externe et saisissez le numéro de transfert.

  3. (Facultatif) Ajoutez un en-tête SIP UUI à l’appel téléphonique.

    Cet en-tête est une chaîne de paires key=value, sans espaces ni caractères spéciaux, affichées pour que les systèmes externes puissent les lire.

    1. Sélectionnez l’icône Plus () du nœud, puis sélectionnez Propriétés. Le volet Transférer les propriétés de la conversation s’ouvre.

    2. Sous En-tête SIP UUI, saisissez les informations que vous souhaitez envoyer avec le transfert d’appel. Les variables ne sont pas prises en charge lors du transfert vers un numéro de téléphone externe.

    Avertissement

    Seuls les 128 premiers caractères de la chaîne sont envoyés.

    L’en-tête n’accepte que les chiffres, les lettres, les signes égal (=) et les points-virgules (;). Tous les autres caractères, y compris les espaces, les accolades et les crochets, ou les formules ne sont pas pris en charge et peuvent entraîner l’échec du transfert.

Astuce

Incluez un + dans votre numéro de téléphone pour l’indicatif du pays correspondant.

La sortie du transfert avec SIP UUI pour le numéro de téléphone cible doit utiliser le routage direct. Les numéros de téléphone du Réseau téléphonique commuté (PSTN) ne prennent pas en charge les transferts d’en-tête SIP UUI.

Pour transférer vers un représentant, voir Déclencheurs explicites.

Utiliser les variables vocales

Copilot Studio prend en charge la population de variables. Vous pouvez utiliser des variables prédéfinies ou créer des variables personnalisées.

Note

  • Pour plus d’informations sur la façon d’utiliser et de créer des variables dans Copilot Studio, voir Utiliser des variables.
  • Pour plus d’informations sur les variables d’activité et de conversation supplémentaires disponibles pour les agents activés par la voix, consultez Variables pour les agents à commande vocale.

Un agent activé par la voix dans Copilot Studio prend en charge les variables de contexte. Ces variables vous aident à intégrer les conversations de vos agents à Dynamics 365 Customer Service lors du transfert d’un appel.

Pour plus d’informations sur les variables de contexte dans Dynamics 365 Customer Service, voir Variables de contexte pour les bots Copilot Studio.

Cettte intégration prend en charge ces scénarios avec les variables suivantes lors du transfert :

Variable Type Description
System.Activity.From.Name String ID d’appelant de l’utilisateur de l’agent
System.Activity.Recipient.Name String Le numéro utilisé pour appeler ou se connecter à l’agent
System.Conversation.SipUuiHeaderValue String Valeur de l’en-tête SIP lors d’un transfert via un numéro de téléphone à routage direct
System.Activity.UserInputType String Indique si l’utilisateur de l’agent a utilisé DTMF ou la voix dans la conversation
System.Activity.InputDTMFKey String Entrée DTMF brute de l’utilisateur de l’agent
System.Conversation.OnlyAllowDTMF Valeur booléenne La voix ignore l’entrée vocale lorsqu’elle est définie sur true
System.Activity.SpeechRecognition.Confidence Nombre Valeur de confiance (entre 0 et 1) du dernier événement de reconnaissance vocale
System.Activity.SpeechRecognition.MinimalFormattedText Chaîne Résultats de la reconnaissance vocale (sous forme de texte brut) avant que Copilot Studio n’applique son modèle de compréhension du langage naturel dédié

Note

  • La publication d’un agent avec des phrases déclencheurs et des tailles d’entité volumineuses prend plus de temps.
  • Si plusieurs utilisateurs publient le même agent en même temps, votre action de publication est bloquée. Vous devez republier l’agent une fois que d’autres ont terminé leurs modifications existantes de l’agent.

Pour en savoir plus sur les fondamentaux de la publication, consultez Concepts clés - Publier et déployer votre agent.