Partager via


Clarifier et limiter les choix

[Microsoft Agent est déconseillé à partir de Windows 7 et peut être indisponible dans les versions ultérieures de Windows.]

La reconnaissance vocale devient plus efficace lorsque l’utilisateur apprend la plage de grammaire appropriée. Il fonctionne également mieux lorsque l’éventail de choix est limité. Moins l’entrée est ouverte, mieux le moteur vocal peut analyser l’entrée d’informations acoustiques.

Microsoft Agent comprend plusieurs dispositions intégrées qui augmentent la réussite de la saisie vocale. La première est la fenêtre Commandes affichée lorsque l’utilisateur indique « Ouvrir la fenêtre commandes » ou « Que puis-je dire ? » (ou lorsque l’utilisateur choisit Ouvrir la fenêtre commandes dans le menu contextuel du caractère). La fenêtre Commande sert de guide visuel pour la grammaire active du moteur vocal. Il réduit également les erreurs de reconnaissance en activant uniquement la grammaire vocale de l’application active d’entrée et les commandes globales de Microsoft Agent. Par conséquent, la grammaire active du moteur vocal s’applique au contexte immédiat. Pour plus d’informations sur la fenêtre Commandes, consultez Vue d’ensemble de l’interface de programmation de Microsoft Agent.

Lorsque vous créez des commandes vocales microsoft Agent, vous pouvez créer le texte légende qui s’affiche dans la fenêtre Commandes, ainsi que son texte vocal (grammaire), les mots que le moteur doit utiliser pour faire correspondre cette commande. Essayez toujours de rendre vos commandes aussi distinctives que possible. Plus la différence entre la formulation des commandes est grande, en particulier pour le texte vocal, plus le moteur vocal sera susceptible de faire la distinction entre les commandes parlées et de fournir une correspondance précise. Évitez également les commandes simples ou très courtes. En règle générale, plus d’informations acoustiques dans un énoncé parlé donne au moteur une meilleure chance d’établir une correspondance précise.

Lorsque vous définissez le texte vocal d’une commande, fournissez une variété raisonnable de formulation. Les demandes qui signifient la même chose peuvent être formulée très différemment, comme illustré dans l’exemple suivant :

Ajouter du pepperoni.

J’aimerais des pepperonis.

Tu pourrais ajouter du pepperoni ?

Pepperoni, s’il vous plaît.

Microsoft Agent vous permet de spécifier facilement des alternatives ou des mots facultatifs pour la grammaire vocale de votre application. Vous placez d’autres mots ou expressions entre parenthèses, séparés par un caractère de barre verticale. Vous pouvez définir des mots facultatifs en les plaçant entre crochets. Vous pouvez également imbriquer des alternatives ou des mots facultatifs. En outre, vous pouvez également utiliser des points de suspension (...) dans le texte vocal comme espace réservé pour n’importe quel mot. Toutefois, l’utilisation trop fréquente d’ellipses peut rendre plus difficile pour le moteur de faire la distinction entre différentes commandes vocales. Dans tous les cas, assurez-vous toujours que votre texte vocal inclut au moins un mot distinctif pour chaque commande qui n’est pas facultative. En règle générale, cela doit correspondre à un ou plusieurs mots du texte légende que vous définissez qui s’affiche dans la fenêtre Commandes.

Bien que vous puissiez inclure des symboles, des ponctuations ou des abréviations dans votre texte légende, évitez-les dans votre texte vocal. De nombreux moteurs de reconnaissance vocale ne peuvent pas gérer les symboles et les abréviations ou peuvent les utiliser pour définir des paramètres d’entrée spéciaux. En outre, indiquez les nombres. Cela garantit également une prise en charge plus fiable de la reconnaissance.

Vous pouvez également utiliser des invites de directive pour éviter les entrées ouvertes. Les invites de directive référencent implicitement les choix ou les indiquent explicitement, comme illustré dans les exemples suivants :

Prompt Évaluation
Que veux-tu? Trop général, une demande ouverte
Choisissez un style de pizza ou un ingrédient. Bon, si les choix sont visibles, mais toujours généraux
Dites « Hawaïen », « Chicago » ou « The Works ». Mieux, une directive explicite avec des options spécifiques

 

Cela guide l’utilisateur vers l’émission d’une commande valide. En suggérant les mots ou l’expression, vous êtes plus susceptible d’obtenir le libellé attendu en retour. Pour éviter les répétitions anormales, modifiez le libellé ou raccourcissez l’original pour la présentation suivante à mesure que l’utilisateur devient plus expérimenté avec le style d’entrée. Les invites de directives peuvent également être utilisées dans les situations où l’utilisateur ne parvient pas à émettre une commande dans un délai prescrit ou ne fournit pas une commande attendue. Les invites de directive peuvent être fournies à l’aide de la sortie vocale, des interfaces de votre application ou des deux. La clé est d’aider l’utilisateur à connaître les choix appropriés.

Le libellé influence la réussite d’une invite. Par exemple, l’invite « Voulez-vous commander votre pizza ? » peut générer une réponse « Oui » ou « Non », mais elle peut également générer une demande de commande. Définissez les invites pour qu’elles ne soient pas ambiguës ou qu’elles soient prêtes à accepter une plus grande variété de réponses possibles. En outre, notez la tendance des gens à imiter les mots et les constructions qu’ils entendent. Cela peut souvent être utilisé pour vous aider à évoquer une réponse appropriée, comme dans l’exemple suivant :

Utilisateur: Montre-moi tous les messages de Paul.

Personnage:

Cela est plus susceptible d’obtenir le nom complet de l’une des parties avec le préfixe possible de « Je veux » ou « Je voulais dire ».

Étant donné que les caractères de l’Agent Microsoft fonctionnent dans l’interface visuelle de Microsoft Windows, vous pouvez utiliser des éléments visuels pour fournir des invites de directive pour l’entrée vocale. Par exemple, vous pouvez avoir le mouvement des caractères dans une liste de choix et demander à l’utilisateur d’en sélectionner un, ou d’afficher des choix dans une boîte de dialogue ou une fenêtre de message. Cela présente deux avantages : il suggère explicitement les mots que vous souhaitez que l’utilisateur parle et il fournit un autre moyen pour l’utilisateur de répondre.

Vous pouvez également utiliser d’autres modes d’interaction pour suggérer subtilement aux utilisateurs la grammaire vocale appropriée, comme illustré dans l’exemple suivant :

Utilisateur : (Clique sur l’option de pizza de style hawaïen avec la souris)

Personnage: Pizza hawaïenne.

Utilisateur : (clique sur l’option Fromage supplémentaire avec la souris)

Personnage: Ajoutez « Fromage supplémentaire ».

Un autre facteur important de la réussite de l’entrée vocale consiste à faire signe à l’utilisateur lorsque le moteur est prêt pour l’entrée, car de nombreux moteurs vocaux n’autorisent qu’un seul énoncé à la fois. Microsoft Agent prend en charge cette opération de deux manières. Tout d’abord, si le son carte prend en charge MIDI, Microsoft Agent génère une brève tonalité pour signaler lorsque le canal d’entrée vocale est disponible. Deuxièmement, la fenêtre Conseil d’écoute affiche une invite de texte appropriée lorsque le caractère (moteur vocal) écoute l’entrée. En outre, ce conseil affiche ce que le moteur a entendu.