Compartir a través de


Escucha, Dont Just Recognize

[Microsoft Agent está en desuso a partir de Windows 7 y puede no estar disponible en versiones posteriores de Windows].

La comunicación correcta implica más que el reconocimiento de palabras. El proceso de diálogo implica intercambiar indicaciones para señalar la toma y comprensión. Los caracteres pueden mejorar las interfaces conversacionales proporcionando indicaciones como inclinaciones de la cabeza, nods o agitaciones para indicar cuándo el motor de voz está en estado de escucha y cuándo se reconoce algo. Por ejemplo, Microsoft Agent reproduce animaciones asignadas al estado De escucha cuando un usuario presiona la tecla de escucha de inserción a conversación y las animaciones asignadas al estado Audición cuando se detecta una expresión. Al definir su propio carácter, asegúrese de crear y asignar las animaciones adecuadas a estos estados. Para obtener más información sobre el diseño de caracteres, vea Diseñar caracteres para Microsoft Agent.

Además de las indicaciones no verbales, una conversación implica un contexto común entre las partes convergentes. Del mismo modo, es más probable que los escenarios de entrada de voz con caracteres se realicen correctamente cuando el contexto esté bien establecido. Establecer el contexto le permite interpretar mejor frases similares como "check's in the mail" y "check my mail". También puede permitir que el usuario consulte el contexto proporcionando un comando, como "Ayuda" o "Dónde estoy yo", al que responda indicando el contexto actual, como la última acción que realizó la aplicación.

Microsoft Agent proporciona interfaces que le permiten acceder a la mejor coincidencia y las dos siguientes mejores alternativas devueltas por el motor de reconocimiento de voz. Además, puede acceder a las puntuaciones de confianza de todas las coincidencias. Puede usar esta información para determinar mejor lo que se ha hablado. Por ejemplo, si las puntuaciones de confianza de la mejor coincidencia y la primera alternativa son cercanas, puede indicar que el motor de voz tenía dificultades para distinguir la diferencia entre ellos. En tal caso, es posible que quiera pedir al usuario que repita o refrase la solicitud en un esfuerzo por mejorar el rendimiento. Sin embargo, si las mejores alternativas de coincidencia y primera o segunda devuelven el mismo comando, refuerza la indicación del reconocimiento correcto.

La naturaleza de una conversación o diálogo implica que debe haber una respuesta a la entrada hablada. Por lo tanto, la entrada de un usuario siempre debe responderse con comentarios visuales o verbal que indican que se realizó una acción o se encontró un problema, o proporciona una respuesta adecuada.