Compartir a través de


Ser eficaz y natural

[Microsoft Agent está en desuso a partir de Windows 7 y puede no estar disponible en versiones posteriores de Windows.

Al realizar tareas, las conversaciones humanas eficaces suelen intercambiar información breve. A menudo, los elementos de la discusión se establecen entre las partes y, a continuación, se hace referencia a ellas indirectamente mediante respuestas abreviadas. Estas formas de abreviatura son beneficiosas porque son eficientes, y también implican que el hablante y el agente de escucha tienen un contexto común; es decir, que se comunican. El uso de formas apropiadas de abreviatura también hace que un diálogo sea más natural.

Una forma de abreviatura conversacional es el uso de contracciones. Cuando no se usan, hacen que un hablante parezca más formal y rígido, y a veces menos humano. La mayoría de las conversaciones humanas demuestran más libertad en las reglas lingüísticas que el texto escrito.

Otra forma común de abreviatura en las conversaciones es anaphora, el uso de pronombres. Por ejemplo, cuando alguien pregunta, "¿Has visto Bill hoy?", las respuestas que sustituyen "él" por "Bill" son más naturales que repetir el nombre de nuevo. La sustitución es una indicación de que las partes del diálogo comparten un contexto común de quién es "él". Tenga en cuenta que la palabra "I" hace referencia al personaje cuando lo dice.

El contexto compartido también se comunica mediante el uso de puntos suspensivos lingüísticos, el truncamiento de muchas de las palabras de la consulta original. Por ejemplo, el agente de escucha podría responder, "Sí, lo vi", mostrando el contexto compartido de cuándo o incluso responder con un simple "Sí" que muestra el contexto compartido de quién y cuándo.

La comprensión implícita también se puede transmitir a través de otras formas de estilo conversacional abreviado, donde el contenido se deduce sin repetición, como se muestra en el ejemplo siguiente:

Usuario: Me gustaría una pizza de estilo Chicago.

Carácter: ¿Con "queso extra"?

Del mismo modo, si alguien dice, "Está caliente aquí", la frase es comprensible y no requiere más detalles si sabe dónde está el hablante. Sin embargo, si el contexto no está bien establecido o es ambiguo, eliminar todas las referencias contextuales puede dejar al usuario confundido.

Al usar la comunicación abreviada, tenga siempre en cuenta el contexto del usuario y el tipo de contenido. Es adecuado usar descripciones más largas para información nueva y desconocida. Sin embargo, incluso con información descriptiva larga, intente dividirla en fragmentos más pequeños. Esto te ofrece la posibilidad de cambiar la animación a medida que el personaje habla. También proporciona una mayor oportunidad para que el usuario interrumpa el carácter, especialmente cuando se usa la entrada de voz.

La coherencia es importante en la salida de voz. Los patrones de voz extraños o la prosodia pueden interpretarse como una degradación de la inteligencia del carácter. De forma similar, el cambio entre TTS y voz grabada puede hacer que los usuarios interpreten el carácter como extraño o que poseen más de una personalidad. Los movimientos de la boca sincronizados con labios pueden mejorar la inteligibilidad de la voz. Microsoft Agent admite automáticamente la sincronización de labios para los motores TTS que cumplen con sus interfaces SAPI necesarias. Sin embargo, la sincronización de labios también se admite para la voz grabada. Los archivos de sonido también se pueden mejorar con la Herramienta de edición lingüística de sonido de Microsoft.