Ofrecimiento de una buena recuperación de errores

Artículo
06/13/2023

[Microsoft Agent está en desuso a partir de Windows 7 y puede no estar disponible en versiones posteriores de Windows.

Al igual que con cualquier interfaz bien diseñada, el proceso interactivo debe minimizar las circunstancias que conducen a errores. Sin embargo, rara vez es posible eliminar todos los errores, por lo que admitir una buena recuperación de errores es esencial para mantener la confianza y el interés del usuario. En general, la recuperación de errores implica detectar un error, determinar la causa y definir una manera de resolver el error. Los usuarios responden mejor a las interfaces que son cooperativas, que funcionan con el usuario para realizar una tarea.

El primer paso en la recuperación de errores de voz es detectar la condición de error. El reconocimiento de voz puede producir un error debido a una variedad de errores. Normalmente, las condiciones de error se pueden detectar como resultado de una entrada no válida, corrección o cancelación explícita del usuario o repetición del usuario.

Se produce un error de rechazo cuando el motor de reconocimiento no coincide con lo que el usuario ha dicho. El ruido en segundo plano o los inicios tempranos también son causas comunes del error de reconocimiento, por lo que pedir al usuario que repita un comando suele ser una buena solución inicial. Sin embargo, si la frase está fuera de la gramática activa actual, pedir al usuario que vuelva a crear la solicitud puede resolver el problema. La diferencia en la redacción puede dar lugar a una coincidencia con algo de la gramática actual. Enumerar o sugerir las opciones de entrada esperadas adecuadas es otra alternativa.

Una buena estrategia para la recuperación de errores de rechazo consiste en combinar estas técnicas para volver a realizar el seguimiento del usuario, lo que ofrece cada vez más ayuda si el error persiste. Por ejemplo, puede comenzar respondiendo al error inicial con un interrogativo como "Huh?" o "What?" o un gesto de mano a la oreja. Una respuesta corta aumenta la probabilidad de que la instrucción repetida del usuario no produzca un error porque el usuario habló demasiado pronto. Tras un error repetido, la solicitud posterior para la repetición de la operación mejora la posibilidad de buscar coincidencias con algo dentro de la gramática especificada. Desde aquí, proporcionar mensajes explícitos de comandos aceptados aumenta aún más la posibilidad de una coincidencia. Esta técnica se ilustra en el ejemplo siguiente:

Usuario: Me gustaría una pizza de estilo Chicago con anchoas.

Carácter: (Mano a oreja) ¿Eh?

Usuario: Quiero una pizza de Chicago con anchoas.

Carácter: (agitación de la cabeza) Repríba su solicitud.

Usuario: Dije pizza de Chicago, con anchoas.

Carácter: (Shrug) Lo siento. Dime el estilo de pizza que quieres.

Usuario: Chicago, con anchoas.

Carácter: Todavía no hay suerte. Esto es lo que puedes decir: "Chicago", "Hawaiano" o "Combo".

Para que el control de errores se sienta más natural, asegúrese de proporcionar un grado de variación aleatoria al responder a errores. Además, una reacción natural del usuario a cualquier solicitud para repetir una respuesta es exagerar o aumentar el volumen al repetir la instrucción. Puede ser útil recordar ocasionalmente al usuario que hable con normalidad y claramente, ya que la exageración o el aumento del volumen pueden dificultar que el motor de voz reconozca las palabras.

La asistencia progresiva debe hacer más que llevar el error a la atención del usuario; debe guiar al usuario hacia el habla en la gramática actual proporcionando sucesivamente mensajes más informativos. Las interfaces que parecen estar intentando comprender fomentan un alto grado de satisfacción y tolerancia del usuario.

Los errores de sustitución, donde el motor de voz reconoce la entrada, pero coincide con el comando incorrecto, son más difíciles de resolver porque el motor de voz detecta una expresión coincidente. También se puede producir una discrepancia cuando el motor de voz interpreta los sonidos extraños como entrada válida (también conocido como error de inserción). En estas situaciones, la ayuda del usuario es necesaria para identificar la condición de error. Para ello, puede repetir lo que devolvió el motor de voz y pedir al usuario que lo confirme antes de continuar:

Usuario: Me gustaría una pizza de estilo Chicago.

Personaje: ¿Dijiste que te gustaría una "pizza de estilo Chicago"?

Usuario: Sí.

Carácter: ¿Qué ingredientes adicionales le gustaría?

Usuario: Anchovies.

Personaje: ¿Dijiste "anchoas"?

Usuario: Sí.

Sin embargo, el uso de esta técnica para cada expresión se vuelve ineficaz y tesomero. Para controlar esto, restrinja la confirmación a situaciones que tienen consecuencias negativas significativas o aumentan la complejidad de la tarea inmediata. Si es fácil que el usuario realice o revierta los cambios, puede evitar solicitar la confirmación de sus opciones. De forma similar, si toma decisiones visibles, es posible que no tenga que proporcionar una corrección explícita. Por ejemplo, elegir un elemento de una lista puede no requerir la comprobación porque el usuario puede ver los resultados y cambiarlos fácilmente. También puede usar la confianza y las puntuaciones alternativas para proporcionar un umbral para la confirmación. Puede ajustar el umbral manteniendo un historial de las acciones del usuario en una situación determinada y eliminando la comprobación en función de la confirmación del usuario coherente. Por último, considere la naturaleza multi modal de la interfaz. La confirmación del mouse o del teclado también puede ser adecuada.

Elija cuidadosamente la redacción de las confirmaciones. Por ejemplo, "¿Dijiste...?" o "Creo que dijiste..." son mejores que "¿Realmente quieres...?" porque las frases anteriores implican que se está consultando la precisión de la escucha del personaje (reconocimiento), no que el usuario pueda haber mal hecho.

Considere también la gramática de una respuesta. Por ejemplo, es probable que una respuesta negativa genere un error de rechazo, lo que requiere un aviso adicional, como se muestra en el ejemplo siguiente:

Usuario: Me gustaría un pepperoni.

Personaje: ¿Dijiste "no jamón"?

Usuario: No, dije pepperoni.

Personaje: ¿Eh?

Usuario: Pepperoni.

La modificación de la gramática para incluir prefijos para controlar las variaciones de respuesta natural aumenta la eficacia del proceso de recuperación, especialmente cuando el usuario no confirma la solicitud de comprobación. En este ejemplo, la confirmación podría haberse controlado en un solo paso modificando la gramática del "pepperoni" incluyendo también "no dije pepperoni", "dije pepperoni" y "no pepperoni".

También puede controlar los errores de sustitución mediante las coincidencias alternativas devueltas por el motor de voz como confirmación correctiva:

Usuario: Me gustaría un pepperoni.

Personaje: (Oye "sin jamón" como mejor coincidencia, "pepperoni" como primera alternativa) ¿Dijiste "no jamón"?

Usuario: No, pepperoni.

Carácter: (Todavía escucha "sin jamón" como mejor coincidencia, pero ahora ofrece la primera alternativa) "Pepperoni"?

Del mismo modo, puede mantener un historial de errores comunes de sustitución y, si un error determinado es frecuente, ofrezca la alternativa la primera vez.

En cualquier situación de error de reconocimiento, evite culpar al usuario. Si el carácter sugiere o incluso implica que el usuario es culpable, o el carácter parece indiferente al error, el usuario puede resultar ofendido. Aquí también, elegir cuidadosamente el texto que acepta explícitamente la responsabilidad, es adecuado para la situación y usa la variedad para crear una respuesta más natural. Al expresar una topología, evite palabras ambiguas como "oops" o "uh-oh" que podrían interpretarse como culpas al usuario. En su lugar, use frases como "Lo siento" o "Mi error". Los errores repetidos o más graves pueden usar una topología más elaborada, como "Realmente lo siento por eso". Tenga en cuenta también la personalidad del carácter al determinar el tipo de respuesta. Otra opción es culpar a una situación externa. Comentarios como "Boy, it's ruidosa out there", quita la culpa del usuario y del personaje. Recordar al usuario la naturaleza cooperativa de la interacción también puede ser útil: considere frases como" "Veamos lo que podemos hacer para hacer este trabajo".

Microsoft Agent también admite algunos comentarios automáticos para el reconocimiento. Cuando se detecta una expresión, la sugerencia de escucha muestra el texto de voz de la mejor coincidencia escuchada. Puede establecer su propio texto para que se muestre en función de la configuración de confianza de un comando que defina.

Debido al potencial de error, siempre se requiere confirmación para las opciones que tienen consecuencias negativas graves y son irreversibles. Naturalmente, querrá requerir confirmación cuando los resultados de una acción podrían ser destructivos. Sin embargo, considere también la posibilidad de requerir confirmación para situaciones que anulan cualquier proceso o operación largos.

Compartir a través de

Ofrecimiento de una buena recuperación de errores

Comentarios

Recursos adicionales