¿Cómo definir los umbrales para los errores de pausa en el SDK Speech to Text?

Natalia Díaz Castro 0 Puntos de reputación
2024-01-26T21:54:41.1033333+00:00

Estoy haciendo uso del SDK del Speech de Azure, tomando como código, el que se encuentra como código muestra en Speech Studio > Evaluación de la pronunciación > Lenguaje JavaScript. Comparando los JSON de respuesta que se obtiene en el Speech Studio y las que obtengo desde el SDK, en el Speech Studio obtengo los ErrorTypes de "UnexpectedBreak" y "MissingBreak", mientras que con el SDK no los obtengo.

En la documentacion dice: "Tipos de error relacionados con las pausas, incluidos UnexpectedBreak y MissingBreak. En la versión actual, no se proporciona el tipo de error de pausa. Debe establecer umbrales en los campos siguientes "UnexpectedBreak – Confidence" y "MissingBreak – Confidence", respectivamente para decidir si hay una pausa inesperada o falta una pausa antes de la palabra."

Pero hasta el momento no he encontrado por donde se definen estos umbrales, para obtener estos errores, y porque si estoy usando el mismo código de muestra no obtengo los mismos resultados, ya que también varían el puntaje de Pronunciación y el de Integridad.

Sin supervisión
Sin supervisión
Etiqueta no supervisada por Microsoft.
216 preguntas
0 comentarios No hay comentarios
{count} votos

1 respuesta

Ordenar por: Muy útil
  1. Jonathan Pereira Castillo 12,095 Puntos de reputación Proveedor de Microsoft
    2025-01-23T15:56:05.56+00:00

    ¡Hola Natalia Díaz Castro!

    Esperamos que este mensaje te encuentre bien.

    Lamentamos sinceramente la demora en abordar tu tema en este foro.

    Para definir los umbrales de "UnexpectedBreak – Confidence" y "MissingBreak – Confidence" en el SDK de Speech de Azure, sigue estos pasos:

    Configura los umbrales en tu código:

    const pronunciationAssessmentConfig = new sdk.PronunciationAssessmentConfig(
        referenceText,
        sdk.PronunciationAssessmentGradingSystem.HundredMark,
        sdk.PronunciationAssessmentGranularity.Phoneme,
        true
    );
    
    pronunciationAssessmentConfig.setProperty(
        sdk.PropertyId.PronunciationAssessment_UnexpectedBreak_ConfidenceThreshold,
        "0.5"
    );
    
    pronunciationAssessmentConfig.setProperty(
        sdk.PropertyId.PronunciationAssessment_MissingBreak_ConfidenceThreshold,
        "0.5"
    );
    

    Asegúrate de usar la misma configuración en Speech Studio y en tu código SDK para obtener resultados consistentes.

    Verifica la versión del SDK que estás utilizando, ya que las funcionalidades pueden variar entre versiones.

    Espero que esto te ayude a obtener los resultados esperados. ¡Buena suerte!

    Si no recibimos una respuesta tuya en los próximos días, procederemos a cerrar el tema. Sin embargo, queremos asegurarte que siempre estamos disponibles para cualquier asistencia que puedas necesitar.

    Agradecemos tu comprensión y estamos aquí para ayudar en lo que sea necesario.

    Estaré atento a tu respuesta.,

     Jonathan

    ----------*

    Tu opinión es muy importante para nosotros! Si esta respuesta resolvió tu consulta, por favor haz clic en ''. Esto nos ayuda a mejorar continuamente la calidad y relevancia de nuestras soluciones.

    0 comentarios No hay comentarios

Su respuesta

Las respuestas se pueden marcar como respuestas aceptadas por el autor de la pregunta, lo que ayuda a los usuarios a conocer la respuesta que resolvió el problema del autor.