Documentación de la conversión de voz en texto
La característica de conversión de voz en texto del servicio de voz, también conocida como reconocimiento de voz, permite la transcripción en tiempo real y por lotes de secuencias de audio en texto. Con la entrada de texto de referencia adicional, también se habilita la valoración de pronunciación en tiempo real y se proporciona a los oradores comentarios sobre la precisión y fluidez del audio hablado.
Acerca de la conversión de voz en texto
Información general
- ¿Qué la conversión de voz en texto en tiempo real?
- ¿Qué la conversión de voz en texto por lotes?
- ¿Qué es el habla personalizada?
- Uso de la CLI de Voz para conversión de voz en texto sin código
Inicio rápido
Desarrollo con la conversión de voz a texto
Guía paso a paso
- Usar la API de transcripción rápida
- Creación de un proyecto de voz personalizada
- Entrenamiento de un modelo de habla personalizada
- Uso de formatos de entrada de audio comprimidos