Introducción
Las funcionalidades de voz de IA nos permiten administrar sistemas domésticos y automáticos con instrucciones de voz, obtener respuestas de ordenadores para preguntas orales, generar subtítulos a partir de audio y mucho más.
Para habilitar este tipo de interacción, el sistema de IA debe admitir al menos dos funciones:
- Reconocimiento de voz: capacidad de detectar e interpretar la entrada hablada
- Síntesis de voz: capacidad de generar salidas verbales
Voz de Azure AI proporciona funcionalidades de conversión de voz en texto, texto a voz y traducción de voz a través del reconocimiento de voz y la síntesis. Puede usar modelos de servicio de voz precompilados y personalizados para una variedad de tareas, como transcribir audio a texto con alta precisión, identificar hablantes en conversaciones, crear voces personalizadas, etc. A continuación, aprenderá cómo operan las funcionalidades de voz de IA.