Qué es la traducción de vídeo (versión preliminar)

Artículo
09/24/2024

Nota:

Esta característica actualmente está en su versión preliminar pública. Esta versión preliminar se ofrece sin acuerdo de nivel de servicio y no se recomienda para las cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

La traducción de vídeo es una característica de Voz de Azure AI que le permite traducir y generar automáticamente vídeos en varios idiomas sin problemas. Esta característica está diseñada para ayudarle a localizar el contenido de vídeo para atender a diversos públicos de todo el mundo. Puede crear de forma eficaz vídeos envolventes y localizados en varios casos de uso, como videoblogs, educación, noticias, formación empresarial, publicidad, cine, programas de televisión, etc.

El proceso de reemplazar el idioma original de un vídeo con audio grabado en un idioma diferente suele utilizarse para atender a diversas audiencias. Tradicionalmente lograda mediante grabaciones humanas y postproducción manual, la traducción es esencial para garantizar que los espectadores puedan disfrutar del contenido de vídeo en su idioma nativo. Sin embargo, este proceso viene con puntos débiles clave, incluido su alto costo, larga duración e incapacidad de replicar la voz del hablante original con precisión. La traducción de vídeos en Voz de Azure AI aborda estos desafíos al proporcionar una solución automatizada, eficaz y rentable para crear vídeos localizados.

Caso de uso

La traducción de vídeo proporcionada por Voz de Azure AI tiene una amplia gama de casos de uso en varios sectores y tipos de contenido. Estas son algunas aplicaciones clave:

Noticias y entrevistas: las organizaciones de noticias pueden traducir y doblar segmentos de noticias y entrevistas para proporcionar información precisa y oportuna a las audiencias en todo el mundo.
Publicidad y marketing: las empresas pueden localizar sus vídeos publicitarios y de marketing para que lleguen al público objetivo en diferentes mercados, mejorando el reconocimiento de la marca y la participación de los clientes.
Educación y aprendizaje: las instituciones educativas y las plataformas de aprendizaje electrónico pueden doblar sus vídeos y conferencias informativas en diferentes idiomas, lo que hace que el aprendizaje sea más accesible e inclusivo.
Cine y TV: los estudios de cine y las empresas de producción pueden doblar sus películas y programas de televisión para la distribución internacional, llegar a un público más amplio y maximizar el potencial de ingresos.
Videoblog + vídeo corto: los propietarios de contenido pueden traducir y doblar fácilmente sus videoblogs y vídeos cortos para llegar a audiencias internacionales, ampliando su audiencia y participación.
Formación empresarial: las corporaciones pueden localizar sus vídeos de formación para empleados de diferentes regiones, lo que garantiza una comunicación coherente y eficaz entre todos sus empleados.

Regiones e idiomas admitidos

Actualmente, el doblaje de vídeo en Voz de Azure AI solo se admite en la región este de EE. UU.

Se admite la traducción de vídeo entre varios idiomas, lo que le permite adaptar su contenido a preferencias lingüísticas específicas. Para conocer los idiomas admitidos para la traducción de vídeo, consulte idiomas de origen y destino admitidos.

Características principales

Extracción de audio de diálogo y transcripción de contenido hablado.

Extrae automáticamente el audio de diálogo del vídeo de origen y transcribe el contenido hablado.
Traducción de la lengua A a la lengua B y reformulación mediante un modelo de lenguaje grande (LLM).

Traduce el contenido transcrito del idioma original (idioma A) al idioma de destino (idioma B) mediante técnicas avanzadas de procesamiento de lenguaje. Mejora la calidad de la traducción y refina el texto traducido con reconocimiento de género a través de la reformulación mediante LLM.
Traducción automática: generación de voz en otro idioma.

Utiliza la tecnología de texto a voz con tecnología de inteligencia artificial para generar automáticamente voces similares a las humanas en el idioma de destino. Estas voces se sincronizan exactamente con el vídeo, lo que garantiza una experiencia de traducción impecable. Esto incluye el uso de voces neuronales precompiladas para la salida de alta calidad y las opciones de oferta para la Voz personal.
Humanos en el bucle de edición de contenidos.

Permite la intervención humana para revisar y editar el contenido traducido, garantizando la precisión y la idoneidad cultural antes de finalizar el vídeo doblado.
Generación de subtítulos.

Entrega el vídeo totalmente doblado con diálogo traducido, subtítulos sincronizados y voces generadas, listas para descarga y distribución en varias plataformas. También puede establecer la longitud del subtítulo en cada pantalla para una visualización óptima.

Introducción

Para empezar a trabajar con la traducción de vídeo, consulte traducción de vídeo en el estudio. La API de traducción de vídeo pronto estará disponible.

Precio

Para obtener los detalles de precios de la traducción de vídeo, vea Precios del servicio Voz. Tenga en cuenta que los precios de la traducción de vídeo solo son visibles para las regiones de servicio donde la característica esté disponible.

Pruebe la traducción de vídeo en el estudio

Compartir vía

Qué es la traducción de vídeo (versión preliminar)

Caso de uso

Regiones e idiomas admitidos

Características principales

Introducción

Precio

Comentarios

Recursos adicionales

Compartir vía

Qué es la traducción de vídeo (versión preliminar)

Caso de uso

Regiones e idiomas admitidos

Características principales

Introducción

Precio

Contenido relacionado

Comentarios

Recursos adicionales