Compartir a través de


Soluciones de audio de Comprensión de contenidos (versión preliminar)

Importante

  • La comprensión del contenido de Azure AI está disponible en versión preliminar. Las versiones preliminares públicas proporcionan acceso anticipado a las características que están en desarrollo activo.
  • Las características, los enfoques y los procesos pueden cambiar o tener funcionalidades restringidas, antes de la disponibilidad general (GA).
  • Para obtener más información, consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure.

Los analizadores de audio de comprensión de contenidos permiten la transcripción y la diarización del audio conversacional, extrayendo campos estructurados como resúmenes, opiniones y temas clave. Personalice una plantilla de analizador de audio para sus necesidades empresariales mediante Azure AI Foundry para empezar a generar resultados.

Estos son escenarios comunes para usar comprensión de contenidos con datos de audio conversacionales:

  • Obtenga información de los clientes a través del resumen y el análisis de sentimiento.
  • Evalúe y compruebe la calidad y el cumplimiento de las llamadas en los centros de llamadas.
  • Cree resúmenes y metadatos automatizados para la publicación de podcasts.

Funcionalidades del analizador de audio

Ilustración del flujo de trabajo de audio de comprensión de contenidos.

La comprensión de contenidos actúa como piedra angular para las soluciones de administración de recursos, lo que permite las siguientes funcionalidades para los archivos de audio:

Extracción de contenido

  • Transcripción. Convierte el audio conversacional en transcripciones basadas en texto que se pueden buscar y analizar en formato WebVTT. Los campos personalizables se pueden generar a partir de datos de transcripción. Las marcas de tiempo de nivel de oración y de nivel de palabra están disponibles bajo petición.

  • Diarization. Distingue entre los hablantes de una conversación, atribuyendo partes de la transcripción a hablantes específicos.

  • Detección de roles de Speaker. Identifica los roles de agente y cliente dentro de los datos de llamadas del centro de contactos.

  • Detección de idioma. Detecta automáticamente el idioma en el audio o usa sugerencias de idioma o configuración regional especificadas.

Extracción de campos

La extracción de campos permite extraer datos estructurados de archivos de audio, como resúmenes, opiniones y entidades mencionadas de registros de llamadas. Puede empezar personalizando una plantilla de analizador sugerida o creando una desde cero.

Ventajas principales

La comprensión de contenidos ofrece funcionalidades avanzadas de audio, entre las que se incluyen:

  • Extracción de datos personalizable. Adapte la salida a sus necesidades específicas modificando el esquema de campo, lo que permite generar y extraer datos precisos.

  • Modelos generativos. Use modelos de IA generativos para especificar en lenguaje natural el contenido que desea extraer y el servicio genera la salida deseada.

  • Procesamiento previo integrado. Benefíciese de los pasos de preprocesamiento integrados, como la transcripción, la diarización y la detección de roles, lo que proporciona un contexto enriquecido para los modelos generativos.

  • Capacidad de adaptación del escenario. Adapte el servicio a sus requisitos mediante la generación de campos personalizados y extraiga los datos pertinentes.

Plantillas de analizador de audio de comprensión de contenidos

La comprensión de contenidos ofrece plantillas personalizables del analizador de audio:

  • Análisis posterior a la llamada. Analice las grabaciones de llamadas para generar transcripciones de conversación, resúmenes de llamadas, evaluaciones de sentimiento y mucho más.

  • Análisis de conversación. Genere transcripciones, resúmenes y evaluaciones de opiniones a partir de grabaciones de audio de conversación.

Comience con una plantilla o cree un analizador personalizado para satisfacer sus necesidades empresariales específicas.

Requisitos de entrada

Para obtener una lista detallada de los formatos de audio admitidos, consulte nuestra página Límites y códecs del servicio.

Idiomas y regiones admitidos

Para obtener una lista completa de las regiones, idiomas y configuraciones regionales admitidos, consulte nuestra página Idioma y región compatible con).

Seguridad y privacidad de datos

Los desarrolladores que usan la comprensión de contenidos deben revisar las directivas de Microsoft en los datos de los clientes. Para obtener más información, visite nuestra página Datos, protección y privacidad.

Pasos siguientes