Compartir a través de


Introducción al centro de llamadas

Azure AI para lenguaje y Azure AI para voz pueden ayudarle a realizar una automatización parcial o completa de las interacciones de los clientes basadas en telefonía y proporcionar accesibilidad entre varios canales. Con los servicios de lenguaje y voz, puede analizar aún más las transcripciones del centro de llamadas, extraer y censurar la conversación, resumir la transcripción y detectar el sentimiento.

Algunos escenarios de ejemplo para la implementación de los servicios de Azure AI en los centros de llamadas y contacto son:

  • Agentes virtuales: bots de voz integrados en la telefonía basados en inteligencia artificial conversacional y bots de chat habilitados para voz
  • Asistentes de los agentes: transcripción y análisis en tiempo real de una llamada para mejorar la experiencia del cliente al proporcionar información y sugerir acciones a los agentes
  • Análisis posteriores a la llamada: análisis posterior a la llamada para crear información sobre las conversaciones con los clientes con el fin de aumentar la comprensión y admitir la mejora continua del control de las llamadas, la optimización del control de calidad y el control de cumplimiento, y otras optimizaciones controladas por la información.

Sugerencia

Pruebe Language Studio o Speech Studio para ver una demostración de cómo usar los servicios Lenguaje y Voz para analizar las conversaciones del centro de llamadas.

Para implementar una solución de transcripción del centro de llamadas en Azure con un enfoque sin código, pruebe el cliente de ingesta.

Características de los servicios de Azure AI para los centros de llamadas

Una implementación holística del centro de llamadas normalmente incorpora tecnologías de los servicios de lenguaje y voz.

Los datos de audio que se usan normalmente en los centros de llamadas procedentes de líneas fijas, teléfonos móviles y radios suelen ser de banda estrecha, del intervalo de los 8 KHz, lo que supone un reto al convertir la voz en texto. Los modelos de reconocimiento del servicio voz están entrenados para garantizar transcripciones de alta calidad, aunque decida capturar el audio.

Una vez que transcriba el audio con el servicio de voz, puede usar el servicio de lenguaje para realizar un análisis de los datos del centro de llamadas, por ejemplo, el análisis de sentimiento, el resumen del motivo de las llamadas de los clientes, cómo se resolvieron, la extracción y censura de la PII de la conversación, etc.

Servicio de voz

El servicio de voz ofrece las siguientes características para los casos de uso del centro de llamadas:

  • Conversión de voz en texto en tiempo real: sirve para reconocer y transcribir audio en tiempo real desde varias entradas. Por ejemplo, con agentes virtuales o asistentes de los agentes, puede reconocer continuamente la entrada de audio y controlar cómo procesar los resultados en función de varios eventos.
  • Conversión de voz en texto en lote: para transcribir grandes cantidades de archivos de audio de forma asincrónica, incluida la diarización del hablante; se suele usar en escenarios de análisis posteriores a llamadas. La diarización es el proceso de reconocer y separar los hablantes en datos de audio monocanal.
  • Conversión de texto a voz: permite que sus aplicaciones, herramientas o dispositivos conviertan el texto en una voz sintetizada similar a la humana.
  • Identificación del hablante: ayuda a determinar la identidad de un hablante desconocido dentro de un grupo de hablantes inscritos y se usa normalmente para escenarios de verificación del cliente del centro de llamadas o de detección de fraudes.
  • Identificación del idioma: ayuda a identificar los idiomas hablados en audio y se puede usar en análisis en tiempo real y posterior a la llamada para obtener información o para controlar el entorno (como el idioma de salida de un agente virtual).

El servicio de voz funciona bien con los modelos integrados. Sin embargo, es posible que desee personalizar y optimizar más la experiencia para su producto o entorno. Entre los ejemplos típicos de personalización de voz se incluyen los siguientes:

Personalización de la voz Descripción
Habla personalizada Característica de conversión de voz en texto para evaluar y mejorar la precisión del reconocimiento de voz de las entidades específicas de los ca sos de uso (como clientes alfanuméricos, mayúsculas y minúsculas, identificadores de contrato, placas de matrícula y nombres). También puede entrenar un modelo personalizado con sus propios nombres de producto y terminología del sector.
Voz neuronal personalizada Característica de conversión de texto a voz que permite crear una voz sintética personalizada única para las aplicaciones.

Servicio de lenguaje

El servicio de lenguaje ofrece las siguientes características, que se pueden usar para los casos de uso del centro de llamadas:

Aunque el servicio de lenguaje funciona bien con los modelos precompilados, quizá desee personalizar y ajustar modelos para extraer más información de los datos. Entre los ejemplos típicos de personalización de lenguaje se incluyen:

Personalización de lenguaje Descripción
Reconocimiento de entidades con nombre personalizadas Mejora la detección y la extracción de entidades en las transcripciones.
Clasificación de texto personalizada Clasifica y etiqueta las expresiones transcritas con una o varias clasificaciones.

Aquí encontrará información general sobre todas las características del servicio de lenguaje y las opciones de personalización.

Pasos siguientes