Condividi tramite


Panoramica del Call Center

Lingua di Azure AI e Voce di Azure AI consentono di realizzare un'automazione parziale o completa delle interazioni di clienti basate su telefonia e di offrire l'accessibilità tra più canali. Con i servizi Lingua e Voce è possibile analizzare ulteriormente le trascrizioni del call center, estrarre e offuscare conversazioni con informazioni personali (PII), riepilogare la trascrizione e rilevare la valutazione.

Alcuni scenari di esempio per l'implementazione dei Servizi di Azure AI nei call center e nei contact center sono:

  • Agenti virtuali: voicebot basati su intelligenza artificiale conversazionale e con telefonia integrata e chatbot abilitati per la voce
  • Agent-assist: trascrizione in tempo reale e analisi di una chiamata per migliorare l'esperienza del cliente fornendo informazioni dettagliate e suggerire azioni agli agenti
  • Analisi post-chiamata: l’analisi post-chiamata crea informazioni dettagliate nelle conversazioni dei clienti per migliorare la comprensione e supportare il miglioramento continuo della gestione delle chiamate, l'ottimizzazione del controllo della qualità e della conformità, nonché altre ottimizzazioni ispirate alle informazioni dettagliate.

Suggerimento

Provare Language Studio o Speech Studio per una dimostrazione su come usare i servizi Lingua e Voce per analizzare le conversazioni del call center.

Per distribuire una soluzione di trascrizione del call center in Azure con un approccio senza codice provare il client di inserimento.

Funzionalità dei Servizi di Azure AI per call center

Un'implementazione olistica del call center in genere incorpora tecnologie dei servizi Lingua e Voce.

In genere i dati audio usati nei call center generati tramite telefoni fissi, telefoni cellulari e radio sono spesso a banda stretta, compresa nell'intervallo di 8 KHz; ciò può creare problemi durante la conversione della voce in testo scritto. I modelli di riconoscimento del servizio Voce vengono sottoposti a training per garantire di ottenere trascrizioni di alta qualità, anche se si sceglie di acquisire l'audio.

Dopo aver trascritto l'audio con il servizio Voce, è possibile usare il servizio Lingua per eseguire analisi sui dati del call center, ad esempio: analisi valutazione, riepilogo del motivo delle chiamate dei clienti, come sono stati risolte, estrazione e offuscamento delle informazioni personali della conversazione e altro ancora.

Servizio Voce

Il servizio Voce offre le funzionalità seguenti che possono essere usate per i casi d'uso del call center:

  • Riconoscimento vocale in tempo reale: riconosce e trascrive audio in tempo reale da più input. Ad esempio, con agenti virtuali o agent-assist, è possibile riconoscere continuamente l'input audio e controllare come elaborare i risultati in base a più eventi.
  • Conversione della voce in testo scritto in batch: trascrive grandi quantità di file audio in modo asincrono, inclusa la diarizzazione dell'altoparlante, e in genere si usa in scenari di analisi post-chiamata. La diarizzazione è il processo di riconoscimento e separazione degli altoparlanti in dati audio mono canale.
  • Sintesi vocale: la sintesi vocale consente alle applicazioni, agli strumenti o ai dispositivi di convertire il testo in un parlato sintetizzato simile a quello umano.
  • Identificazione voce: consente di determinare l'identità di un altoparlante sconosciuto all'interno di un gruppo di altoparlanti registrati e in genere si usa negli scenari di verifica dei clienti del call center o per il rilevamento delle frodi.
  • Identificazione della lingua: identifica le lingue parlate nell'audio e può essere usata in tempo reale e nell’analisi post-chiamata per informazioni dettagliate o per controllare l'ambiente (ad esempio, la lingua di output di un agente virtuale).

Il servizio Voce funziona bene con i modelli predefiniti. Tuttavia, è possibile personalizzare e ottimizzare ulteriormente l'esperienza in base al prodotto o all'ambiente. Esempi tipici per la personalizzazione della voce:

Personalizzazione del servizio Voce Descrizione
Riconoscimento vocale personalizzato Una funzionalità di conversione della voce in testo scritto usata per valutare e migliorare l'accuratezza del riconoscimento vocale di entità specifiche del caso d'uso (ad esempio, clienti alfanumerici, ID caso e ID contratto, targhe e nomi). È anche possibile eseguire il training di un modello personalizzato con nomi di prodotti personalizzati e la terminologia del settore.
Sintesi vocale neurale Funzionalità di sintesi vocale che consente di creare una voce sintetica personalizzata unica per le applicazioni.

Servizio Lingua

Il servizio di linguaggio offre le funzionalità seguenti che possono essere usate per i casi d'uso del call center:

Anche se il servizio di linguaggio funziona bene con i modelli predefiniti, è possibile personalizzare e ottimizzare ulteriormente i modelli per estrarre altre informazioni dai dati. Esempi tipici per la personalizzazione del linguaggio:

Personalizzazione della lingua Descrizione
Riconoscimento entità denominata (NER) personalizzato Migliorare il rilevamento e l'estrazione delle entità nelle trascrizioni.
Classificazione personalizzata del testo Classificare ed etichettare espressioni trascritte con classificazioni singole o multiple.

È possibile trovare una panoramica di tutte le funzionalità del servizio di linguaggio e le opzioni di personalizzazione qui.

Passaggi successivi