Informazioni sui contenuti delle soluzioni audio (anteprima)

Articolo
01/16/2025

Importante

Azure AI Content Understanding è disponibile in anteprima. Le versioni di anteprima pubblica consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
Funzionalità, approcci e processi possono modificare o avere funzionalità limitate, prima della disponibilità generale.
Per altre informazioni, vedereCondizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure.

Content Understanding audio analyzers abilita la trascrizione e la diarizzazione dell'audio conversazionale, l'estrazione di campi strutturati, ad esempio riepiloghi, sentimenti e argomenti chiave. Personalizzare un modello di analizzatore audio in base alle esigenze aziendali usando il portale di Azure AI Foundry per iniziare a generare risultati.

Ecco alcuni scenari comuni per l'uso di Content Understanding con dati audio conversazionali:

Ottenere informazioni dettagliate sui clienti tramite il riepilogo e l'analisi del sentiment.
Valutare e verificare la qualità e la conformità delle chiamate nei call center.
Creare riepiloghi e metadati automatizzati per la pubblicazione di podcast.

Funzionalità dell'analizzatore audio

Content Understanding funge da elemento fondamentale per le soluzioni di Gestione asset multimediali, consentendo le funzionalità seguenti per i file audio:

Estrazione contenuto

Trascrizione. Converte l'audio di conversazione in trascrizioni basate su testo ricercabili e analizzabili in formato WebVTT. I campi personalizzabili possono essere generati dai dati di trascrizione. I timestamp a livello di frase e a livello di parola sono disponibili su richiesta.
Diarization. Distingue tra i parlanti in una conversazione, assegnando parti della trascrizione a altoparlanti specifici.
Rilevamento del ruolo voce. Identifica i ruoli dell'agente e del cliente all'interno dei dati delle chiamate del contact center.
Rilevamento della lingua. Rileva automaticamente la lingua nell'audio o usa hint di lingua/impostazioni locali specificati.

Estrazione di campi

L'estrazione dei campi consente di estrarre dati strutturati da file audio, ad esempio riepiloghi, sentimenti ed entità menzionate dai log delle chiamate. Per iniziare, è possibile personalizzare un modello di analizzatore suggerito o crearne uno da zero.

Vantaggi principali

Content Understanding offre funzionalità audio avanzate, tra cui:

Estrazione dei dati personalizzabile. Adattare l'output in base alle esigenze specifiche modificando lo schema del campo, consentendo una generazione e un'estrazione dei dati precise.
Modelli generativi. Usare i modelli di intelligenza artificiale generativi per specificare nel linguaggio naturale il contenuto che si vuole estrarre e il servizio genera l'output desiderato.
Pre-elaborazione integrata. Trarre vantaggio dai passaggi di pre-elaborazione predefiniti, ad esempio la trascrizione, la diarizzazione e il rilevamento dei ruoli, fornendo un contesto avanzato per i modelli generativi.
Adattabilità dello scenario. Adattare il servizio ai requisiti generando campi personalizzati ed estrarre i dati pertinenti.

Content Understanding audio analyzer templates (Informazioni sui contenuti)

Content Understanding offre modelli di analizzatore audio personalizzabili:

Analisi post-chiamata. Analizzare le registrazioni delle chiamate per generare trascrizioni di conversazione, riepiloghi delle chiamate, valutazioni del sentiment e altro ancora.
Analisi della conversazione. Generare trascrizioni, riepiloghi e valutazioni del sentiment dalle registrazioni audio della conversazione.

Iniziare con un modello o creare un analizzatore personalizzato per soddisfare esigenze aziendali specifiche.

Requisiti di input

Per un elenco dettagliato dei formati audio supportati, vedere la pagina Limiti e codec del servizio.

Lingue e aree supportate

Per un elenco completo delle aree, delle lingue e delle impostazioni locali supportate, vedere la pagina Relativa al supporto di lingue e aree geografiche.

Privacy e sicurezza dei dati

Gli sviluppatori che usano Content Understanding devono esaminare i criteri di Microsoft sui dati dei clienti. Per altre informazioni, visitare la pagina Dati, protezione e privacy .

Passaggi successivi

Provare a elaborare il contenuto audio usando Content Understanding nel portale di Azure AI Foundry.
Informazioni su come analizzare i modelli di analizzatore del contenuto audio.
Esaminare l'esempio di codice: estrazione di contenuti audio.
Esaminare l'esempio di codice: modelli di analizzatore.

Condividi tramite