Informazioni sui contenuti delle soluzioni audio (anteprima)
Importante
- Azure AI Content Understanding è disponibile in anteprima. Le versioni di anteprima pubblica consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare o avere funzionalità vincolate, prima della disponibilità generale.
- Per altre informazioni, vedere Condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure.
Content Understanding audio analyzers abilita la trascrizione e la diarizzazione dell'audio conversazionale, l'estrazione di campi strutturati, ad esempio riepiloghi, sentimenti e argomenti chiave. Personalizzare un modello di analizzatore audio in base alle esigenze aziendali usando Azure AI Foundry per iniziare a generare risultati.
Ecco alcuni scenari comuni per l'uso di Content Understanding con dati audio conversazionali:
- Ottenere informazioni dettagliate sui clienti tramite il riepilogo e l'analisi del sentiment.
- Valutare e verificare la qualità e la conformità delle chiamate nei call center.
- Creare riepiloghi e metadati automatizzati per la pubblicazione di podcast.
Funzionalità dell'analizzatore audio
Content Understanding funge da elemento fondamentale per le soluzioni di Gestione asset multimediali, consentendo le funzionalità seguenti per i file audio:
Estrazione contenuto
Trascrizione. Converte l'audio di conversazione in trascrizioni basate su testo ricercabili e analizzabili in formato WebVTT. I campi personalizzabili possono essere generati dai dati di trascrizione. I timestamp a livello di frase e a livello di parola sono disponibili su richiesta.
Diarization
. Distingue tra i parlanti in una conversazione, assegnando parti della trascrizione a altoparlanti specifici.Rilevamento del ruolo voce. Identifica i ruoli dell'agente e del cliente all'interno dei dati delle chiamate del contact center.
Rilevamento della lingua. Rileva automaticamente la lingua nell'audio o usa hint di lingua/impostazioni locali specificati.
Estrazione di campi
L'estrazione dei campi consente di estrarre dati strutturati da file audio, ad esempio riepiloghi, sentimenti ed entità menzionate dai log delle chiamate. Per iniziare, è possibile personalizzare un modello di analizzatore suggerito o crearne uno da zero.
Vantaggi principali
Content Understanding offre funzionalità audio avanzate, tra cui:
Estrazione dei dati personalizzabile. Adattare l'output in base alle esigenze specifiche modificando lo schema del campo, consentendo una generazione e un'estrazione dei dati precise.
Modelli generativi. Usare i modelli di intelligenza artificiale generativi per specificare nel linguaggio naturale il contenuto che si vuole estrarre e il servizio genera l'output desiderato.
Pre-elaborazione integrata. Trarre vantaggio dai passaggi di pre-elaborazione predefiniti, ad esempio la trascrizione, la diarizzazione e il rilevamento dei ruoli, fornendo un contesto avanzato per i modelli generativi.
Adattabilità dello scenario. Adattare il servizio ai requisiti generando campi personalizzati ed estrarre i dati pertinenti.
Content Understanding audio analyzer templates (Informazioni sui contenuti)
Content Understanding offre modelli di analizzatore audio personalizzabili:
Analisi post-chiamata. Analizzare le registrazioni delle chiamate per generare trascrizioni di conversazione, riepiloghi delle chiamate, valutazioni del sentiment e altro ancora.
Analisi della conversazione. Generare trascrizioni, riepiloghi e valutazioni del sentiment dalle registrazioni audio della conversazione.
Iniziare con un modello o creare un analizzatore personalizzato per soddisfare esigenze aziendali specifiche.
Requisiti di input
Per un elenco dettagliato dei formati audio supportati, vedere la pagina Limiti e codec del servizio.
Lingue e aree supportate
Per un elenco completo delle aree, delle lingue e delle impostazioni locali supportate, vedere la pagina Relativa al supporto di lingue e aree geografiche.
Privacy e sicurezza dei dati
Gli sviluppatori che usano Content Understanding devono esaminare i criteri di Microsoft sui dati dei clienti. Per altre informazioni, visitare la pagina Dati, protezione e privacy .
Passaggi successivi
- Provare a elaborare il contenuto audio usando Content Understanding in Azure AI Foundry.
- Altre informazioni sui modelli di analizzatore audio.