Condividi tramite


Informazioni sui contenuti delle soluzioni audio (anteprima)

Importante

  • Azure AI Content Understanding è disponibile in anteprima. Le versioni di anteprima pubblica consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare o avere funzionalità vincolate, prima della disponibilità generale.
  • Per altre informazioni, vedere Condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure.

Content Understanding audio analyzers abilita la trascrizione e la diarizzazione dell'audio conversazionale, l'estrazione di campi strutturati, ad esempio riepiloghi, sentimenti e argomenti chiave. Personalizzare un modello di analizzatore audio in base alle esigenze aziendali usando Azure AI Foundry per iniziare a generare risultati.

Ecco alcuni scenari comuni per l'uso di Content Understanding con dati audio conversazionali:

  • Ottenere informazioni dettagliate sui clienti tramite il riepilogo e l'analisi del sentiment.
  • Valutare e verificare la qualità e la conformità delle chiamate nei call center.
  • Creare riepiloghi e metadati automatizzati per la pubblicazione di podcast.

Funzionalità dell'analizzatore audio

Illustrazione del flusso di lavoro audio Di comprensione del contenuto.

Content Understanding funge da elemento fondamentale per le soluzioni di Gestione asset multimediali, consentendo le funzionalità seguenti per i file audio:

Estrazione contenuto

  • Trascrizione. Converte l'audio di conversazione in trascrizioni basate su testo ricercabili e analizzabili in formato WebVTT. I campi personalizzabili possono essere generati dai dati di trascrizione. I timestamp a livello di frase e a livello di parola sono disponibili su richiesta.

  • Diarization. Distingue tra i parlanti in una conversazione, assegnando parti della trascrizione a altoparlanti specifici.

  • Rilevamento del ruolo voce. Identifica i ruoli dell'agente e del cliente all'interno dei dati delle chiamate del contact center.

  • Rilevamento della lingua. Rileva automaticamente la lingua nell'audio o usa hint di lingua/impostazioni locali specificati.

Estrazione di campi

L'estrazione dei campi consente di estrarre dati strutturati da file audio, ad esempio riepiloghi, sentimenti ed entità menzionate dai log delle chiamate. Per iniziare, è possibile personalizzare un modello di analizzatore suggerito o crearne uno da zero.

Vantaggi principali

Content Understanding offre funzionalità audio avanzate, tra cui:

  • Estrazione dei dati personalizzabile. Adattare l'output in base alle esigenze specifiche modificando lo schema del campo, consentendo una generazione e un'estrazione dei dati precise.

  • Modelli generativi. Usare i modelli di intelligenza artificiale generativi per specificare nel linguaggio naturale il contenuto che si vuole estrarre e il servizio genera l'output desiderato.

  • Pre-elaborazione integrata. Trarre vantaggio dai passaggi di pre-elaborazione predefiniti, ad esempio la trascrizione, la diarizzazione e il rilevamento dei ruoli, fornendo un contesto avanzato per i modelli generativi.

  • Adattabilità dello scenario. Adattare il servizio ai requisiti generando campi personalizzati ed estrarre i dati pertinenti.

Content Understanding audio analyzer templates (Informazioni sui contenuti)

Content Understanding offre modelli di analizzatore audio personalizzabili:

  • Analisi post-chiamata. Analizzare le registrazioni delle chiamate per generare trascrizioni di conversazione, riepiloghi delle chiamate, valutazioni del sentiment e altro ancora.

  • Analisi della conversazione. Generare trascrizioni, riepiloghi e valutazioni del sentiment dalle registrazioni audio della conversazione.

Iniziare con un modello o creare un analizzatore personalizzato per soddisfare esigenze aziendali specifiche.

Requisiti di input

Per un elenco dettagliato dei formati audio supportati, vedere la pagina Limiti e codec del servizio.

Lingue e aree supportate

Per un elenco completo delle aree, delle lingue e delle impostazioni locali supportate, vedere la pagina Relativa al supporto di lingue e aree geografiche.

Privacy e sicurezza dei dati

Gli sviluppatori che usano Content Understanding devono esaminare i criteri di Microsoft sui dati dei clienti. Per altre informazioni, visitare la pagina Dati, protezione e privacy .

Passaggi successivi

  • Provare a elaborare il contenuto audio usando Content Understanding in Azure AI Foundry.
  • Altre informazioni sui modelli di analizzatore audio.