Content Understanding-ljudlösningar (förhandsversion)

Artikel
01/16/2025

Viktigt!

Azure AI Content Understanding är tillgängligt som förhandsversion. Offentliga förhandsversioner ger tidig åtkomst till funktioner som är i aktiv utveckling.
Funktioner, metoder och processer kan ändra eller ha begränsade funktioner, före allmän tillgänglighet (GA).
Mer information finns i Kompletterande användningsvillkor för Förhandsversioner av Microsoft Azure.

Content Understanding audio analyzeers enable transcription and diarization of conversational audio, extracting structured fields such such summaries, sentiments, and key topics. Anpassa en ljudanalysmall efter dina affärsbehov med hjälp av Azure AI Foundry-portalen för att börja generera resultat.

Här är vanliga scenarier för att använda Content Understanding med konversationsljuddata:

Få kundinsikter genom sammanfattning och attitydanalys.
Utvärdera och verifiera samtalskvalitet och efterlevnad i callcenter.
Skapa automatiserade sammanfattningar och metadata för podcastpublicering.

Funktioner för ljudanalys

Content Understanding fungerar som en hörnsten för Media Asset Management-lösningar, vilket möjliggör följande funktioner för ljudfiler:

Extrahering av innehåll

Transkription. Konverterar konversationsljud till sökbara och analysbara textbaserade transkriptioner i WebVTT-format. Anpassningsbara fält kan genereras från transkriptionsdata. Tidsstämplar på meningsnivå och ordnivå är tillgängliga på begäran.
Diarization. Skiljer mellan talare i en konversation och tillskriver delar av avskriften till specifika talare.
Identifiering av talarroll. Identifierar agent- och kundroller i kontaktcentersamtalsdata.
Språkidentifiering. Identifierar automatiskt språket i ljudet eller använder angivna språk-/språktips.

Fältextrahering

Med fältextrahering kan du extrahera strukturerade data från ljudfiler, till exempel sammanfattningar, sentiment och nämnda entiteter från samtalsloggar. Du kan börja med att anpassa en föreslagen analysmall eller skapa en från grunden.

Viktiga fördelar

Content Understanding erbjuder avancerade ljudfunktioner, inklusive:

Anpassningsbar dataextrahering. Skräddarsy utdata efter dina specifika behov genom att ändra fältschemat, vilket möjliggör exakt datagenerering och extrahering.
Generativa modeller. Använd generativa AI-modeller för att på naturligt språk ange det innehåll som du vill extrahera och tjänsten genererar önskade utdata.
Integrerad förbearbetning. Dra nytta av inbyggda förbearbetningssteg som transkription, diarisering och rollidentifiering, vilket ger omfattande kontext för generativa modeller.
Scenarioanpassning. Anpassa tjänsten efter dina krav genom att generera anpassade fält och extrahera relevanta data.

Innehållstolkning av ljudanalysmallar

Content Understanding erbjuder anpassningsbara ljudanalysmallar:

Analys efter anrop. Analysera samtalsinspelningar för att generera konversationsavskrifter, samtalssammanfattningar, sentimentutvärderingar med mera.
Konversationsanalys. Generera transkriptioner, sammanfattningar och sentimentutvärderingar från konversationsljudinspelningar.

Börja med en mall eller skapa en anpassad analysator för att uppfylla dina specifika affärsbehov.

Indatakrav

En detaljerad lista över ljudformat som stöds finns på sidan Tjänstbegränsningar och codecs .

Språk och regioner som stöds

En fullständig lista över regioner, språk och nationella inställningar som stöds finns på sidan Språk- och regionstöd).

Datasekretess och säkerhet

Utvecklare som använder Content Understanding bör granska Microsofts principer för kunddata. Mer information finns på sidan Data, skydd och sekretess .

Nästa steg

Prova att bearbeta ljudinnehållet med hjälp av Content Understanding i Azure AI Foundry-portalen.
Lär dig hur du analyserar mallar för ljudinnehållsanalys.
Granska kodexemplet: extrahering av ljudinnehåll.
Granska kodexemplet: analysmallar.

Dela via