Inmatningsklient med Azure AI-tjänster
Inmatningsklienten är ett verktyg som släppts av Microsoft på GitHub och som hjälper dig att snabbt distribuera en transkriptionslösning för callcenter till Azure utan kod.
Dricks
Du kan använda verktyget och den resulterande lösningen i produktion för att bearbeta en hög volym ljud.
Inmatningsklienten använder Azure AI Language, Azure AI Speech, Azure Storage och Azure Functions.
Kom igång med inmatningsklienten
Ett Azure-konto och en Azure AI-tjänstresurs med flera tjänster krävs för att köra inmatningsklienten.
- Azure-prenumeration – Skapa en kostnadsfritt
- Skapa en Azure AI-tjänstresurs i Azure Portal.
- Hämta resursnyckeln och regionen. När resursen har distribuerats väljer du Gå till resurs för att visa och hantera nycklar. Mer information om Azure AI-tjänstresurser finns i den här snabbstarten.
Inmatningsklientfunktioner
Inmatningsklienten fungerar genom att ansluta ett dedikerat Azure-lagringskonto till anpassade Azure Functions på ett serverlöst sätt för att skicka transkriptionsbegäranden till tjänsten. De transkriberade ljudfilerna hamnar i den dedikerade Azure Storage-containern.
Viktigt!
Prissättningen varierar beroende på åtgärdsläget (batch jämfört med realtid) samt den Valda Azure-funktions-SKU:n. Som standard skapar verktyget en Premium Azure-funktions-SKU för att hantera stora volymer. Mer information finns på sidan Prissättning .
Internt använder verktyget tal- och språktjänster och följer bästa praxis för att hantera uppskalning, återförsök och redundans. Följande schema beskriver resurserna och anslutningarna.
Följande Speech-tjänstfunktion används av inmatningsklienten:
- Batchtal till text: Transkribera stora mängder ljudfiler asynkront, inklusive talardiarisering och används vanligtvis i analysscenarier efter samtal. Diarisering är processen att känna igen och separera högtalare i monokanalsljuddata.
Här följer några språktjänstfunktioner som används av inmatningsklienten:
- Extrahering och redigering av personligt identifierbar information (PII): Identifiera, kategorisera och redigera känslig information i konversationstranskription.
- Attitydanalys och åsiktsutvinning: Analysera transkriptioner och associera positiva, neutrala eller negativa sentiment på yttrande- och konversationsnivå.
Förutom Azure AI-tjänster används dessa Azure-produkter för att slutföra lösningen:
- Azure Storage: Används för att lagra telefonidata och de transkriptioner som batch-transkriptions-API:et returnerar. Det här lagringskontot bör använda meddelanden, särskilt när nya filer läggs till. Dessa meddelanden används för att utlösa transkriptionsprocessen.
- Azure Functions: Används för att skapa SAS-URI (signatur för delad åtkomst) för varje inspelning och utlösa HTTP POST-begäran för att starta en transkription. Dessutom använder du Azure Functions för att skapa begäranden för att hämta och ta bort transkriptioner med hjälp av Batch Transcription-API:et.
Anpassning av verktyg
Verktyget är skapat för att visa kundernas resultat snabbt. Du kan anpassa verktyget till önskade SKU:er och konfiguration. SKU:erna kan redigeras från Azure Portal och själva koden är tillgänglig på GitHub.
Kommentar
Vi föreslår att du skapar resurserna i samma dedikerade resursgrupp för att förstå och spåra kostnader enklare.