Bewerken

Delen via


Opnamen van callcenters analyseren met behulp van tekstanalyse voor status en Azure OpenAI-service

Azure AI-taal
Azure Synapse Analytics
Azure AI services
Azure Blob Storage

In de afgelopen jaren zijn veel zorgbedrijven verhuisd naar de cloud en kiezen ze ervoor om onlineservices te bieden via telezorgoplossingen. Deze wijziging heeft geleid tot een toename van de hoeveelheid zorggerichte audiogegevens die beschikbaar zijn voor bedrijven die deze services aanbieden. Handmatige analyse van deze gegevens kan nuttige inzichten opleveren, zoals de voorgeschreven behandelingen. Maar de schaal van deze gegevens maakt handmatige analyse een tijdrovende taak.

Het is mogelijk om de analyse van gevoelige gezondheidsgegevens te automatiseren met behulp van azure-hulpprogramma's. In dit artikel wordt een oplossing beschreven die u voor de volgende taken kunt gebruiken:

  • De transcriptie van audiogegevens automatiseren
  • Een gezondheidszorgspecifieke analyse uitvoeren van die gegevens die verband houden met medische terminologie
  • De gegevens aan eindgebruikers leveren

Apache en Apache® Spark zijn gedeponeerde handelsmerken of handelsmerken van de Apache Software Foundation in de Verenigde Staten en/of andere landen. Er wordt geen goedkeuring door de Apache Software Foundation geïmpliceerd door het gebruik van deze markeringen.

Architectuur

De oplossing bestaat uit twee pijplijnen:

  • Een transcriptiepijplijn waarmee audio naar tekst wordt geconverteerd
  • Een analyse- en visualisatiepijplijn die de getranscribeerde tekst verrijkt en analyseert

Transcriptiepijplijn

Architectuurdiagram van een pijplijn waarmee het proces voor het transcriberen van geüploade callcenteropnamen wordt geautomatiseerd.

Een Visio-bestand van deze architectuur downloaden.

Gegevensstroom

  1. Audiobestanden worden geüpload naar een Azure Storage-account. Ondersteunde uploadmethoden zijn onder andere het gebruik van een opslag-SDK, een opslag-API en hulpprogramma's op basis van de gebruikersinterface, zoals Azure Storage Explorer.

  2. Tijdens het uploaden naar Storage wordt een logische Azure-app geactiveerd. De logische app heeft toegang tot de benodigde referenties in Azure Key Vault en doet een aanvraag naar de Transcriptie-API van Azure AI Speech.

  3. De logische app verzendt de audiobestanden naar Azure AI Speech voor een transcriptie. De aanroep van de service specificeert optionele instellingen voor spreker-diarisatie.

  4. Azure AI Speech voltooit de batchtranscriptie en laadt de transcriptieresultaten in een opslagaccount.

Analyse- en visualisatiepijplijn voor gezondheidszorganalyse

Architectuurdiagram van een pijplijn waarmee het proces van het samenvatten en extraheren van informatie uit opnamen van het callcenter wordt geautomatiseerd.

Een Visio-bestand van deze architectuur downloaden.

Gegevensstroom

  1. Een Azure Synapse Analytics-pijplijn wordt uitgevoerd om de getranscribeerde audiotekst op te halen en te verwerken.

  2. Een Azure-functie-app in de pijplijn maakt gebruik van een API-aanroep om de verwerkte tekst te verzenden naar de tekstanalyse voor de statusfunctie van Azure AI Language. Met deze functie wordt een gezondheidszorggerichte analyse van de tekst uitgevoerd. De analyse extraheert de volgende informatie:

    • Entiteiten zoals medicijnen en diagnoses
    • Verwante metagegevens zoals Systematized Nomenclature of Medicine (SNOMED) codes en International Classification of Diseases (ICD)-10 codes
    • Relaties tussen de entiteiten die door de functie worden geïdentificeerd
  3. Een Azure-functie-app in de Azure Synapse Analytics-pijplijn roept de Azure OpenAI Service-API aan. Deze aanroep maakt gebruik van GPT om een door mensen leesbare samenvatting van de gespreksinhoud te genereren.

    • Indien nodig wordt inhoud die door de tekstanalyse voor statusfuncties wordt geëxtraheerd in de vorige stap doorgegeven aan de Open AI-service en opgenomen in de samenvatting.
    • Als de oproepinhoud nodig is voor machine learning, wordt GPT gebruikt om een taalvriendelijke weergave van de gegevens te extraheren. De Azure OpenAI embeddings-API wordt gebruikt voor die extractie.
  4. De verwerkte gegevens worden opgeslagen in een opslagaccount.

  5. Azure Synapse Analytics wordt gebruikt om de gegevens op schaal te analyseren.

  6. De resulterende inhoud wordt geleverd aan visualisatiehulpprogramma's zoals Power BI via een ondersteunende laag, zoals een toegewezen SQL-pool.

Onderdelen

  • Azure Data Lake Storage biedt zeer schaalbare cloudeigen objectopslag. Als data lake die is gebouwd op Basis van Azure Blob Storage, biedt Data Lake Storage geoptimaliseerde kosten en prestaties voor gegevens die worden gebruikt in analyses, machine learning en andere toepassingen.
  • Azure Functions is een serverloze azure-oplossing die als host fungeert voor lichtgewicht code die wordt gebruikt in analysepijplijnen. Functions ondersteunt verschillende talen en frameworks, waaronder .NET, Java en Python. Met behulp van lichtgewicht virtualisatietechnologie kan Functions snel worden uitgebreid om een groot aantal gelijktijdige aanvragen te ondersteunen en tegelijkertijd service level agreements (SLA's) op bedrijfsniveau te onderhouden.
  • Key Vault slaat geheimen op, zoals tokens, wachtwoorden en clientsleutels. Key Vault biedt gedetailleerde autorisatie en verificatie die is gebaseerd op Microsoft Entra-id om de toegang tot geheimen te beheren. Key Vault biedt ook ondersteuning voor systeemeigen integraties met veel Azure-services.
  • Azure AI Speech biedt spraakmogelijkheden zoals spraak-naar-tekst, tekst-naar-spraak, spraakomzetting en spraakherkenningsservices. Als onderdeel van Azure AI Services helpt deze spraakservice u bij het maken van toepassingen door kant-en-klare, vooraf samengestelde, aanpasbare API's en modellen aan te bieden.
  • Tekstanalyse voor de status is een functie van Azure AI Language die u kunt gebruiken om tekst in gezondheidszorgdocumenten te extraheren, classificeren en begrijpen. U kunt tekstanalyse gebruiken voor gezondheid om medische entiteiten, metagegevens van medische entiteiten zoals SNOMED-codes en relaties tussen medische entiteiten te extraheren uit complexe natuurlijke taal die betrekking hebben op medicijnen, zoals medische notities.
  • Azure OpenAI is een cloudservice die geavanceerde AI biedt door REST API-toegang te bieden tot OpenAI-modellen zoals GPT-3, Codex en DALL-E. De Azure OpenAI-API's zijn ontwikkeld met OpenAI om compatibiliteit met OpenAI te garanderen. Met Azure OpenAI profiteert u van de beveiligingsmogelijkheden van Azure tijdens het uitvoeren van het model. Azure OpenAI biedt privénetwerken, regionale beschikbaarheid en verantwoordelijke AI-inhoudsfiltering. Het eindpunt voor voltooiingen is het kernonderdeel van de API-service. Deze API biedt toegang tot de tekst-in- en tekst-outinterface van het model. Wanneer u een invoerprompt opgeeft die een Engelse tekstopdracht bevat, genereert het model een voltooiing van de tekst.
  • Azure Synapse Analytics is een volledig bedrijfsanalyseplatform dat gegevensopname, indeling, verwerking en servicemogelijkheden op schaal biedt.
  • Power BI is een bedrijfsdashboard en visualisatieprogramma met geïntegreerde semantische modelleringsmogelijkheden.

Alternatieven

  • U kunt Azure Logic Apps gebruiken in plaats van Functions. Met name kunt u Logic Apps gebruiken als u taken plant en opnamen verwerkt in batches in plaats van elke opname te verwerken terwijl u deze ontvangt.
  • In plaats van Azure Synapse Analytics kunt u Azure Databricks gebruiken voor analyse.
  • U kunt Azure Data Factory gebruiken in plaats van een Azure Synapse Analytics-pijplijn.
  • Als u geplande batches wilt verwerken, kunt u Data Factory of een Azure Synapse Analytics-pijplijn gebruiken in plaats van een op triggers gebaseerde benadering.
  • Voor sommige analyses zijn EHR-gegevens (Electronic Health Records), FHIR-gegevens (Fast Healthcare Interoperability Resources) vereist die zijn opgeslagen in de Azure API for FHIR of andere gegevens. In deze scenario's kunt u die gegevens extraheren en opnemen in het opslagaccount of de container die u gebruikt voor analyse. In de pijplijn Analyse en visualisatie voor het diagram voor gezondheidszorganalyse wordt dat account of de container tussen stap vier en vijf weergegeven. Vervolgens kunt u de gegevens gebruiken als onderdeel van uw analyse.
  • U kunt machine learning-methoden toepassen op de gegevens als onderdeel van de analyse. In de pijplijn Analyse en visualisatie voor het diagram voor gezondheidszorganalyse wordt de analyse als de vijfde stap weergegeven. U kunt Azure Synapse Analytics gebruiken om de methoden rechtstreeks toe te passen of u kunt een externe service zoals Azure Machine Learning gebruiken.

Scenariodetails

Deze oplossing is gebaseerd op een echte klantgebruiksscenario. Gebruikers uploaden hun audiogegevens eerst naar een opslagaccount voor analyse. Met een geautomatiseerde trigger wordt een Azure-functie-app gestart om Azure AI Speech te gebruiken om de gegevens te transcriberen. In deze stap worden sleutels gebruikt die zijn opgeslagen in Key Vault. Nadat de gegevens zijn getranscribeerd, haalt een analysepijplijn belangrijke statusinformatie uit de gegevens op. De pijplijn is gebaseerd op een Azure Synapse Analytics-pijplijn. Er wordt gebruikgemaakt van tekstanalyse voor gezondheid en Azure OpenAI om de algemene inhoud samen te vatten en informatie te extraheren, zoals diagnose- en patiëntmedicijnen. Azure Synapse Analytics voegt deze gegevens vervolgens samen en transformeert deze gegevens zo nodig voor het verbruik van eindgebruikers via Power BI-dashboards.

De oplossing is gebaseerd op verschillende veronderstellingen. Omdat de gegevens zeer gevoelig zijn, wordt ervan uitgegaan dat u veilig alle opslagaccounts en -services implementeert door de beschikbare aanbevolen procedures te volgen voor het werken met gevoelige gegevens in de cloud. U moet bijvoorbeeld alle data-at-rest versleutelen en u moet accountsleutels veilig opslaan. Er wordt ook van uitgegaan dat u de juiste informatiebeveiligingsmedewerkers raadpleegt over best practices voor bedrijfsbeveiliging.

Potentiële gebruikscases

U kunt deze oplossing voor veel doeleinden gebruiken, waaronder:

  • Slimme analyse van telehealthgegevens. U kunt inzichten extraheren uit de audio die u verzamelt van telehealthsessies waarin patiënten op afstand communiceren met providers om resultaten te bespreken.
  • Slimme analyse van zorggerichte callcentergegevens. De oplossing kan callcentergegevens analyseren van zorgaanbieders die thuis of op afstand zorg bieden aan patiënten. Als onderdeel van de analyse kunt u waardevolle informatie extraheren over producten, zoals negatieve resultaten, waarover klanten bellen.
  • Slimme analyse van klinische proefgegevens. U kunt waardevolle inzichten verzamelen uit externe touchpoints van klinische onderzoeken. De oplossing kan automatisch medische terminologie extraheren en correleren om gewenste inzichten te produceren voor grootschalige analyse.

Overwegingen

Met deze overwegingen worden de pijlers van het Azure Well-Architected Framework geïmplementeerd. Dit is een set richtlijnen die kunnen worden gebruikt om de kwaliteit van een workload te verbeteren. Zie Microsoft Azure Well-Architected Framework voor meer informatie.

Betrouwbaarheid

Betrouwbaarheid zorgt ervoor dat uw toepassing kan voldoen aan de toezeggingen die u aan uw klanten hebt gedaan. Zie Overzicht van de betrouwbaarheidspijler voor meer informatie.

Houd rekening met de volgende punten als uw scenario een oplossing vereist voor hoge beschikbaarheid en herstel na noodgevallen:

Beveiliging

Beveiliging biedt garanties tegen opzettelijke aanvallen en misbruik van uw waardevolle gegevens en systemen. Zie Overzicht van de beveiligingspijler voor meer informatie.

Het type klantoproepgegevens dat door deze oplossing wordt gebruikt, is zeer gevoelig. Schakel beveiligingscontroles in de hele oplossing in om ervoor te zorgen dat deze gevoelige gegevens veilig blijven. Gebruik Key Vault ook als een schaalbare service waarmee eindgebruikers sleutels en geheimen die ze nodig hebben voor de oplossing veilig kunnen opslaan. Omdat de oplossing OpenAI gebruikt om inzichten te extraheren uit ongestructureerde gegevens, moet u ervoor zorgen dat de algemene inzichten die u hebt afgeleid, voldoen aan de Microsoft-principes voor verantwoorde AI. Zie Verantwoordelijke AI-procedures in staat stellen voor meer informatie over verantwoorde AI-procedures.

Kostenoptimalisatie

Kostenoptimalisatie gaat over manieren om onnodige uitgaven te verminderen en operationele efficiëntie te verbeteren. Zie Overzicht van de pijler kostenoptimalisatie voor meer informatie.

U kunt de oplossing op verschillende manieren optimaliseren voor kosten:

  • Wanneer u analyses ontwikkelt of nieuwe analytische resultaten toevoegt aan de inhoud, voert u pijplijnen uit die de spraak-naar-teksttranscriptie van de audio slechts één keer voltooien. Andere services kunnen vervolgens de opgeslagen inhoud verwerken als onderdeel van andere pijplijnen.
  • Voer inzichten uit die u uit tekstanalyse haalt voor de status slechts één keer. Sla de resultaten op en gebruik ze opnieuw voor ontwikkeling. Deze aanpak biedt u een manier om snel en rendabel OpenAI prompt engineering uit te voeren.
  • Gebruik tijdelijke rekenresources, zoals kortstondige Spark-clusters, voor analyse. Normaal gesproken voert u deze typen op batch gebaseerde workloads regelmatig uit. Het afsluiten van het cluster tussen uitvoeringen kan de totale kosten van de oplossing aanzienlijk verlagen.

Medewerkers

Dit artikel wordt onderhouden door Microsoft. De tekst is oorspronkelijk geschreven door de volgende Inzenders.

Belangrijkste auteurs:

Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.

Volgende stappen