Bearbeiten

Freigeben über


Analysieren von Callcenter-Aufzeichnungen mithilfe von Textanalysen für Gesundheit und Azure OpenAI-Diensten

Azure KI Language
Azure Synapse Analytics
Azure KI Services
Azure Blob Storage

In den letzten Jahren haben sich viele Unternehmen im Gesundheitswesen in die Cloud bewegt und sich für die Bereitstellung von Onlinediensten über Telehealth-Lösungen entschieden. Diese Veränderung hat zu einer Erhöhung der Menge an gesundheitsorientierten Audiodaten geführt, die Unternehmen, die diese Dienste anbieten, zur Verfügung stehen. Eine manuelle Analyse dieser Daten kann nützliche Erkenntnisse liefern, z. B. die vorgeschriebenen Behandlungen. Der Umfang dieser Daten macht jedoch eine manuelle Analyse zu einem zeitaufwändigen Vorgang.

Es ist möglich, die Analyse vertraulicher Gesundheitsdaten mithilfe von Azure-basierten Tools zu automatisieren. In diesem Artikel wird eine Lösung beschrieben, die Sie für folgende Aufgaben verwenden können:

  • Automatisieren der Transkription von Audiodaten
  • Durchführung einer gesundheitsspezifischen Analyse dieser Daten, welche die Verknüpfung medizinischer Terminologie umfasst
  • Liefern der Daten an Endbenutzer

Apache® und Apache Spark sind entweder eingetragene Marken oder Marken der Apache Software Foundation in den USA und/oder anderen Ländern. Die Verwendung dieser Marken impliziert keine Zustimmung durch die Apache Software Foundation.

Aufbau

Die Lösung besteht aus zwei Pipelines:

  • Eine Transkriptionspipeline, die Audio in Text konvertiert
  • Eine Analyse- und Visualisierungspipeline, die den transkribierten Text anreichert und analysiert

Transkriptionspipeline

Architekturdiagramm einer Pipeline, die den Prozess des Transkribierens hochgeladener Callcenteraufzeichnungen automatisiert.

Laden Sie eine Visio-Datei dieser Architektur herunter.

Datenfluss

  1. Die Audiodateien werden in ein Azure Storage-Konto hochgeladen. Zu den unterstützten Uploadmethoden gehören die Verwendung eines Speicher-SDK, einer Speicher-API und UI-basierte Tools wie Azure Storage Explorer.

  2. Der Upload in Azure Storage löst die Azure-Logik-App aus. Die Logik-App greift auf alle erforderlichen Anmeldeinformationen in Azure Key Vault zu und sendet eine Anforderung an die Batchtranskriptions-API von Azure KI Speech.

  3. Die Logik-App sendet die Audiodateien für eine Transkription an Azure KI Speech. Der Aufruf an den Diensts gibt optionale Einstellungen für die Sprecherdiarisierung an.

  4. Azure KI Speech führt die Batchtranskription durch und lädt die Transkriptionsergebnisse in ein Storage-Konto.

Analyse- und Visualisierungspipeline für die Analyse im Gesundheitswesen

Architekturdiagramm einer Pipeline, die den Prozess des Zusammenfassens und Extrahierens von Informationen aus Callcenteraufzeichnungen automatisiert.

Laden Sie eine Visio-Datei dieser Architektur herunter.

Datenfluss

  1. Eine Azure Synapse Analytics-Pipeline wird ausgeführt, um den transkribierten Audiotext abzurufen und zu verarbeiten.

  2. Eine Azure-Funktions-App in der Pipeline verwendet einen API-Aufruf, um den verarbeiteten Text an das Textanalysefeature für Gesundheit von Azure KI Language zu senden. Dieses Feature führt eine gesundheitsorientierte Analyse des Texts durch. Die Analyse extrahiert die folgenden Informationen:

    • Entitäten wie Medikamente und Diagnosen
    • Verwandte Metadaten wie Systematisierte Nomenklatur der Medizin (SNOMED)-Codes und Internationale Klassifizierung von Krankheiten (ICD)-10-Codes
    • Beziehungen zwischen den Entitäten, die das Feature identifiziert
  3. Eine Azure-Funktions-App in der Azure Synapse Analytics-Pipeline ruft die Azure OpenAI-Dienst-API auf. Dieser Aufruf verwendet GPT, um eine lesbare Zusammenfassung des Anrufinhalts zu generieren.

    • Bei Bedarf werden Inhalte, welche das Textanalysefeature für Gesundheit im vorherigen Schritt extrahiert hat, an den Open AI-Dienst übergeben und in die Zusammenfassung aufgenommen.
    • Wenn der Anrufinhalt für maschinelles Lernen benötigt wird, wird GPT verwendet, um eine maschinelle sprachfreundliche Darstellung der Daten zu extrahieren. Für diese Extraktion wird die Azure OpenAI-Einbettungs-API verwendet.
  4. Die verarbeiteten Daten werden in einem Speicherkonto gespeichert.

  5. Azure Synapse Analytics wird verwendet, um die Daten im großen Maßstab zu analysieren.

  6. Die resultierenden Inhalte werden zur Visualisierung an Tools wie Power BI über eine Dienstebene wie einen dedizierten SQL-Pool bereitgestellt.

Komponenten

  • Azure Data Lake Storage bietet einen massiv skalierbaren cloudeigenen Objektspeicher an. Als Datensee, der auf Azure Blob Storage basiert, bietet Data Lake Storage optimierte Kosten und Leistungen für Daten, die in Analysen, maschinellem Lernen und anderen Anwendungen verwendet werden.
  • Azure Functions ist eine Azure-eigene serverlose Lösung, die einfachen Code hostet, der in Analysepipelines verwendet wird. Funktionen unterstützt verschiedene Sprachen und Frameworks, einschließlich .NET, Java und Python. Mithilfe der einfachen Virtualisierungstechnologie können Funktionen schnell skaliert werden, um eine große Anzahl gleichzeitiger Anforderungen zu unterstützen und gleichzeitig Vereinbarungen auf Service-Level-Ebene (Service Level Agreements, SLAs) auf Unternehmensniveau einzuhalten.
  • Key Vault speichert geheime Schlüssel wie Token, Kennwörter und Clientschlüssel. Um den Zugriff auf geheime Schlüssel zu steuern, bietet Key Vault eine differenzierte Autorisierung und Authentifizierung, die auf der Microsoft Entra-ID basiert. Key Vault unterstützt auch systemeigene Integrationen in viele Azure-Dienste.
  • Azure KI Speech bietet Sprachfunktionen wie Spracherkennung, Sprachsynthese und Sprachübersetzung. Im Rahmen von Azure KI Services, hilft Ihnen dieser Sprachdienst, Anwendungen zu erstellen, indem er sofort einsatzbereite, vordefinierte, anpassbare APIs und Modelle anbietet.
  • Die Textanalyse für den Gesundheitszustand ist ein Feature von Azure KI Language, mit dem Sie Text in Dokumenten im Gesundheitswesen extrahieren, klassifizieren und verstehen können. Sie können Textanalysen für Gesundheit verwenden, um im medizinischen Bereich medizinische Entitäten, Metadaten der medizinischen Entität, wie SNOMED-Codes, und medizinische Entitätsbeziehungen aus komplexer natürlicher Sprache, wie z. B. medizinische Notizen, zu extrahieren.
  • Azure OpenAI ist ein cloudbasierter Dienst, der eine erweiterte Sprach-KI bietet, indem der REST-API Zugriff auf OpenAI-Modelle wie GPT-3, Codex und DALL-E bereitgestellt wird. Die Azure OpenAI-APIs werden mit OpenAI entwickelt, um die Kompatibilität mit OpenAI zu gewährleisten. Mit Azure OpenAI profitieren Sie von den Sicherheitsfunktionen von Azure während der Modellausführung. Azure OpenAI bietet private Netzwerke, regionale Verfügbarkeit und verantwortungsvolle KI-Inhaltsfilterung. Der Vervollständigungsendpunkt ist die Kernkomponente des API-Diensts. Diese API bietet Zugriff auf die Texteingabe- und Textausgabeschnittstelle des Modells. Wenn Sie eine Eingabeaufforderung bereitstellen, die einen englischen Textbefehl enthält, generiert das Modell einen Textabschluss.
  • Azure Synapse Analytics ist eine umfassende Unternehmensanalyseplattform, die in großem Umfang Datenerfassung, -orchestrierung, -verarbeitung und -bereitstellungsfunktionen bietet.
  • Power BI ist ein Business Dashboard- und Visualisierungstool mit integrierten Funktionen für die semantische Modellierung.

Alternativen

  • Sie können Azure Logic Apps anstelle von Funktionen verwenden. Insbesondere können Sie Logik-Apps verwenden, wenn Sie Aufträge planen und Aufzeichnungen in Batches verarbeiten, anstatt jede Aufzeichnung beim Empfang zu verarbeiten.
  • Anstelle von Azure Synapse Analytics können Sie Azure Databricks zur Analyse verwenden.
  • Sie können Azure Data Factory anstelle einer Azure Synapse Analytics-Pipeline verwenden.
  • Um geplante Batches zu verarbeiten, können Sie Data Factory oder eine Azure Synapse Analytics-Pipeline anstelle eines triggerbasierten Ansatzes verwenden.
  • Einige Analysen erfordern elektronische Gesundheitsdaten (Electronic Health Records, EHR), Fast Healthcare Interoperability Resources (FHIR), die in der Azure-API für FHIR gespeichert sind, oder andere Daten. In diesen Szenarien können Sie diese Daten extrahieren und in dem Speicherkonto oder Container erfassen, den Sie für die Analyse verwenden. In dem Diagramm zur Analyse- und Visualisierungspipeline für die Analyse im Gesundheitswesen wird dieses Konto oder dieser Container zwischen den Schritten vier und fünf dargestellt. Anschließend können Sie die Daten als Teil Ihrer Analyse verwenden.
  • Sie können maschinelle Lernmethoden auf die Daten als Teil der Analyse anwenden. In dem Diagramm zur Analyse- und Visualisierungspipeline für die Analyse im Gesundheitswesen wird die Analyse als fünfter Schritt dargestellt. Sie können Azure Synapse Analytics verwenden, um die Methoden direkt anzuwenden, oder Sie können einen externen Dienst wie Azure Machine Learning nutzen.

Szenariodetails

Diese Lösung basiert auf einem echten Kundenanwendungsfall. Benutzer laden ihre Audiodaten zuerst zur Analyse in ein Speicherkonto hoch. Ein automatisierter Trigger startet eine Azure-Funktions-App, um die Daten mithilfe von Azure KI Speech zu transkribieren. In diesem Schritt werden Schlüssel verwendet, die im Key Vault gespeichert sind. Nachdem die Daten transkribiert wurden, extrahiert eine Analysepipeline wichtige Gesundheitsinformationen aus den Daten. Die Pipeline basiert auf einer Azure Synapse Analytics-Pipeline. Es nutzt Textanalysen für den Zustand und Azure OpenAI, um den Gesamtinhalt zusammenzufassen und Informationen wie Diagnose und Patientenmedikation zu extrahieren. Azure Synapse Analytics aggregiert und transformiert diese Daten dann nach Bedarf für die Verwendung durch den Endbenutzer über Power BI-Dashboards.

Die Lösung basiert auf mehreren Annahmen. Da die Daten streng vertraulich sind, wird davon ausgegangen, dass Sie alle Speicherkonten und -dienste sicher bereitstellen, indem Sie die verfügbaren bewährten Methoden zum Arbeiten mit vertraulichen Daten in der Cloud durchführen. Sie sollten beispielsweise alle ruhenden Daten verschlüsseln und Kontoschlüssel sicher speichern. Es wird auch davon ausgegangen, dass Sie geeignete Informationssicherheitsmitarbeiter zu bewährten Methoden für die Unternehmenssicherheit konsultieren.

Mögliche Anwendungsfälle

Sie können diese Lösung für viele Zwecke verwenden, unter anderem für:

  • Intelligente Analyse von Telehealth-Daten. Sie können Erkenntnisse aus den Audiodaten extrahieren, die Sie aus Telehealth-Sitzungen sammeln, in denen Patienten remote mit Anbietern interagieren, um Ergebnisse zu diskutieren.
  • Intelligente Analyse gesundheitsorientierter Callcenterdaten. Die Lösung kann Callcenter-Daten von Gesundheitsdienstleistern analysieren, welche die Versorgung ihrer Patienten zuhause oder remote anbieten. Im Rahmen der Analyse können Sie wertvolle Patienteninformationen extrahieren, wie z. B. negative Ergebnisse, wegen denen Patienten anrufen.
  • Intelligente Analyse klinischer Studiendaten. Sie können wertvolle Erkenntnisse aus externen Berührungspunkten klinischer Studien sammeln. Die Lösung kann die medizinische Terminologie automatisch extrahieren und korrelieren, um gewünschte Erkenntnisse für groß angelegte Analysen zu erzeugen.

Überlegungen

Diese Überlegungen beruhen auf den Säulen des Azure Well-Architected Frameworks, d. h. einer Reihe von Grundsätzen, mit denen die Qualität von Workloads verbessert werden kann. Weitere Informationen finden Sie unter Microsoft Azure Well-Architected Framework.

Zuverlässigkeit

Zuverlässigkeit stellt sicher, dass Ihre Anwendung Ihre Verpflichtungen gegenüber den Kunden erfüllen kann. Weitere Informationen finden Sie in der Überblick über die Säule „Zuverlässigkeit“.

Berücksichtigen Sie die folgenden Punkte, wenn Für Ihr Szenario eine Lösung mit hoher Verfügbarkeit und Notfallwiederherstellung erforderlich ist:

  • Die SLA für Azure Synapse Analytics garantiert den Erfolg eines bestimmten Prozentsatzes von Clientvorgängen. Informationen zum SLA dieses Diensts finden Sie unter Service Level Agreements (SLA) für Onlinedienste.
  • Die Verfügbarkeitsgarantie für Logic Apps finden Sie unter Service Level Agreements (SLA) für Onlinedienste.
  • Sie können Blob Storage als georedundanten Speicher (GRS) oder als georedundanten Speicher mit Lesezugriff (RA-GRS) konfigurieren, der Lesevorgänge direkt aus einer alternativen Region ermöglicht. Ihre Auswahl hängt von Ihrer Anforderung an die Wiederherstellungszeit (RTO) ab. Weitere Informationen finden Sie unter Azure Storage-Redundanz.
  • In den Dienst Azure Key Vault sind mehrere Verfügbarkeits- und Redundanzebenen integriert. Weitere Informationen finden Sie unter Azure Key Vault: Verfügbarkeit und Redundanz.

Sicherheit

Sicherheit bietet Schutz vor vorsätzlichen Angriffen und dem Missbrauch Ihrer wertvollen Daten und Systeme. Weitere Informationen finden Sie unter Übersicht über die Säule „Sicherheit“.

Der von dieser Lösung verwendete Datentyp für Kundenanrufdaten ist streng vertraulich. Um sicherzustellen, dass diese vertraulichen Daten sicher bleiben, aktivieren Sie Sicherheitskontrollen in der gesamten Lösung. Verwenden Sie auch Key Vault als skalierbaren Dienst, der Endbenutzern hilft, Schlüssel und geheime Schlüssel sicher zu speichern, die sie für die Lösung benötigen. Da die Lösung OpenAI verwendet, um Erkenntnisse aus unstrukturierten Daten zu extrahieren, stellen Sie sicher, dass die allgemeinen Erkenntnisse, die Sie ableiten, den Microsoft-Prinzipien für verantwortungsvolle KI folgen. Weitere Informationen zu verantwortungsvoller KI finden Sie unter Förderung verantwortungsvoller KI-Praktiken.

Kostenoptimierung

Bei der Kostenoptimierung geht es um die Suche nach Möglichkeiten, unnötige Ausgaben zu reduzieren und die Betriebseffizienz zu verbessern. Weitere Informationen finden Sie unter Übersicht über die Säule „Kostenoptimierung“.

Sie können die Lösung auf verschiedene Arten für Kosten optimieren:

  • Wenn Sie Analysen entwickeln oder dem Inhalt neue Analyseergebnisse hinzufügen, führen Sie Pipelines aus, welche die Sprache-in-Text-Transkription der Audiodaten nur einmal abschließen. Andere Dienste können dann die gespeicherten Inhalte als Teil anderer Pipelines verarbeiten.
  • Führen Sie Einblicke aus, die Sie nur einmal aus der Textanalyse für die Gesundheit extrahieren. Speichern Sie die Ergebnisse, und verwenden Sie sie für die Entwicklung wieder. Dieser Ansatz bietet Ihnen eine Möglichkeit, das OpenAI Prompt Engineering schnell und kosteneffizient zu erledigen.
  • Verwenden Sie für Analysen ephemerale Computeressourcen, wie z. B. ephemerale Spark-Cluster. In der Regel führen Sie diese Arten von batchbasierten Workloads regelmäßig aus. Das Herunterfahren des Clusters zwischen den Läufen kann die Gesamtkosten der Lösung erheblich reduzieren.

Beitragende

Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:

Hauptautoren:

Melden Sie sich bei LinkedIn an, um nicht öffentliche LinkedIn-Profile anzuzeigen.

Nächste Schritte