Diese Lösung für ein Datenkonsortium nutzt Azure-Komponenten. Sie erfüllt diese Ziele:
- Bereitstellen einer Möglichkeit für mehrere Organisationen, Daten gemeinsam zu nutzen.
- Zentralisieren der Datenorchestrierungsbemühungen.
- Gewährleisten der Datensicherheit.
- Garantieren der Privatsphäre von Patienten.
- Unterstützen von Dateninteroperabilität.
- Anbieten von Anpassungsoptionen, um die Anforderungen bestimmter Organisationen zu erfüllen.
Aufbau
Laden Sie eine Visio-Datei dieser Architektur herunter.
Datenfluss
Die Rohdaten stammen aus internen und Drittanbieterquellen. Mitglieder des Konsortiums laden diese Daten in einen der folgenden Speicherdienste in Azure Data Share:
Das Konsortium bittet die Mitglieder, Daten freizugeben. Als Datenproduzenten können die Mitglieder entweder Momentaufnahmen freigeben oder direktes Freigeben verwenden.
Als Datenconsumer empfängt das Konsortium die freigegebenen Mitgliederdaten. Diese Daten gelangen in den Data Lake Storage auf der Datenfreigabe des Konsortiums zur weiteren Transformation.
Azure Data Factory und Azure Databricks bereinigen die Daten der Mitglieder und transformieren sie in ein gemeinsames Format.
Das Konsortium kombiniert die Daten der Mitglieder und speichert sie in einem Dienst. Die Struktur und das Volumen der Daten bestimmen, welche Art von Speicherdienst am besten geeignet ist. Dies können unter anderem folgende sein:
- Azure Synapse Analytics
- Azure SQL-Datenbank
- Azure Data Lake Storage
- Azure-Daten-Explorer
Als Datenfreigabe-Produzent lädt das Konsortium Mitglieder zum Empfangen von Daten ein. Mitglieder können entweder Momentaufnahmedaten oder direkte Freigabedaten akzeptieren.
Als Datenconsumer empfangen die Mitglieder die freigegebenen Daten. Die Daten gelangen in die Datenspeicher der Mitglieder für Forschung und Analyse.
Für das gesamte System gilt Folgendes:
- Microsoft Entra ID, Azure Key Vault und Microsoft Defender for Cloud verwalten den Zugriff und sorgen für Sicherheit.
- Azure Pipelines, ein Dienst von Azure DevOps, erstellt und testet Code und gibt ihn frei.
Komponenten
Diese Lösung verwendet die folgenden Komponenten:
Plattformen für das Gesundheitswesen
Elektronische Gesundheitsakten (EHRs) sind digitale Versionen von Echtzeitinformationen über Patienten.
Fast Healthcare Interoperability Resources (FHIR) ist ein Standard für den Datenaustausch im Gesundheitswesen, der von Health Level Seven International (HL7) veröffentlicht wird.
Das Internet of Medical Things (IoMT) (Internet der medizinischen Dinge) ist die Sammlung medizinischer Geräte und Apps, die sich über Online-Computernetzwerke mit IT-Systemen verbinden.
Genomdaten liefern Informationen darüber, wie Gene miteinander und mit der Umwelt interagieren.
Bildgebungsdaten umfassen die Bilder, die Radiologie, kardiologische Bildgebung, Strahlentherapie und andere Geräte erzeugen.
Customer Relationship Management (CRM, Kundenbeziehungsmanagement)-, Abrechnungs- und Drittanbietersysteme liefern Daten über Patienten.
Azure-Komponenten
Azure Data Share bietet eine Möglichkeit für mehrere Organisationen, Daten auf sichere Weise gemeinsam zu nutzen. Mit diesem Dienst behalten Datenanbieter die Kontrolle über die von ihnen freigegebenen Daten. Es lässt sich einfach verwalten und überwachen, wer welche Daten zu welchem Zeitpunkt freigegeben hat. Data Share macht es außerdem einfach, Analysen und KI-Szenarien anzureichern, indem Daten von verschiedenen Mitgliedern kombiniert werden.
Azure Synapse Analytics ist ein Analysedienst für Data Warehouses und Big-Data-Systeme. Mit diesem Produkt können Sie Daten mit serverlosen, bedarfsorientierten Ressourcen (On-Demand) oder mit bereitgestellten Ressourcen abfragen. Azure Synapse Analytics kann gut mit hohen Volumen an strukturierten Daten umgehen.
Azure SQL-Datenbank ist eine vollständig verwaltete PaaS-Datenbank-Engine (Platform-as-a-Service). Mit KI-gestützten, automatisierten Features übernimmt Azure SQL-Datenbank Verwaltungsfunktionen für Datenbanken wie Upgrades, Patches, Sicherungen und Überwachung. Dieser Dienst ist gut geeignet für strukturierte Daten.
Data Lake Storage ist ein hochgradig skalierbarer und sicherer Data Lake für Ihre Hochleistungs-Analyseworkloads. Dieser Dienst kann mehrere Petabyte an Informationen verwalten und gleichzeitig Hunderte von Gigabyte an Durchsatz aufrechterhalten. Data Lake Storage bietet eine Möglichkeit, strukturierte und unstrukturierte Daten von mehreren Mitgliedern an einem Ort zu speichern.
Azure Data Explorer ist ein schneller, vollständig verwalteter Datenanalysedienst. Sie können diesen Dienst für die Echtzeitanalyse großer Datenmengen nutzen. Azure Data Explorer kann verschiedene Datenströme von Anwendungen, Websites, IoT-Geräten und anderen Quellen verarbeiten. Azure Data Explorer eignet sich gut für die direkte Freigabe von Telemetrie- und Protokollstreamingdaten.
Azure Data Factory ist ein hybrider Datenintegrationsdienst. Sie können diese vollständig verwaltete, serverlose Lösung für Datenintegrations- und -transformationsworkflows verwenden. Data Factory bietet eine codefreie Benutzeroberfläche und ein bedienfreundliches Überwachungspanel. Bei dieser Lösung erfassen Data Factory-Pipelines Daten aus verschiedenen Datenfreigaben von Mitgliedern.
Azure Databricks ist eine Datenanalyseplattform. Azure Databricks basiert auf dem neuesten verteilten Apache Spark-Verarbeitungssystem und unterstützt somit die nahtlose Integration in Open-Source-Bibliotheken. Diese Lösung verwendet Azure Databricks-Notebooks, um alle Mitgliederdaten in ein gemeinsames Format zu transformieren.
Microsoft Entra ID ist ein cloudbasierter Identitäts- und Zugriffsverwaltungsdienst.
Mit Azure Key Vault werden Geheimnisse wie API-Schlüssel, Kennwörter, Zertifikate und kryptografische Schlüssel sicher gespeichert und der Zugriff darauf gesteuert. Dieser Clouddienst verwaltet auch Sicherheitszertifikate.
Azure Pipelines erstellt und testet Codeprojekte automatisch. Dieser Azure DevOps-Dienst kombiniert Continuous Integration und Continuous Delivery (CI/CD). Mithilfe dieser Praktiken testet und erstellt Azure Pipelines beständig und konsistent Code und liefert ihn an jedes Ziel.
Defender for Cloud bietet eine einheitliche Sicherheitsverwaltung und erweiterten Bedrohungsschutz für Hybrid Cloud-Workloads.
Alternativen
Mit Data Share gibt es viele Alternativen für die Datenspeicherung. Ihre Wahl des Diensts hängt von Ihrer Freigabemethode sowie dem Umfang und der Art Ihrer Daten ab:
Für die Momentaufnahmenfreigabe von Batchdaten können Sie jeden der folgenden Dienste verwenden:
- Azure Synapse Analytics
- SQL-Datenbank
- Data Lake Storage
- Azure Blob Storage
Für die direkte Freigabe von Telemetrie- und Protokollstreamingdaten verwenden Sie Azure Data Explorer. Weitere Informationen zur Analyse von Daten aus verschiedenen Quellen finden Sie unter [Interaktive Analysen mit Azure Data Explorer][Interaktive Analysen mit Azure Data Explorer].
Einige Datasets sind groß oder nicht relational. Einige enthalten keine Daten in standardisierten Formaten. Für diese Arten von Datasets funktionieren Blob Storage oder Azure Data Lake Storage besser als Azure Synapse Analytics und SQL-Datenbank beim Austausch von Daten mit Data Share. Weitere Informationen zur effizienten Speicherung medizinischer Daten finden Sie unter Lösungen zur Speicherung medizinischer Daten.
Wenn Data Share keine Option darstellt, ziehen Sie stattdessen ein virtuelles privates Netzwerk (VPN) in Betracht. Sie können ein Site-to-Site-VPN verwenden, um Daten zwischen den Datenspeichern der Mitglieder und des Konsortiums zu übertragen.
Szenariodetails
Traditionelle klinische Studien können komplex, zeitaufwendig und kostspielig sein. Um diese Probleme zu lösen, schließen sich immer mehr Organisationen des Gesundheitswesens zusammen, um Datenkonsortien für die Durchführung klinischer Studien zu bilden.
Das Gesundheitswesen profitiert von Datenkonsortien in vielerlei Hinsicht:
- Forschungsdaten werden verfügbar gemacht.
- Neue Ertragsströme werden geschaffen.
- Durch die Bereitstellung des schnellen Zugriffs auf Daten führen sie zu kosteneffizienten regulatorischen Entscheidungen.
- Durch die Beschleunigung von Innovationen werden Sicherheit und Gesundheit der Patienten verbessert.
Mögliche Anwendungsfälle
Viele Arten von medizinischem Fachpersonal können von dieser Lösung profitieren:
- Organisationen, die echte empirische Daten wie Patientenergebnisse verwenden, um Behandlungen zu bestimmen.
- Ärzte, die sich auf personalisierte oder Präzisionsmedizin spezialisiert haben.
- Telemedizinanbieter, die einfachen Zugriff auf Patientendaten benötigen.
- Forscher, die mit Genomdaten arbeiten.
Überlegungen
Diese Überlegungen beruhen auf den Säulen des Azure Well-Architected Frameworks, d. h. einer Reihe von Grundsätzen, mit denen die Qualität von Workloads verbessert werden kann. Weitere Informationen finden Sie unter Microsoft Azure Well-Architected Framework.
Die Technologien in dieser Lösung erfüllen die Anforderungen der meisten Unternehmen an Sicherheit, Skalierbarkeit und Verfügbarkeit.
Sicherheit
Sicherheit bietet Schutz vor vorsätzlichen Angriffen und dem Missbrauch Ihrer wertvollen Daten und Systeme. Weitere Informationen finden Sie unter Übersicht über die Säule „Sicherheit“.
Aufgrund der Vertraulichkeit medizinischer Informationen spielen bei der Datensicherung mehrere Komponenten eine Rolle:
Die Sicherheitsfunktionen in Data Share schützen Daten auf folgende Weise:
- Verschlüsselung ruhender Daten, wenn der zugrunde liegende Datenspeicher die Verschlüsselung ruhender Daten unterstützt.
- Verschlüsselung von Daten während der Übertragung durch Verwendung von Transport Layer Security (TLS) 1.2.
- Verschlüsseln von Metadaten zu einer ruhenden Datenfreigabe und während der Übertragung.
- Keine Speicherung von Inhalten aus gemeinsam genutzten Kundendaten.
Azure Synapse Analytics bietet ein umfassendes Sicherheitsmodell. Sie können seine feinkörnigen Kontrollen nutzen, um Ihre Daten auf jeder Ebene zu sichern, von einzelnen Zellen bis hin zu ganzen Datenbanken.
SQL-Datenbank verwendet einen mehrschichtigen Ansatz zum Schutz der Kundendaten. Die Strategie deckt die folgenden Bereiche ab:
- Netzwerksicherheit
- Zugriffsverwaltung
- Bedrohungsschutz
- Informationsschutz
Data Lake Storage bietet Zugriffssteuerung. Das Modell unterstützt diese Arten von Kontrollen:
- Was ist die rollenbasierte Zugriffssteuerung (Role-Based Access Control, RBAC) für Azure-Ressourcen?
- POSIX-Zugriffssteuerungslisten (ACLs; Portable Operating System Interface)
Azure Data Explorer schützt Daten auf folgende Weise:
- Verwendet Microsoft Entra ID: verwaltete Identitäten für Azure-Ressourcen.
- Es verwendet RBAC, um Aufgaben voneinander zu trennen und den Zugriff zu begrenzen.
- Es blockiert Datenverkehr, der von Netzwerksegmenten außerhalb von Azure Data Explorer stammt.
- Es schützt Daten und hilft Ihnen, Ihre Verpflichtungen zu erfüllen, indem es Azure Disk Encryption verwenden. Dieser Dienst bietet Volumeverschlüsselung für die Datenträger und das Betriebssystem von virtuellen Computern. Azure Disk Encryption integriert sich auch in Key Vault, das Geheimnisse mit von Microsoft verwalteten Schlüsseln oder kundenseitig verwalteten Schlüsseln verschlüsselt.
Verfügbarkeit
Diese Lösung verwendet eine Bereitstellung in einer einzelnen Region. Einige Szenarien erfordern eine Bereitstellung in mehreren Regionen für Hochverfügbarkeit, Notfallwiederherstellung oder räumliche Nähe. Für diese Fälle bieten die folgenden Dienste Azure-Regionspaare für Hochverfügbarkeit:
Azure Synapse Analytics bietet Hochverfügbarkeit des Warehouse durch Verwendung von Datenbankmomentaufnahmen.
Die Hochverfügbarkeitsarchitektur von SQL-Datenbank bietet eine garantierte Uptime von 99,99 %.
Azure Data Explorer bietet Hochverfügbarkeit durch eine Persistenzebene, eine Computeebene und eine Leader-Follower-Konfiguration.
Kostenoptimierung
Bei der Kostenoptimierung geht es um die Suche nach Möglichkeiten, unnötige Ausgaben zu reduzieren und die Betriebseffizienz zu verbessern. Weitere Informationen finden Sie unter Übersicht über die Säule „Kostenoptimierung“.
Die Preisgestaltung für diese Lösung hängt von mehreren Faktoren ab:
- Den von Ihnen gewählten Diensten
- Der Kapazität und dem Durchsatz Ihres Systems
- Den Transformationen, die Sie auf Daten anwenden
- Ihrer Geschäftskontinuitätsebene
- Ihrer Notfallwiederherstellungsebene
Weitere Informationen finden Sie unter Preise.
Beitragende
Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:
Hauptautoren:
- Matt Hansen | Senior Cloud Solution Architect
- Aruna Ranganathan | Principal Customer Engineering Manager
Melden Sie sich bei LinkedIn an, um nicht öffentliche LinkedIn-Profile anzuzeigen.
Nächste Schritte
Bestimmen Sie, wie die Lösung angepasst werden soll, indem Sie diese Punkte klären:
- Die zur Verfügung stehenden Datenquellen
- Die Standorte der einzelnen Datenquellen
- Welche Azure-Dienste Mitglieder nutzen können, um Quelldaten zu empfangen
- Welche Daten Mitglieder für das Konsortium freigeben können
- Wie Mitglieder Daten freigeben können: In Batches als Momentaufnahmen oder als Datenströme mit direkter Freigabe
- Welche Azure-Dienste das Konsortium nutzen kann, um freigegebene Daten zu empfangen
- Das Format der Daten von Mitgliedern und ob sie bereinigt oder umgewandelt werden müssen
- Welche Daten das Konsortium für Mitglieder freigeben kann
Produktdokumentation:
- Was ist die Microsoft Cloud für das Gesundheitswesen?
- Was ist Azure Data Share?
- Was ist Azure Synapse Analytics?
- Was ist Azure SQL-Datenbank?
- Einführung in Azure Data Lake Storage
- Was ist der Azure-Daten-Explorer?
- Was ist Azure Data Factory?
- Was ist Databricks?
- Was ist Microsoft Entra ID?
- Informationen zu Azure Key Vault
- Was ist Azure Pipelines?