Partager via


Présentation de la stratégie de paysage de données

L’intégration des données de soins de santé et des sciences de la vie de divers systèmes et applications a été une tâche coûteuse et qui nécessite beaucoup de temps. Pour résoudre ce problème, la mise en œuvre d’une stratégie de paysage de données devient cruciale, car elle établit des normes uniformes permettant aux organisations de gérer efficacement toutes leurs données, quel que soit leur emplacement ou format de stockage.

La stratégie de paysage de données fait référence à une approche globale et structurée adoptée par les organisations pour gérer efficacement l’ensemble de leur écosystème de données. Elle consiste à élaborer un plan bien défini et un ensemble de lignes directrices pour acquérir, stocker, traiter, sécuriser et utiliser des données dans diverses sources, systèmes et applications au sein d’une organisation. Dans la mesure où les établissements de soins de santé et des sciences de la vie traitent un large éventail de données, notamment les données cliniques, les données d’imagerie, les données opérationnelles et de recherche, une gestion efficace des données devient cruciale pour maintenir la confidentialité, la conformité réglementaire et acquérir un avantage concurrentiel, ainsi que pour fournir des soins efficaces aux patients.

Note

Microsoft Fabric est une solution d’analyse tout-en-un pour les entreprises qui couvre tout, du déplacement des données à la science des données, en passant par l’analyse en temps réel et l’informatique décisionnelle. Elle offre une suite complète de services, notamment le lac de données, l’ingénierie des données et l’intégration des données, le tout dans un seul emplacement. Les solutions de données de santé Microsoft Fabric permettent aux organismes de santé de briser les silos de données et d’harmoniser leurs données de santé disparates dans un magasin unifié unique où les charges de travail d’analyse et d’IA peuvent fonctionner à grande échelle. En tirant parti des capacités natives de la plateforme, les organismes de santé peuvent créer des expériences connectées à chaque point de soins, responsabiliser leur personnel et tirer de la valeur des données cliniques et opérationnelles. Les solutions de données de soins de santé dans Microsoft Fabric sont actuellement en version préliminaire et cette documentation « Well-Architected » sera mise à jour dans une prochaine version pour inclure les solutions de données de soins de santé dans Microsoft Fabric.

Gestion des données dans les soins de santé et les sciences de la vie

À mesure que le secteur des soins de santé évolue vers un modèle de soins basé sur des valeurs en mettant l’accent sur les soins centrés sur le patient, le volume de données sur les patients générées via des expériences immersives a considérablement augmenté. La croissance exponentielle des données de soins de santé à différents points de contact nécessite une stratégie de gestion des données robuste pour gérer et utiliser efficacement ces données afin de générer des informations exploitables susceptibles d’améliorer la santé globale des membres et des patients.

Défis de la gestion des données

Les secteurs des soins de santé et des sciences de la vie sont des environnements complexes et dynamiques qui nécessitent un degré élevé d’intégration et d’interopérabilité pour fonctionner efficacement. L’un des principaux défis de ce secteur est qu’il est traditionnellement cloisonné, avec différents fournisseurs et organisations qui utilisent différents systèmes et technologies. L’absence d’intégration et d’interopérabilité entre ces systèmes et technologies a conduit à des inefficacités, des erreurs et un manque de continuité dans les soins aux patients. Vous trouverez ci-dessous quelques défis courants en matière de gestion des données :

  • Silos de données : le manque de partage de données entre les différents systèmes conduit à des silos de données. Les fournisseurs de soins de santé ont des difficultés à accéder aux données des patients et à les partager, ce qui peut entraîner un manque de continuité des soins.
  • Manque de standardisation : les organisations de soins de santé et les entreprises des sciences de la vie utilisent différents systèmes et technologies, ce qui rend difficile la communication et l’échange de données.
  • Complexité des systèmes : les systèmes de soins de santé et des sciences de la vie sont de plus en plus complexes et représentent un défi pour intégrer et interopérer efficacement les données, ce qui entraîne une augmentation des coûts et des retards dans la fourniture des soins.
  • Données incorrectes ou manquantes : les données incorrectes ou manquantes compromettent l’exactitude et la fiabilité des informations dérivées de ces données.
  • Problèmes de sécurité et de confidentialité : la sécurité et la confidentialité des données des patients sont essentielles pour les fournisseurs de soins de santé et les entreprises des sciences de la vie. Le partage de données entre différents systèmes peut augmenter le risque de violations de données et compromettre la vie privée des patients.
  • Réglementations du secteur : les secteurs des soins de santé et des sciences de la vie sont soumis aux réglementations les plus strictes en matière de traitement des données, ce qui rend difficile le partage et l’accès aux données.
  • Désidentification des données non uniformes : la désidentification des données est souvent requise par la loi, ce qui est difficile et nécessite beaucoup de temps.
  • Ensembles de données géographiquement uniques : il est difficile de transformer des ensembles de données géographiquement uniques pour la recherche (par exemple, des données sur la santé de la population).

Étapes de gestion des données

La gestion efficace de données volumineuses comporte différentes étapes et chaque étape est tout aussi importante pour générer des informations exploitables de haute qualité à l’aide des données sous-jacentes.

Les principales étapes sont les suivantes :

Découverte

La découverte de données dans le contexte des soins de santé et des sciences de la vie fait référence au processus d’identification des sources de données, du format de données tel que les données structurées et non structurées, et d’accès. Les données du monde réel et les preuves du monde réel sont quelques façons de découvrir des données. Les données du monde réel font référence aux données qui sont régulièrement collectées à partir de diverses sources en dehors des essais cliniques traditionnels, comme les dossiers médicaux électroniques, les réclamations et les activités de facturation, les données de prescription, les données des appareils portables et les données collectées via des enquêtes auprès des patients ou d’autres méthodes générées par les patients. L’image suivante illustre les données de soins de santé les plus courantes en fonction de leur taxonomie et des normes de données.

Un diagramme montrant la découverte du paysage de données pour la santé.

Ingestion

L’ingestion est le processus de connexion, de collecte et de contrôle du flux d’informations de diverses sources identifiées dans la phase de découverte. Les images suivantes illustrent les différentes options telles que Azure Functions, Logic Apps, Azure Data Factory, etc., fournies par Microsoft pour ingérer divers types d’informations.

  1. L’image suivante montre un pipeline d’ingestion pour ingérer les données IoT d’appareils médicaux tels que des appareils portables intelligents.

Un diagramme montrant un pipeline d’ingestion pour ingérer les données IoT d’appareils médicaux tels que des appareils portables intelligents.

  1. L’image suivante illustre l’idée selon laquelle les données générées par les appareils médicaux peuvent ne pas être au format standard. Par conséquent, elles sont d’abord normalisées, puis stockées sur un serveur FHIR en tant que ressource d’observation FHIR. Les étapes présentées dans le diagramme sont automatiquement effectuées par le service MedTech dans les Services de données de santé Azure.

Un diagramme montrant la normalisation des données de MedTech.

  1. L’image suivante illustre le pipeline d’ingestion à utiliser avec les données cliniques, les données DICOM, les données non structurées et SDoH.

Un diagramme illustre le pipeline d’ingestion à utiliser avec les données cliniques, les données DICOM, les données non structurées et SDoH

Persistance

Il est très important de stocker les données ingérées dans un stockage permanent. Cela permet à d’autres applications, telles que le pipeline Machine Learning, d’utiliser et de générer des informations sur les données, ainsi qu’à Power BI de visualiser la distribution des données. Microsoft fournit diverses plateformes de persistance, telles qu’Azure Data Lake Storage, les Services de données de santé Azure et Microsoft Dataverse, pour stocker vos données de soins de santé. Microsoft fournit également des API telles que l’API du service FHIR, le service DICOM, le service MedTech, les Dataverse Healthcare APIs pour extraire les données dans la plateforme fournie.

Un diagramme montrant les actions CRUD.

Un diagramme montrant la persistence du paysage de données pour la santé.

Intégration

L’intégration fait référence au processus consistant à rassembler différents systèmes, technologies, sources de données et processus pour créer une expérience cohérente pour les patients, les fournisseurs de soins de santé et les autres parties prenantes. Microsoft Cloud for Healthcare offre des outils prêts à l’emploi pour intégrer le référentiel de données Dataverse à diverses sources de données de soins de santé telles que les Services de données de santé Azure, les serveurs FHIR non Microsoft, etc. L’image suivante illustre l’intégration des données FHIR à Azure Databricks Delta Lake dans les Services de données de santé Azure. Pour plus d’informations, consultez Connexion des données FHIR à Azure Databricks Delta Lake dans les Services de données de santé Azure

Un diagramme montrant l’intégration du lakehouse

Intelligence

L’intelligence fait référence au processus consistant à ajouter l’intelligence à nos données pour obtenir des informations plus approfondies. Microsoft fournit des outils comme Azure Machine Learning, les services cognitifs, Azure Databricks, Azure Synapse Analytics, etc., pour ajouter l’intelligence aux données de soins de santé.

Analyse

L’analyse consiste à analyser les données de soins de santé pour découvrir des tendances et des modèles. Des outils tels que Power BI peuvent être utilisés pour visualiser les tendances et les modèles dans les données de soins de santé afin d’améliorer l’aide à la décision clinique et également d’accroître l’efficacité opérationnelle.

L’image ci-dessous montre le cycle de vie complet des données de santé :

Un diagramme montrant le cycle de vie complet des données de santé

L’image ci-dessous illustre le cycle de vie complet des données de MedTech :

Un diagramme montrant le cycle de vie complet de MedTech du paysage de données

Solutions de gestion des données offertes par Microsoft

Microsoft offre un large éventail d’outils pour traiter et gérer les données de soins de santé. Le tableau suivant fournit une liste complète des outils pouvant être utilisés pour gérer les données de soins de santé. Vous pouvez suivre le lien de référence correspondant à chaque outil pour obtenir plus d’informations.

Étape de données Outils Description Avantages Lien de référence
Ingestion FHIR-Bulk Loader et Export Une solution d’application Azure Function qui fournit des services d’ingestion et d’exportation de données FHIR. FHIR-Bulk Loader peut importer des centaines de milliers de fichiers par heure. microsoft/fhir-loader : chargeur de données FHIR en bloc
Ingestion Convertisseur FHIR Permet de convertir les données de soins de santé des formats hérités en norme FHIR Prend en charge la conversion suivante : 1. HL7v2 à FHIR 2. C-CDA à FHIR 3. JSON à FHIR 4. FHIR STU3 à FHIR R4 microsoft/FHIR-Converter : utilitaire de conversion pour traduire les formats de données hérités en FHIR
Ingestion Healthkit-on-FHIR HealthKitOnFhir est une bibliothèque Swift qui automatise l’exportation des données Apple HealthKit vers un serveur FHIR®. Les données HealthKit peuvent être acheminées via le Connecteur IoMT FHIR pour Azure pour regrouper les données à haute fréquence et réduire le nombre de ressources d’observation générées. Les données HealthKit peuvent également être exportées directement vers un serveur FHIR (approprié pour les données à basse fréquence). microsoft/healthkit-on-fhir : HealthKitOnFhir est une bibliothèque Swift qui automatise l’exportation des données Apple HealthKit vers un serveur FHIR
Persistance Modèle de données Microsoft Cloud for Healthcare Les modèles de données dans Microsoft Cloud for Healthcare sont basés sur le cadre de normes Fast Healthcare Interoperability Resources (FHIR) qui sont facilement déployables dans un environnement Dataverse. Il facilite la mise en œuvre de nouveaux cas d’utilisation et flux de travail sans redéfinir l’architecture des données de soins de santé. Les modèles basés sur FHIR rendent les implémentations de Dynamics 365 pour les clients du secteur de la santé plus faciles, plus rapides et plus sécurisées. Vue d’ensemble du modèle de données
Persistance Dataverse Healthcare APIs Prend en charge l’écriture de données FHIR dans les entités Dataverse et la lecture de données à partir d’entités Dataverse au format FHIR. La transformation des données FHIR en Common Data Model et inversement est automatiquement gérée par Vue d’ensemble des Dataverse Healthcare API
Persistance Services de données de santé Azure Il s’agit d’une plateforme PaaS (Platform as a service) gérée qui fournit une plateforme unifiée pour stocker les données FHIR, DICOM et MedTech. Elle fournit des chemins d’accès plus sécurisés et conformes pour ingérer, conserver et connecter les données de santé dans le cloud. Prise en main des Services de données de santé Azure
Intégration Boîte à outils d’intégration des données Elle fournit une vaste collection de mappages d’entités et de mappages d’attributs par défaut créés en conformité avec la spécification HL7 FHIR qui sont déployés en tant qu’enregistrements Dataverse. Elle est hautement configurable pour répondre à diverses exigences de la solution. Présentation de la boîte à outils d’intégration des données - Microsoft Cloud for Healthcare
Intégration Tables de données de santé virtuelles Prend en charge le transfert de données directement du serveur FHIR vers la solution Microsoft Cloud for Healthcare sans stocker définitivement les données dans les entités Dataverse. Évite la duplication des données et réduit le coût de stockage. Vue d’ensemble des tables de données de santé virtuelles
Intelligence Text Analytics for Health Il s’agit d’une fonctionnalité prédéfinie offerte par Azure AI Language. Il s’agit d’un service d’API basé sur le cloud qui applique l’intelligence Machine Learning pour extraire et étiqueter des informations médicales pertinentes à partir d’une variété de textes non structurés, comme les notes du médecin, les résumés de sortie, les documents cliniques et les dossiers médicaux électroniques. Text Analytics for Health exécute quatre fonctions clés appelées reconnaissance d’entités, extraction de relations, liaison d’entités et détection d’assertions, le tout avec un seul appel d’API. En quoi consiste Text Analytics for Health dans Azure AI Language ? - Services Azure AI
Persistance et analyse Modèles de base de données de soins de santé Les modèles de base de données dans Azure Synapse sont des définitions de schéma spécifiques au secteur qui fournissent une méthode rapide de création d’une base de données appelée base de données du lac, qui peut accélérer la création d’applications sectorielles suggérées par l’analyse. Vous pouvez utiliser ces plans d’information pour planifier, structurer et concevoir des solutions de données pour la gouvernance des données, la création de rapports, l’informatique décisionnelle et l’analyse avancée. Utiliser les modèles de base de données de soins de santé avec Microsoft Cloud for Healthcare
Analyse Analyse du service FHIR avec Azure Databricks Delta Lake Analytics Data Lakehouse est une architecture de données ouverte qui combine les fonctionnalités existantes des lacs de données et des entrepôts de données traditionnels. Delta Lake s’est imposé comme le principal framework de stockage qui permet de créer une architecture Lakehouse en plus des technologies de lac de données existantes. Les Services de données de santé Azure activent les architectures Lakehouse en exportant des fichiers Parquet de données FHIR qui s’alignent sur la norme SQL sur FHIR ouverte.  La création d’un Lakehouse pour les données FHIR présente les avantages suivants : 1. Combiner vos données FHIR avec d’autres ensembles de données. 2. Disposer d’un emplacement cohérent de données prêtes pour l’entreprise qui permet un meilleur libre-service dans toute votre organisation. 3. Gestion des métadonnées et contrôle de version des données, ce qui simplifie les données souvent mises à jour. healthcare-apis-samples/src/azuredatabricks-deltalake at main · microsoft/healthcare-apis-samples
Tests Synthea Synthea est un générateur de patients synthétiques qui modélise les antécédents médicaux des patients synthétiques. Il produit des données synthétiques de haute qualité, réalistes mais non réelles sur les patients, ainsi que des dossiers médicaux associés couvrant tous les aspects des soins de santé. Les données obtenues sont exemptes de restrictions en matière de coût, de confidentialité et de sécurité. Elles peuvent être utilisées sans restriction pour diverses utilisations secondaires dans les universités, la recherche, l’industrie et le gouvernement. synthetichealth/synthea Wiki

Voir aussi

Certaines architectures sont couramment utilisées pour utiliser les données de soins de santé sur la plateforme Microsoft Cloud for Healthcare. Celles-ci peuvent servir de référence pour personnaliser vos solutions exactes nécessaires pour traiter et gérer les données de soins de santé. Pour plus d’informations, consultez Architectures de référence de Microsoft Cloud for Healthcare.

En savoir plus sur Microsoft Fabric avec un scénario de bout en bout :

Étapes suivantes