Déployez des Sources des données de santé dans les solutions de données de santé
Les Sources des données de santé offrent des pipelines de données prêts à l’emploi, conçus pour structurer efficacement les données à des fins d’analyse et de modélisation IA/Machine Learning. Déployer cette fonctionnalité avant de déployer toute autre fonctionnalité dans les solutions de données de santé.
Deployer Sources des données de santé
La fonctionnalité Sources des données de santé se déploie automatiquement via l’Assistant Configurer votre solution sur la page d’accueil des solutions de données de santé. Le déploiement de cette fonctionnalité est une étape obligatoire après le déploiement de votre environnement de solutions de données de santé. Pour les instructions détaillées, consultez Déployer les sources des données de santé.
Après le déploiement, vous pouvez trouver la fonctionnalité répertoriée sur la page d’accueil des solutions de données de santé sous Préparation des données. Sélectionnez la capacité pour explorer les artefacts déployés.
Artefacts
Le tableau suivant répertorie les détails de l’environnement Fabric, du pipeline de données et des notebooks déployés par la fonctionnalité Sources des données de santé. Pour en savoir plus sur les lakehouses déployées, consultez la section Conception de la lakehouse Medallion.
Avertissement
Les artefacts suivants se déploient avec les valeurs préconfigurées requises pour les solutions de données de santé dans Microsoft Fabric. Assurez-vous de ne modifier aucune des valeurs de configuration de ces artefacts.
Artefact | Type | Description |
---|---|---|
healthcare#_environment | Environnement Fabric | Préconfigure la version d’exécution Fabric requise (Runtime 1.2 (Apache Spark 3.4 et Delta Lake 2.4)) et fournit les autres bibliothèques publiques et personnalisées requises par les solutions de données de santé dans Microsoft Fabric. |
healthcare#_msft_config_notebook | Bloc-notes | Aide à lire et à remplir les valeurs de configuration globale à partir du lakehouse d’administration. Les paramètres de ce bloc-notes sont préconfigurés pendant le processus de déploiement. |
healthcare#_msft_bronze_silver_flatten | Bloc-notes | Permet d'aplatir le jeu de données de santé dans la table ClinicalFhir de la maison du lac de bronze et la table de ressource FHIR respectives et autres tables dans le modèle de données de santé de la maison du lac d’argent. Seuls les champs de niveau primaire s’aplatissent dans la maison du lac d’argent. Les structures hiérarchiques imbriquées ou plus profondes dans les données conservent leur structure d’origine. Remarque : vous ne devez pas avoir plus d’une instance de ce bloc-notes en cours d’exécution, car cela entraîne des résultats incohérents. |
healthcare#_msft_fhir_flattening_sample | Bloc-notes | Les extensions FHIR sont des éléments enfants qui représentent plus d’informations sur un élément d’une ressource FHIR. Actuellement, ces extensions sont prises en charge en tant que chaînes dans le modèle de données de santé dans la Silver Lakehouse. Ce notebook fournit des exemples sur la façon d’accéder à ces données d’extension et de les utiliser dans un dataframe. |
healthcare#_msft_fhir_ndjson_bronze_ingestion | Bloc-notes | Facilite l’ingestion des données FHIR NDSJON dans les tables delta au sein de la maison du lac en bronze. Remarque : vous ne devez pas avoir plus d’une instance de ce bloc-notes en cours d’exécution, car cela entraîne des résultats incohérents. |
healthcare#_msft_raw_process_movement | Bloc-notes | Utilise la bibliothèque de solutions de données de santé pour extraire les fichiers ZIP et les organiser pour plusieurs modalités, qui contiennent divers espaces de noms et extensions de fichier. Le bloc-notes déplace les fichiers en fonction de la configuration fileOrchestrationConfig.json, qui contient des détails de mappage tels que la modalité, modality_format et l’extension . Il ajoute un préfixe d’horodatage aux noms de fichiers d’origine pour garantir l’unicité des fichiers sur plusieurs systèmes sources. |
healthcare#_msft_clinical_data_foundation_ingestion | Pipeline de données | Orchestre l’exécution du bloc-notes/des activités nécessaires à l’ingestion de bout en bout des données cliniques, de la structure de dossiers unifiée dans la salle du lac de bronze au modèle de données de santé dans la maison du lac d’argent. |
Références
- Comment utiliser les blocs-notes Microsoft Fabric
- Qu’est-ce qu’un lakehouse dans Microsoft Fabric ?
- Ingérer des données dans votre entrepôt à l’aide de pipelines de données
- Créer, configurer et utiliser un environnement dans Microsoft Fabric