Pipelines de déploiement et intégration Git du Lakehouse (préversion)
Le Lakehouse s’intègre aux fonctionnalités de gestion du cycle de vie dans Microsoft Fabric, ce qui permet une collaboration standardisée entre tous les membres de l’équipe de développement tout au long de la vie du produit. La gestion du cycle de vie facilite et améliore le processus de mise en production et de gestion des versions du produit en fournissant en continu des fonctionnalités et des correctifs de bogues dans divers environnements. Pour en savoir plus, consultez Qu’est-ce que la gestion du cycle de vie dans Microsoft Fabric ?.
Important
Cette fonctionnalité est en préversion.
Intégration Git du Lakehouse
Le Lakehouse est un élément qui contient des métadonnées et des données référencées dans plusieurs objets de l’espace de travail. Le Lakehouse contient des tables, des dossiers et des raccourcis qui peuvent être gérés en tant qu’éléments de conteneur de données principaux. Dans le cadre d’un workflow de développement, les objets dépendants suivants peuvent référencer un Lakehouse :
- flux de données et pipelines de données
- Définitions de travaux Spark
- Blocs-notes
- Modèles sémantiques et Power BI
Les métadonnées des modèles sémantiques par défaut et des points de terminaison d’analytique SQL sont connectées à un Lakehouse et sont managées par le processus de mise à jour Git par défaut. Le principe est que les données ne sont pas suivies dans Git ; seules les métadonnées sont suivies.
Représentation Git
Les informations de lakehouse suivantes sont sérialisées et suivies dans un espace de travail connecté à Git :
- Nom d’affichage
- Description
- Guid logique
Remarque
L’identifiant logique suivi est un identifiant inter-espace de travail généré automatiquement qui représente un élément et sa représentation de contrôle de code source.
Important
Seul l’artefact de conteneur Lakehouse est suivi dans Git dans l’expérience actuelle. Les tables, dossiers, raccourcis et autres modifications des métadonnées ne sont ni suivis ni versionnés dans Git.
Fonctionnalités d’intégration Git du Lakehouse
Les fonctionnalités suivantes sont disponibles :
- Sérialisation des métadonnées d’objet Lakehouse vers une représentation JSON dans Git.
- Appliquez les modifications directement ou utilisez une demande de tirage (pull request) pour contrôler les modifications apportées aux espaces de travail et branches en amont ou en aval.
- Le renommage des lakehouses fait l’objet d’un suivi dans Git. La mise à jour d’un lakehouse renommé entraîne également le renommage du modèle de données sémantique par défaut et du point de terminaison SQL Analytics.
- Aucune action n’est appliquée aux tables, dossiers, raccourcis et métadonnées, et les données de ces éléments sont toujours conservées.
Lakehouse dans les pipelines de déploiement
Le Lakehouse est pris en charge dans les pipelines de déploiement de la gestion du cycle de vie de Microsoft Fabric. Il applique les bonnes pratiques de segmentation de l’environnement.
Fonctionnalités d’intégration des pipelines de déploiement du Lakehouse :
Déploiement dans des espaces de travail de développement, de test et de production.
Lakehouse peut être supprimé comme objet dépendant lors du déploiement. Le mappage de différents lakehouses dans le contexte des pipelines de déploiement est également pris en charge.
Si rien n’est spécifié lors de la configuration du pipeline de déploiement, un objet Lakehouse vide portant le même nom est créé dans l’espace de travail cible. Les notebooks et les définitions de travaux Spark sont remappés pour référencer le nouvel objet Lakehouse dans le nouvel espace de travail.
Si la dépendance du Lakehouse est configurée pour référencer un autre Lakehouse durant le processus de configuration des pipelines de déploiement, tel que le Lakehouse en amont, un objet Lakehouse vide portant le même nom est toujours créé dans l’espace de travail cible, mais les références aux notebooks et aux définitions de travaux Spark sont conservées dans un autre Lakehouse comme demandé.
Les points de terminaison SQL Analytics et les modèles sémantiques sont provisionnés dans le cadre du déploiement du Lakehouse.
Aucun objet contenu dans le Lakehouse n’est remplacé.
Les renommages du Lakehouse peuvent être synchronisés entre tous les espaces de travail dans un contexte de pipeline de déploiement.