Facteurs à prendre en compte dans la gestion de votre lakehouse

Effectué

Il existe plusieurs facteurs à prendre en compte lors de la gestion de votre lakehouse, notamment la sécurisation de votre lakehouse et la gestion de l’intégration continue et livraison continue (CI/CD).

Sécuriser votre lakehouse

Sécurisez votre lakehouse en vous assurant que seuls les utilisateurs autorisés peuvent accéder aux données. Dans Fabric, vous pouvez le faire en définissant des autorisations au niveau de l’espace de travail ou de l’élément.

Les autorisations de l’espace de travail contrôlent l’accès à tous les éléments d’un espace de travail. Les autorisations au niveau de l’élément contrôlent l’accès à des éléments spécifiques au sein d’un espace de travail. Elles peuvent être utilisées lorsque vous collaborez avec des collègues qui ne se trouvent pas dans le même espace de travail ou qui n’ont besoin d’accéder qu’à un seul élément spécifique.

Vous pouvez stocker stratégiquement différentes couches de votre lakehouse dans des espaces de travail distincts pour une meilleure sécurité et une gestion efficace de la capacité. Cette approche améliore non seulement la sécurité, mais optimise également l’efficacité.

  • Considérations relatives à la sécurité et au contrôle : Définissez qui a besoin d’accéder à chaque couche, en veillant à ce que seul le personnel autorisé puisse interagir avec les données sensibles.
  • Contrôle d’accès à la couche Or : Restreignez l’accès à la couche Or à des fins de lecture seule, en mettant l’accent sur l’importance des autorisations minimales.
  • Utilisation de la couche Argent : Déterminez si les utilisateurs sont autorisés à générer sur la couche Argent, en équilibrant flexibilité et sécurité.
  • Contrôle d’accès à la couche Bronze : Restreignez l’accès à la couche Bronze à des fins de lecture seule, en mettant l’accent sur l’importance des autorisations minimales.

Le partage de contenu Fabric doit être discuté avec l’équipe de sécurité de votre organisation par souci de conformité aux stratégies de sécurité de votre organisation.

Considérations relatives à l’intégration continue et à la livraison continue (CI/CD)

La conception d’un processus d’intégration continue/déploiement continu (CI/CD) pour une architecture lakehouse nécessite de prendre en compte plusieurs facteurs afin de garantir un processus de déploiement fluide et efficace. Les facteurs incluent l’implémentation de contrôles de qualité des données, le contrôle de version, les déploiements automatisés, la surveillance et les mesures de sécurité. Les facteurs doivent également inclure la scalabilité, la récupération d’urgence, la collaboration, la conformité et l’amélioration continue pour garantir des déploiements de pipelines de données fiables et efficaces. Si certains de ces facteurs sont liés aux processus et aux pratiques, d’autres ont trait aux outils et technologies utilisés pour implémenter la CI/CD. Fabric fournit en mode natif plusieurs outils et technologies pour prendre en charge les processus CI/CD.

L’intégration de Git dans Microsoft Fabric vous permet d’intégrer les processus de développement, les outils et les meilleures pratiques directement dans la plateforme Fabric. L’intégration de Git dans Fabric permet aux équipes de données de sauvegarder et de mettre en version le travail, de revenir aux étapes précédentes en fonction des besoins, de collaborer avec d’autres personnes ou de travailler seul à l’aide de branches Git, et de tirer parti des fonctionnalités des outils de contrôle de code source courants pour gérer les éléments de Fabric.

Remarque

Consultez Présentation de l’intégration de Git pour en savoir plus sur l’intégration de Git dans Fabric.

La CI/CD est essentielle à la couche or d’un lakehouse, car elle garantit que des données de haute qualité, validées et fiables sont disponibles pour utilisation. Les processus automatisés permettent l’intégration continue de nouvelles données, des transformations de données et des mises à jour, ce qui réduit les erreurs manuelles et fournit des aperçus cohérents et à jour aux utilisateurs et aux applications en aval. Cela améliore la précision des données, accélère la prise de décisions et permet la prise en charge efficace d’initiatives axées sur les données.