Utiliser Microsoft Fabric pour lire les données inscrites dans le catalogue Unity
Cet article donne une vue d’ensemble de l’utilisation de Microsoft Fabric pour lire des données inscrites dans le catalogue Unity.
Vue d’ensemble de l’intégration de Fabric à Unity Catalog
Azure Databricks utilise Azure Data Lake Storage Gen2 pour le stockage ouvert, accessible et à faible coût. Unity Catalog gère et régit ces données en fonction des stratégies définies par l’utilisateur. Microsoft Fabric permet aux utilisateurs de lire certaines de ces tables inscrites dans le catalogue Unity à l’aide d’un raccourci de fichier.
Pour permettre aux utilisateurs de lire les données inscrites dans le catalogue Unity à partir de Fabric, un administrateur de catalogue Fabric crée des raccourcis OneLake qui pointent vers les données inscrites dans le catalogue Unity. Dans la fonctionnalité de partage Fabric, une négociation initiale est établie avec les API ouvertes du catalogue Unity pour vendre les informations d’identification qui donnent accès aux chemins de stockage sous-jacents pour les tables prises en charge. Lorsque l’établissement d’une liaison est confirmé, Fabric crée des raccourcis OneLake vers les données stockées dans Azure Data Lake Storage Gen2. Les informations d’identification fournies par le catalogue Unity sont de courte durée, actualisées toutes les heures et peuvent être révoquées à l’aide du catalogue Unity pour refuser l’accès utilisateur fabric.
Remarque
Lorsque vous utilisez Fabric pour lire les données inscrites dans le catalogue Unity, il est important de comprendre les éléments suivants :
- Les éléments « Catalogue Azure Databricks » mis en miroir dans Fabric ne répliquent pas les données. Les informations d’identification permettant d’accéder aux données sont extraites à la demande à partir de moteurs Fabric à l’aide des API du catalogue Unity. Databricks fournit une plateforme ouverte basée sur l’architecture lakehouse : les copies de données ne sont pas requises ou conseillées.
- Les moteurs de structure effectuent une autorisation avec le catalogue Unity à l’aide d’informations d’identification de courte durée liées à l’identité de l’utilisateur qui a configuré la connexion, et non à l’utilisateur qui interroge les données réelles. Les moteurs de structure n’appliquent pas les stratégies de gouvernance et de sécurité du catalogue Unity aux utilisateurs de Fabric. En d’autres termes, lorsqu’une table est exposée dans Fabric, aucun contrôle d’accès régi par le catalogue Unity sur cette table ne s’applique aux utilisateurs de Fabric. Cela peut entraîner des violations potentielles des stratégies de sécurité des informations d’entreprise.
Avant de commencer
Pour accéder aux données du catalogue Unity à l’aide de Fabric, l’utilisateur qui configure la connexion à Databricks à partir de Fabric doit avoir l’autorisation d’obtenir des informations d’identification temporaires à l’aide de la distribution des informations d’identification d’API ouvertes du catalogue Unity.
Cela nécessite que l’utilisateur de configuration dispose du EXTERNAL USE SCHEMA
privilège sur le schéma dans le catalogue Unity qui contient les tables accessibles à partir de Fabric. Pour obtenir des instructions, consultez Contrôler l’accès externe aux données dans Unity Catalog.
Remarque
Une fois la connexion établie, aucun utilisateur fabric en aval qui a accès à la connexion n’est requis pour disposer de ce privilège, contournant efficacement la gouvernance du catalogue Unity.
Limites
L’utilisation de Fabric pour lire les données inscrites dans le catalogue Unity ne prend pas en charge les éléments suivants :
- Stratégies de sécurité du catalogue Unity existantes sur les utilisateurs en aval dans Fabric.
- Vues, vues matérialisées et tables de diffusion en continu.
- Catalogues de partage delta.
- Catalogues de fédération Lakehouse.
- Tables avec des filtres au niveau des lignes ou des masques de colonne activés.
- Tables qui n’utilisent pas Delta Lake comme format.
- Traçabilité du catalogue Unity pour les opérations effectuées dans Fabric.
- Espaces de travail Azure Databricks qui utilisent des points de terminaison privés ou des listes d’accès IP.
- Tables dont azure Data Lake Storage sous-jacent se trouve derrière un pare-feu.
L’utilisation de Fabric nécessite également une capacité d’infrastructure en cours d’exécution pour effectuer des analyses de métadonnées et des actualisations, ce qui entraîne des coûts supplémentaires.
Remarque
Ces limitations ne s’appliquent pas lorsque vous utilisez Power BI Direct Query avec des données inscrites dans le catalogue Unity. Consultez alternatives pour accéder aux données inscrites dans le catalogue Unity.
Guide pratique pour lire des données de catalogue Unity à l’aide de Fabric
Pour obtenir des instructions complètes, consultez la documentation Microsoft sur la configuration des raccourcis Fabric.
Alternatives pour accéder aux données inscrites dans le catalogue Unity
Azure Databricks utilise Azure Data Lake Storage Gen2 pour le stockage ouvert, accessible et à faible coût. En savoir plus sur les meilleures pratiques pour le stockage cloud avec le catalogue Unity. Si vous n’êtes pas à l’aise avec l’exposition aux risques et les limitations associées à la fonctionnalité de partage Fabric, nous vous recommandons les chemins d’accès suivants pour accéder aux données inscrites dans le catalogue Unity :