Uso de Microsoft Fabric para leer datos registrados en el catálogo de Unity
En este artículo se proporciona información general sobre cómo usar Microsoft Fabric para leer datos registrados en el catálogo de Unity.
Introducción a la integración de Fabric con Unity Catalog
Azure Databricks usa Azure Data Lake Storage Gen2 para el almacenamiento abierto, accesible y de bajo costo. Unity Catalog administra y rige los datos basados en directivas definidas por el usuario. Microsoft Fabric permite a los usuarios leer algunas de estas tablas registradas en el catálogo de Unity mediante un acceso directo de archivo.
Para permitir que los usuarios lean los datos registrados en el catálogo de Unity desde Fabric, un administrador del catálogo de Fabric crea accesos directos de OneLake que apuntan a los datos registrados en el catálogo de Unity. En la característica Uso compartido de Fabric, un protocolo de enlace inicial se realiza con las API abiertas de Unity Catalog para vender credenciales que proporcionan acceso a las rutas de acceso de almacenamiento subyacentes para las tablas admitidas. Cuando se confirma el protocolo de enlace, Fabric crea accesos directos de OneLake a los datos almacenados en Azure Data Lake Storage Gen2. Las credenciales proporcionadas por el catálogo de Unity son de corta duración, se actualizan cada hora y se pueden revocar mediante el catálogo de Unity para denegar el acceso de usuario de Fabric.
Nota:
Al usar Fabric para leer datos registrados en el catálogo de Unity, es importante comprender lo siguiente:
- Los elementos "Catálogo de Azure Databricks reflejados" en Fabric no replican datos. Las credenciales para acceder a los datos se capturan a petición de los motores de Fabric mediante las API de Catálogo de Unity. Databricks proporciona una plataforma abierta basada en la arquitectura de lakehouse: no se requieren ni se aconsejan copias de datos.
- Los motores de Fabric realizan la autorización con el catálogo de Unity mediante credenciales de corta duración vinculadas a la identidad del usuario que configuró la conexión, no al usuario que está consultando los datos reales. Los motores de Fabric no aplican directivas de seguridad y gobernanza del catálogo de Unity a los usuarios de Fabric. En otras palabras, cuando se expone una tabla en Fabric, no se aplican controles de acceso regulados por el catálogo de Unity en esa tabla a los usuarios de Fabric. Esto puede provocar posibles infracciones de las directivas de seguridad de la información corporativa.
Antes de empezar
Para acceder a los datos del catálogo de Unity mediante Fabric, el usuario que configura la conexión a Databricks desde Fabric debe tener permiso para obtener credenciales temporales mediante la vending de credenciales de API abiertas de Unity Catalog.
Esto requiere que el usuario de configuración tenga el EXTERNAL USE SCHEMA
privilegio en el esquema del catálogo de Unity que contiene las tablas a las que se tendrá acceso desde Fabric. Para obtener instrucciones, consulte Control del acceso externo a los datos en el catálogo de Unity.
Nota:
Una vez realizada la conexión, no es necesario que los usuarios de Fabric de nivel inferior que tengan acceso a la conexión tengan este privilegio, omitiendo eficazmente la gobernanza del catálogo de Unity.
Limitaciones
El uso de Fabric para leer datos registrados en el catálogo de Unity no admite lo siguiente:
- Directivas de seguridad de Catálogo de Unity existentes en usuarios de nivel inferior en Fabric.
- Vistas, vistas materializadas y tablas de streaming.
- Catálogos delta Sharing.
- Catálogos de federación de Lakehouse.
- Tablas con filtros de nivel de fila o máscaras de columna habilitadas.
- Tablas que no usan Delta Lake como formato.
- Linaje del catálogo de Unity para las operaciones realizadas en Fabric.
- Áreas de trabajo de Azure Databricks que usan puntos de conexión privados o listas de acceso IP.
- Tablas cuya instancia subyacente de Azure Data Lake Storage está detrás de un firewall.
El uso de Fabric también requiere una capacidad de Fabric en ejecución para realizar exámenes y actualizaciones de metadatos, lo que supone un costo adicional.
Nota:
Estas limitaciones no se aplican cuando se usa Power BI Direct Query con datos registrados del catálogo de Unity. Consulte Alternativas para acceder a los datos registrados en el catálogo de Unity.
Cómo leer datos del catálogo de Unity mediante Fabric
Para obtener instrucciones completas, consulte la documentación de Microsoft sobre la configuración de accesos directos de Fabric.
Alternativas para acceder a los datos registrados en el catálogo de Unity
Azure Databricks usa Azure Data Lake Storage Gen2 para el almacenamiento abierto, accesible y de bajo costo. Obtenga más información en Procedimientos recomendados para el almacenamiento en la nube con el catálogo de Unity. Si se siente incómodo con la exposición al riesgo y las limitaciones asociadas a la característica uso compartido de Fabric, se recomiendan las siguientes rutas de acceso para acceder a los datos registrados en el Catálogo de Unity: