Usare Microsoft Fabric per leggere i dati registrati nel catalogo unity
Questo articolo offre una panoramica di come usare Microsoft Fabric per leggere i dati registrati in Unity Catalog.
Panoramica dell'integrazione di Fabric con Unity Catalog
Azure Databricks usa Azure Data Lake Storage Gen2 per l'archiviazione aperta, accessibile e a basso costo. Unity Catalog gestisce e regola i dati in base ai criteri definiti dall'utente. Microsoft Fabric consente agli utenti di leggere alcune di queste tabelle registrate nel catalogo unity usando un collegamento ai file.
Per consentire agli utenti di leggere i dati registrati in Unity Catalog da Fabric, un amministratore del catalogo di Fabric crea collegamenti OneLake che puntano ai dati registrati in Unity Catalog. Nella funzionalità di condivisione dell'infrastruttura viene creato un handshake iniziale con le API aperte di Unity Catalog per distribuire le credenziali che consentono l'accesso ai percorsi di archiviazione sottostanti per le tabelle supportate. Quando l'handshake viene confermato, Fabric crea collegamenti OneLake ai dati archiviati in Azure Data Lake Storage Gen2. Le credenziali fornite dal catalogo unity sono di breve durata, aggiornate ogni ora e possono essere revocate usando Unity Catalog per negare l'accesso utente di Fabric.
Nota
Quando si usa Fabric per leggere i dati registrati in Unity Catalog, è importante comprendere quanto segue:
- Gli elementi del catalogo di Azure Databricks con mirroring in Fabric non replicano i dati. Le credenziali per accedere ai dati vengono recuperate su richiesta dai motori di Infrastruttura usando le API del catalogo unity. Databricks offre una piattaforma aperta basata sull'architettura lakehouse: le copie dei dati non sono necessarie o consigliate.
- I motori di infrastruttura eseguono l'autorizzazione con Unity Catalog usando credenziali di breve durata associate all'identità dell'utente che ha configurato la connessione, non all'utente che esegue query sui dati effettivi. I motori di infrastruttura non applicano la governance e i criteri di sicurezza del catalogo Unity agli utenti di Fabric. In altre parole, quando una tabella viene esposta in Fabric, nessun controllo di accesso regolamentato dal catalogo Unity su tale tabella si applica agli utenti di Fabric. Ciò può causare potenziali violazioni dei criteri di sicurezza delle informazioni aziendali.
Operazioni preliminari
Per accedere ai dati di Unity Catalog tramite Fabric, l'utente che configura la connessione a Databricks da Fabric deve avere l'autorizzazione per ottenere credenziali temporanee usando la distribuzione delle credenziali dell'API aperta di Unity Catalog.
Ciò richiede che l'utente che configura disponga dei EXTERNAL USE SCHEMA
privilegi per lo schema nel catalogo unity che contiene le tabelle a cui si accede da Fabric. Per istruzioni, vedere Controllare l'accesso esterno ai dati in Unity Catalog.
Nota
Una volta stabilita la connessione, non sono necessari utenti downstream Fabric che hanno accesso alla connessione per avere questo privilegio, ignorando in modo efficace la governance del catalogo Unity.
Limiti
L'uso di Fabric per leggere i dati registrati in Unity Catalog non supporta quanto segue:
- Criteri di sicurezza esistenti del catalogo Unity per gli utenti downstream in Fabric.
- Viste, viste materializzate e tabelle di streaming.
- Cataloghi di condivisione differenziale.
- Cataloghi di Lakehouse Federation.
- Tabelle con filtri a livello di riga o maschere di colonna abilitate.
- Tabelle che non usano Delta Lake come formato.
- Derivazione del catalogo Unity per le operazioni eseguite in Fabric.
- Aree di lavoro di Azure Databricks che usano endpoint privati o elenchi di accesso IP.
- Tabelle le cui risorse di Azure Data Lake Storage sottostanti si trova dietro un firewall.
L'uso di Fabric richiede anche una capacità di Infrastruttura in esecuzione per eseguire analisi e aggiornamenti dei metadati, che comporta costi aggiuntivi.
Nota
Queste limitazioni non si applicano quando si usa Power BI Direct Query con i dati registrati di Unity Catalog. Vedere Alternatives for accessing data registered in Unity Catalog (Alternatives for accessing data registered in Unity Catalog).
Come leggere i dati di Unity Catalog con Fabric
Per istruzioni complete, vedere la documentazione Microsoft sulla configurazione dei collegamenti di Fabric.
Alternative per l'accesso ai dati registrati in Unity Catalog
Azure Databricks usa Azure Data Lake Storage Gen2 per l'archiviazione aperta, accessibile e a basso costo. Per altre informazioni, vedere Procedure consigliate per l'archiviazione cloud con il catalogo unity. Se non si ha problemi con l'esposizione dei rischi e le limitazioni associate alla funzionalità di condivisione dell'infrastruttura, è consigliabile usare i percorsi seguenti per l'accesso ai dati registrati in Unity Catalog: