Accedere ai dati condivisi con l'utente usando la condivisione Delta (per i destinatari)
Questo articolo illustra come accedere ai dati condivisi con l'utente usando la condivisione Delta.
Condivisione differenziale e destinatari dei dati
La condivisione differenziale è uno standard aperto per la condivisione sicura dei dati. Un utente di Databricks, definito provider di dati in questo contesto, può usare la condivisione delta in Azure Databricks per condividere dati con una persona o un gruppo esterno all'organizzazione, denominato destinatario dati.
Condivisione e condivisione aperta da Databricks a Databricks
Il modo in cui si accede ai dati dipende dal fatto che si sia un utente di Databricks e che il provider di dati abbia configurato o meno i dati condivisi con l'utente per la condivisione da Databricks a Databricks o la condivisione aperta.
Nel modello Da Databricks a Databricks è necessario essere un utente in un'area di lavoro di Databricks abilitata per Unity Catalog. Un membro del team fornisce al provider di dati un identificatore univoco per il metastore di Unity Catalog e il provider di dati usa tale provider per creare una connessione di condivisione sicura. I dati condivisi diventano disponibili per l'accesso nell'area di lavoro. Se necessario, un membro del team configura il controllo di accesso granulare su tali dati.
Nel modello di condivisione aperta è possibile usare qualsiasi strumento desiderato (incluso Databricks) per accedere ai dati condivisi. Il provider di dati invia un URL di attivazione tramite un canale sicuro. Seguire questa procedura per scaricare un file di credenziali che consente di accedere ai dati condivisi con l'utente.
I dati condivisi non vengono forniti direttamente da Databricks, ma dai provider di dati in esecuzione in Azure Databricks.
Nota
Databricks può raccogliere informazioni sull'uso e l'accesso dei destinatari dei dati ai dati condivisi (inclusa l'identificazione di qualsiasi persona o azienda che accede ai dati usando il file di credenziali in relazione a tali informazioni) e può condividerla con il provider di dati applicabile.
Ottenere l'accesso ai dati condivisi con l'utente
Il modo in cui si accede ai dati dipende dal fatto che il provider di dati abbia condiviso i dati usando il protocollo di condivisione aperto o il protocollo di condivisione Da Databricks a Databricks. Vedere Condivisione da Databricks a Databricks e condivisione aperta.
Ottenere l'accesso nel modello da Databricks a Databricks
Nel modello Da Databricks a Databricks:
Il provider di dati invia istruzioni per trovare un identificatore univoco per il metastore di Unity Catalog associato all'area di lavoro di Databricks e inviarlo a tali metastore.
L'identificatore di condivisione è una stringa costituita dal cloud, dall'area e dall'UUID del metastore (identificatore univoco per il metastore), nel formato
<cloud>:<region>:<uuid>
. Ad esempio:aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
.Per ottenere l'identificatore di condivisione tramite Esplora cataloghi:
Nell'area di lavoro di Azure Databricks fare clic su Catalogo.
Nella parte superiore del riquadro Catalogo fare clic sull'icona forma di ingranaggio e selezionare condivisione delta.
In alternativa, nella pagina Accesso rapido fare clic sul pulsante condivisione delta >.
- Nella scheda Condivisi con l'utente corrente fare clic sul nome dell'organizzazione di condivisione Databricks in alto a destra e selezionare Copia identificatore di condivisione.
Per ottenere l'identificatore di condivisione usando un notebook o una query SQL di Databricks, usare la funzione
CURRENT_METASTORE
SQL predefinita . Se si usa un notebook, è necessario eseguirlo in un cluster condiviso o singolo utente nell'area di lavoro che verrà usato per accedere ai dati condivisi.SELECT CURRENT_METASTORE();
Il provider di dati crea:
- Destinatario nel proprio account Databricks per rappresentare l'utente e gli utenti dell'organizzazione che accederanno ai dati.
- Condivisione, che è una rappresentazione delle tabelle, dei volumi e delle visualizzazioni da condividere con l'utente.
È possibile accedere ai dati condivisi con l'utente. Se necessario, l'utente o un utente del team può configurare l'accesso granulare ai dati per gli utenti. Vedere Leggere i dati condivisi usando Delta Sharing da Databricks a Databricks (per destinatari).
Ottenere l'accesso nel modello di condivisione aperta
Nel modello di condivisione aperta:
Il provider di dati crea:
- Destinatario nel proprio account Databricks per rappresentare l'utente e gli utenti dell'organizzazione che accederanno ai dati. Un token e un file di credenziali vengono generati come parte di questa configurazione.
- Condivisione, che rappresenta le tabelle e le partizioni da condividere con l'utente.
Il provider di dati invia un URL di attivazione tramite un canale sicuro. Seguire questa procedura per scaricare un file di credenziali che consente di accedere ai dati condivisi con l'utente.
Importante
Non condividere il collegamento di attivazione con nessuno. È possibile scaricare un file di credenziali una sola volta. Se si visita nuovamente il collegamento di attivazione dopo che il file delle credenziali è già stato scaricato, il pulsante Scarica file credenziali è disabilitato.
Se si perde il collegamento di attivazione prima di usarlo, contattare il provider di dati.
Archiviare il file delle credenziali in un percorso sicuro.
Non condividere il file delle credenziali con altri utenti esterni al gruppo di utenti che devono avere accesso ai dati condivisi. Se è necessario condividerlo con un utente dell'organizzazione, Databricks consiglia di usare un gestore delle password.
Leggere i dati condivisi
La modalità di lettura dei dati che sono stati condivisi in modo sicuro con l'utente tramite Condivisione Delta dipende dal fatto che sia stato ricevuto un file di credenziali (il modello di condivisione aperta) o si usa un'area di lavoro di Databricks e il provider di dati abbia fornito l'identificatore di condivisione (il modello da Databricks a Databricks).
Leggere i dati condivisi usando un file di credenziali (condivisione aperta)
Se i dati sono stati condivisi con l'utente usando il protocollo di condivisione aperta delta, usare il file di credenziali scaricato per eseguire l'autenticazione nell'account Databricks del provider di dati e leggere i dati condivisi. L'accesso viene mantenuto finché il token sottostante è valido e il provider continua a condividere i dati. I provider gestiscono la scadenza e la rotazione dei token. Gli aggiornamenti ai dati sono disponibili quasi in tempo reale. È possibile leggere e creare copie dei dati condivisi, ma non è possibile modificare i dati di origine.
Per informazioni su come accedere e leggere i dati condivisi usando il file di credenziali in Azure Databricks, Apache Spark, pandas e Power BI, vedere Leggere i dati condivisi usando la condivisione differenziale aperta (per i destinatari) .
Leggere i dati condivisi con la condivisione da Databricks a Databricks
Se i dati sono stati condivisi con l'utente usando il modello Databricks-to-Databricks, non è necessario alcun file di credenziali per accedere ai dati condivisi. Databricks si occupa della connessione sicura e i dati condivisi sono individuabili automaticamente nell'area di lavoro di Databricks.
Per informazioni su come trovare, leggere e gestire i dati condivisi nell'area di lavoro di Databricks, vedere Leggere i dati condivisi con Databricks-to-Databricks Delta Sharing (per i destinatari).
Controllare l'utilizzo dei dati condivisi
Se si ha accesso a un'area di lavoro di Azure Databricks, è possibile usare i log di controllo di Azure Databricks per comprendere chi nell'organizzazione accede ai dati usando la condivisione Delta. Vedere Controllare e monitorare la condivisione dei dati.