Condividere i dati usando il protocollo di condivisione aperta delta (per i provider)
Questo articolo offre una panoramica del modo in cui i provider possono usare il protocollo di condivisione aperta delta per condividere i dati dall'area di lavoro di Azure Databricks abilitata per Unity Catalog con qualsiasi utente in qualsiasi piattaforma di elaborazione, ovunque.
Nota
Se si è un destinatario di dati (un utente o un gruppo di utenti con cui vengono condivisi i dati), vedere invece Accedere ai dati condivisi con l'utente usando la condivisione differenziale (per i destinatari).
Chi deve usare il protocollo di condivisione aperta delta?
Esistono tre modi per condividere i dati usando Delta Sharing:
Il protocollo di condivisione aperta di Databricks, descritto in questo articolo, consente di condividere i dati gestiti in un'area di lavoro databricks abilitata per Unity Catalog con gli utenti in qualsiasi piattaforma di elaborazione.
Questo approccio usa il server di Delta Sharing integrato in Azure Databricks ed è utile quando si gestiscono i dati usando Unity Catalog e si vuole condividerlo con gli utenti che non usano Databricks o che non hanno accesso a un'area di lavoro di Databricks abilitata per Unity Catalog. L'integrazione con Unity Catalog sul lato del provider semplifica la configurazione e la governance per i provider.
Un'implementazione gestita dal cliente del server di condivisione Delta open source consente di condividere da qualsiasi piattaforma a qualsiasi piattaforma, indipendentemente dal fatto che Databricks o meno.
Il protocollo di condivisione Da Databricks a Databricks consente di condividere dati dall'area di lavoro abilitata per Unity Catalog con utenti che hanno accesso a un'area di lavoro databricks abilitata per Unity Catalog.
Vedere Condividere i dati usando il protocollo Delta Sharing da Databricks a Databricks (per i provider).
Per un'introduzione alla condivisione delta e altre informazioni su questi tre approcci, vedere Che cos'è la condivisione delta?.
Flusso di lavoro di condivisione aperta di condivisione differenziale
Questa sezione offre una panoramica generale del flusso di lavoro di condivisione aperta, con collegamenti alla documentazione dettagliata per ogni passaggio.
Nel modello di condivisione differenziale open sharing:
Il provider di dati crea un destinatario, ovvero un oggetto denominato che rappresenta un utente o un gruppo di utenti con cui il provider di dati desidera condividere i dati.
Quando il provider di dati crea il destinatario, Azure Databricks genera un token, un file di credenziali che include il token e un collegamento di attivazione che il provider di dati può inviare al destinatario per accedere al file delle credenziali.
Per informazioni dettagliate, vedere Passaggio 1: Creare il destinatario.
Il provider di dati crea una condivisione, ovvero un oggetto denominato che contiene una raccolta di tabelle registrate in un metastore del catalogo Unity nell'account del provider.
Per informazioni dettagliate, vedere Creare e gestire condivisioni per la condivisione Delta.
Il provider di dati concede al destinatario l'accesso alla condivisione.
Per informazioni dettagliate, vedere Gestire l'accesso alle condivisioni dati di condivisione differenziale (per i provider).
Il provider di dati invia il collegamento di attivazione al destinatario tramite un canale sicuro, insieme alle istruzioni per l'uso del collegamento di attivazione per scaricare il file di credenziali che il destinatario userà per stabilire una connessione sicura con il provider di dati per ricevere i dati condivisi.
Per informazioni dettagliate, vedere Passaggio 2: Ottenere il collegamento di attivazione.
Il destinatario dei dati segue il collegamento di attivazione per scaricare il file delle credenziali e quindi usa il file delle credenziali per accedere ai dati condivisi.
I dati condivisi sono disponibili solo per la lettura. Gli utenti possono accedere ai dati usando la piattaforma o gli strumenti scelti.
Per informazioni dettagliate, vedere Leggere i dati condivisi con condivisione differenziale (per i destinatari) per la condivisione aperta.
Configurazioni specifiche del provider
Molti provider hanno le proprie reti di condivisione Delta per la condivisione. Per istruzioni di condivisione specifiche, vedere, ad esempio:
Considerazioni sulla configurazione del provider e sulla sicurezza per la condivisione aperta
Una buona gestione dei token è fondamentale per condividere i dati in modo sicuro quando si usa il modello di condivisione aperta:
- I provider di dati in Azure Databricks che intendono usare la condivisione aperta quando forniscono condivisioni devono configurare la durata predefinita del token del destinatario quando abilitano Delta Sharing per il metastore del catalogo Unity. Databricks consiglia di configurare i token per la scadenza. Consultare la sezione Abilitare Delta Sharing in un metastore.
- Se è necessario modificare la durata predefinita del token, vedere Modificare la durata del token del destinatario.
- Incoraggiare i destinatari a gestire il file di credenziali scaricato in modo sicuro.
- Per altre informazioni sulla gestione dei token e sulla sicurezza della condivisione aperta, vedere Gestire i token dei destinatari (condivisione aperta).
I provider di dati possono fornire maggiore sicurezza assegnando elenchi di accesso IP per limitare l'accesso dei destinatari a percorsi di rete specifici. Vedere Limitare l'accesso dei destinatari alla condivisione delta tramite elenchi di accesso IP (condivisione aperta).