Delen via


Gegevens delen met het Delta Sharing Databricks-to-Databricks-protocol (voor providers)

Dit artikel bevat een overzicht van het gebruik van Databricks-to-Databricks Delta Sharing om gegevens veilig te delen met elke Databricks-gebruiker, ongeacht het account of de cloudhost, zolang die gebruiker toegang heeft tot een werkruimte die is ingeschakeld voor Unity Catalog.

Notitie

Als u een gegevensontvanger bent (een gebruiker of groep gebruikers met wie Databricks-gegevens worden gedeeld), raadpleegt u Access-gegevens die met u worden gedeeld via Delta Sharing (voor ontvangers).

Wie moet Databricks-to-Databricks Delta Sharing gebruiken?

Er zijn drie manieren om gegevens te delen met Delta Sharing.

  1. Met het Databricks-naar-Databricks-protocol voor delen, dat in dit artikel wordt besproken, kunt u gegevens delen vanuit uw werkruimte met Unity Catalog-functionaliteit met gebruikers die ook toegang hebben tot een Databricks-werkruimte met Unity Catalog.

    Deze benadering maakt gebruik van de Delta Sharing-server die is ingebouwd in Azure Databricks en biedt ondersteuning voor het delen van notebooks, Unity Catalog-gegevensbeheer, controle en het bijhouden van gebruik voor zowel providers als ontvangers. De integratie met Unity Catalog vereenvoudigt het instellen en beheren voor zowel providers als ontvangers en verbetert de prestaties.

  2. Met het Open Sharing-protocol van Databricks kunt u gegevens die u beheert in een Databricks-werkruimte met Unity Catalog delen delen met gebruikers op elk computerplatform.

    Zie Gegevens delen met behulp van het Open Sharing-protocol voor open delen (voor providers) van Delta Sharing.

  3. Met een door de klant beheerde implementatie van de opensource Delta Sharing-server kunt u delen van elk platform naar elk platform, ongeacht of Databricks of niet.

    Zie github.com/delta-io/delta-sharing.

Zie Wat is Delta Delen?voor een inleiding tot Delta Sharing en meer informatie over deze drie benaderingen.

Databricks-to-Databricks Delta Sharing-werkstroom

Deze sectie biedt een algemeen overzicht van de databricks-naar-Databricks-werkstroom voor delen, met koppelingen naar gedetailleerde documentatie voor elke stap.

In het Databricks-to-Databricks Delta Sharing-model:

  1. Een gegevensontvanger geeft een gegevensproviderde unieke id voor delen voor de Databricks Unity Catalog-metastore die is gekoppeld aan de Databricks-werkruimte die de ontvanger (die een gebruiker of groep gebruikers vertegenwoordigt) zal gebruiken voor toegang tot de gegevens die de gegevensprovider deelt.

    Zie stap 1 voor meer informatie: De id voor delen van de geadresseerde aanvragen.

  2. De gegevensprovider maakt een share in de Unity Catalog-metastore van de provider. Dit benoemde object bevat een verzameling tabellen, weergaven, volumes en notebooks die zijn geregistreerd in de metastore.

    Zie Shares maken en beheren voor Delta Sharing voor meer informatie.

  3. De gegevensprovider maakt een ontvangerobject in de Unity Catalog-metastore van de provider. Dit benoemde object vertegenwoordigt de gebruiker of groep gebruikers die toegang hebben tot de gegevens die zijn opgenomen in de share, samen met de deel-id van de Unity Catalog-metastore die is gekoppeld aan de werkruimte die de gebruiker of groep gebruikers zal gebruiken voor toegang tot de share. De id voor delen is de sleutel-id die de beveiligde verbinding mogelijk maakt.

    Zie stap 2 voor meer informatie: De ontvanger maken.

  4. De gegevensprovider verleent de ontvanger toegang tot de share.

    Zie Toegang tot Delta Sharing-gegevensshares beheren (voor providers) voor meer informatie.

  5. De share wordt beschikbaar in de Databricks-werkruimte van de ontvanger en gebruikers hebben er toegang toe via Catalog Explorer, de Databricks CLI of SQL-opdrachten in een Azure Databricks-notebook of de Databricks SQL-queryeditor.

    Als u toegang wilt krijgen tot de tabellen, weergaven, volumes en notebooks in een share, moet een metastore-beheerder of bevoegde gebruiker een catalogus maken op basis van de share. Vervolgens kan die gebruiker of een andere gebruiker die de juiste bevoegdheid krijgt, andere gebruikers toegang geven tot de catalogus en objecten in de catalogus. Het verlenen van machtigingen voor gedeelde catalogi en gegevensassets werkt net zoals bij andere assets die zijn geregistreerd in Unity Catalog, met het belangrijkste verschil dat gebruikers alleen leestoegang kunnen krijgen voor objecten in catalogi die zijn gemaakt op basis van Delta Sharing-shares.

    Gedeelde notitieblokken zijn live op catalogusniveau en elke gebruiker met de USE CATALOG bevoegdheid in de catalogus heeft toegang tot deze notitieblokken.

    Zie Gegevens lezen die worden gedeeld met Databricks-to-Databricks Delta Sharing (voor ontvangers) voor meer informatie.

Leesprestaties van tabellen verbeteren met het delen van geschiedenis

Belangrijk

Deze functie bevindt zich in openbare preview-versie.

Databricks-to-Databricks-tabelshares kunnen de prestaties verbeteren door het delen van geschiedenis in te schakelen. Het delen van geschiedenis verbetert de prestaties door gebruik te maken van tijdelijke beveiligingsreferenties van uw cloudopslag, beperkt tot de rootdirectory van de gedeelde Delta-tabel van de provider, wat resulteert in prestaties die vergelijkbaar zijn met directe toegang tot de brontabellen.

Notitie

Tabellen waarvoor partitionering is ingeschakeld, ontvangen niet de prestatievoordelen van het delen van geschiedenis. Zie Tabelpartities opgeven om te delen

Privacy van gedeelde historische gegevens

Providers moeten zich ervan bewust zijn dat het delen van de geschiedenis tussen Databricks-instanties ontvangers van Delta Sharing tijdelijke leestoegang verleent tot zowel de data als het Delta-logboek. Het Delta-logboek bevat de doorvoergeschiedenis voor elke tabelversie, informatie over de doorvoerfunctie (vergelijkbaar met gitHub-doorvoergeschiedenis) en verwijderde gegevens die niet zijn opgezogen.