Dela via


Dela data med hjälp av Delta Sharing Databricks-to-Databricks-protokollet (för providers)

Den här artikeln ger en översikt över hur du använder Databricks-till-Databricks Delta-delning för att dela data på ett säkert sätt med alla Databricks-användare, oavsett konto eller molnvärd, så länge användaren har åtkomst till en arbetsyta som är aktiverad för Unity Catalog.

Kommentar

Om du är en datamottagare (en användare eller grupp av användare som Databricks-data delas med), se Åtkomst till data som delas med dig med Delta Sharing (för recipients).

Vem ska använda Databricks-till-Databricks Delta-delning?

Det finns tre sätt att dela data med deltadelning.

  1. Databricks-till-Databricks-delningsprotokollet, som beskrivs i den här artikeln, kan du dela data från din Unity Catalog-aktiverade arbetsyta med användare som också har åtkomst till en Unity Catalog-aktiverad Databricks-arbetsyta.

    Den här metoden använder Delta Sharing-servern som är inbyggd i Azure Databricks och ger stöd för delning av notebook-dokument, Unity Catalog datastyrning, granskning och användningsspårning för både providers och recipients. Integreringen med Unity Catalog förenklar konfigurationen och styrningen för både providers och recipients och förbättrar prestandan.

  2. Databricks öppna delningsprotokoll kan du dela data som du hanterar på en Unity Catalog-aktiverad Databricks-arbetsyta med användare på alla databehandlingsplattformar.

    Se Dela data med hjälp av deltadelningsprotokollet för öppen delning (för providers).

  3. Med en kundhanterad implementering av deltadelningsservern med öppen källkod kan du dela från valfri plattform till valfri plattform, oavsett om det är Databricks eller inte.

    Se github.com/delta-io/delta-sharing.

En introduktion till Deltadelning och mer information om dessa tre metoder finns i Vad är deltadelning?.

Databricks-till-Databricks Delta-delningsarbetsflöde

Det här avsnittet innehåller en översikt på hög nivå över databricks-till-Databricks-delningsarbetsflödet, med länkar till detaljerad dokumentation för varje steg.

I Databricks-till-Databricks Delta-delningsmodellen:

  1. En mottagare ger en dataleverantör den unika delning identifier för Databricks Unity Catalog metaarkiv som är kopplat till Databricks-arbetsytan som mottagaren (som representerar en användare eller grupp av användare) använder för att komma åt de data som dataleverantören delar.

    Mer information finns i Steg 1: Be att mottagaren delar identifier.

  2. Dataprovidern skapar en resurs i leverantörens Unity Catalog-metaarkiv. Det här namngivna objektet innehåller en samling tables, views, volumesoch notebook-filer som registrerats i metaarkivet.

    Mer information finns i Skapa och hantera shares för Delta Sharing.

  3. Dataprovidern skapar ett mottagarobjekt i leverantörens Unity-Catalog metaarkiv. Det här namngivna objektet representerar den användare eller grupp av användare som kommer att få tillgång till de data som finns i delningen, tillsammans med delning identifier av Unity Catalog-metaarkivet som är kopplat till arbetsytan som användaren eller gruppen av användare kommer att använda för att få tillgång till delningen. Delnings-identifier är nyckeln identifier som aktiverar den säkra anslutningen.

    Mer information finns i Steg 2: Skapa mottagaren.

  4. Dataleverantören ger mottagaren åtkomst till resursen.

    För mer information, se Hantera åtkomst till Delta Sharing-data shares (för providers).

  5. Andelen blir tillgänglig i mottagarens Databricks-arbetsyta, och användarna kan få åtkomst till den med hjälp av Catalog Explorer, Databricks CLI, eller SQL-kommandon i en Azure Databricks notebook eller Databricks SQL-frågeredigeraren.

    För att få åtkomst till tables, views, volumesoch notebook-filer i en resurs måste en metaarkivadministratör eller privilegierad användare skapa en catalog från resursen. Sedan kan den användare eller en annan användare som beviljas rätt behörighet ge andra användare åtkomst till catalog och objekt i catalog. Att bevilja behörigheter för delade catalogs- och datatillgångar fungerar precis som med andra tillgångar som är registrerade i Unity Catalog, med den viktiga skillnaden att användare endast kan beviljas läsåtkomst för objekt i catalogs som skapas från Delta Sharing-shares.

    Delade anteckningsböcker finns på nivån catalog, och alla användare med USE CATALOG-behörighet på catalog kan komma åt dem.

    Mer information finns i Läsa data som delas med Databricks-till-Databricks Delta-delning (för recipients).

Förbättra table läsprestanda med historikdelning

Viktig

Den här funktionen finns i offentlig förhandsversion.

Databricks-till-Databricks-tableshares kan förbättra prestanda genom att aktivera historikdelning. Delningshistoriken förbättrar prestandan genom att utnyttja tillfällig säkerhet credentials från din molnlagring, begränsad till rotkatalogen för providerns delade Delta-table, vilket resulterar i prestanda som är jämförbar med direkt åtkomst till källan tables.

Kommentar

Tables med partitionering aktiverat får inte prestandafördelarna med historikdelning. Se Ange table partitioner som ska delas

Historikdelning av datasekretess

Providers bör vara medvetna om att delning av Databricks-till-Databricks-historik ger Delta Sharing recipients tillfällig läsåtkomst till både datafilerna och Delta-loggen. Delta-loggen innehåller incheckningshistoriken för varje table version, information om incheckningen (liknar GitHub-incheckningshistorik) och borttagna data som inte har dammsugats.