Wat is Delta Sharing?
In dit artikel maakt u kennis met Delta Sharing in Azure Databricks, het beveiligde platform voor gegevensdeling waarmee u gegevens en AI-assets kunt delen in Azure Databricks met gebruikers buiten uw organisatie, ongeacht of deze gebruikers Databricks gebruiken of niet. Delta Sharing is ook de basis voor Databricks Marketplace, een open forum voor het uitwisselen van gegevensproducten en Clean Rooms, een veilige en privacybeschermingsomgeving waar meerdere partijen kunnen samenwerken aan gevoelige bedrijfsgegevens.
Delta Delen is ook beschikbaar als een opensource-project dat u kunt gebruiken om Delta-tabellen van andere platforms te delen.
Notitie
Zie Toegang tot gegevens die met u zijn gedeeld met Delta Sharing (voor ontvangers)voor informatie over hoe u gegevens kunt benaderen die met u zijn gedeeld.
Hoe werkt Delta Sharing?
Delta Sharing is een open protocol dat door Databricks is ontwikkeld voor het veilig delen van gegevens met andere organisaties, ongeacht de computerplatforms die ze gebruiken.
Er zijn drie manieren om gegevens te delen met Delta Sharing:
Het Databricks-to-Databricks-protocol voor delen, waarmee u gegevens en AI-assets kunt delen vanuit uw werkruimte met Unity Catalog-functionaliteit, met gebruikers die ook toegang hebben tot een Databricks-werkruimte met Unity Catalog.
Deze benadering maakt gebruik van de Delta Sharing-server die is ingebouwd in Azure Databricks. Het ondersteunt enkele Delta Sharing-functies die niet worden ondersteund in de andere protocollen, waaronder delen van notebooks, Unity Catalog-volume delen, Unity Catalog AI-model delen, Unity Catalog-gegevensbeheer, controle en het bijhouden van gebruik voor zowel providers als ontvangers. De integratie met Unity Catalog vereenvoudigt het instellen en beheren voor zowel providers als ontvangers en verbetert de prestaties.
Zie Gegevens delen met behulp van het Delta Sharing Databricks-to-Databricks-protocol (voor providers).
Het Open Sharing-protocol van Databricks, waarmee u tabellaire gegevens kunt delen die u beheert in een Databricks-werkruimte met Unity Catalog en gebruikers op elk computerplatform.
Deze benadering maakt gebruik van de Delta Sharing-server die is ingebouwd in Azure Databricks en is handig wanneer u gegevens beheert met Behulp van Unity Catalog en deze wilt delen met gebruikers die geen Databricks gebruiken of geen toegang hebben tot een Databricks-werkruimte met Unity Catalog. De integratie met Unity Catalog aan de providerzijde vereenvoudigt het instellen en beheren van providers.
Zie Gegevens delen met behulp van het open sharing-protocol voor Delta Sharing (voor providers).
Een door de klant beheerde implementatie van de opensource Delta Sharing-server, waarmee u kunt delen van elk platform naar elk platform, ongeacht of Databricks of niet.
De Documentatie van Azure Databricks bevat geen instructies voor het instellen van uw eigen Delta Sharing-server. Zie github.com/delta-io/delta-sharing.
Aandelen, providers en ontvangers
De belangrijkste concepten voor deltadeling in Azure Databricks zijn shares, providersen ontvangers.
Wat is een share?
In Delta Sharing is een share een alleen-lezen verzameling tabellen en tabelpartities die een provider wil delen met een of meer ontvangers. Als uw ontvanger een Databricks-werkruimte met Unity Catalog gebruikt, kunt u ook notebookbestanden, weergaven (inclusief dynamische weergaven die de toegang beperken op rij- en kolomniveau), Unity Catalog-volumes en Unity Catalog-modellen in een share opnemen.
U kunt op elk gewenst moment tabellen, weergaven, volumes, modellen en notitieblokbestanden uit een share toevoegen of verwijderen en u kunt de toegang van de ontvanger van gegevens op elk gewenst moment toewijzen aan of intrekken.
In een Azure Databricks-werkruimte met Unity Catalog is een share een beveiligbaar object dat is geregistreerd in Unity Catalog. Als u een aandeel verwijdert uit uw Unity Catalog-metastore, verliezen alle ontvangers van dat aandeel de mogelijkheid om zich ervoor te registreren.
Raadpleeg Het maken en beheren van shares voor Delta Sharing.
Wat is een provider?
Een provider is een entiteit die gegevens deelt met een ontvanger. Als u een provider bent en u wilt profiteren van de ingebouwde Databricks Delta Sharing-server en shares en ontvangers wilt beheren met behulp van Unity Catalog, hebt u ten minste één Azure Databricks-werkruimte nodig die is ingeschakeld voor Unity Catalog. U hoeft niet al uw bestaande werkruimten te migreren naar Unity Catalog. U kunt gewoon een nieuwe Unity-Cataloguswerkruimte maken voor uw Delta Sharing-behoeften.
Als een ontvanger zich in een Databricks-werkruimte met Unity Catalog bevindt, is de provider ook een beveiligbaar object voor Unity Catalog dat de providerorganisatie vertegenwoordigt en die organisatie koppelt aan een set shares.
Wat is een ontvanger?
Een ontvanger is een entiteit die shares van een provider ontvangt. In Unity Catalog is een share een beveiligbaar object dat een organisatie vertegenwoordigt en deze koppelt aan een referentie of een beveiligde deel-ID waarmee die organisatie toegang heeft tot een of meer 'shares'.
Als gegevensprovider (sharer) kunt u meerdere geadresseerden definiëren voor een bepaalde Unity Catalog-metastore, maar als u gegevens uit meerdere metastores met een bepaalde gebruiker of groep gebruikers wilt delen, moet u de ontvanger afzonderlijk definiëren voor elke metastore. Een ontvanger kan toegang hebben tot meerdere shares.
Als een provider een ontvanger verwijdert uit de Unity Catalog-metastore, verliest die ontvanger de toegang tot alle shares waartoe deze eerder toegang had.
Zie Gegevensontvangers maken en beheren voor Delta Sharing.
Delen openen versus delen met Databricks naar Databricks
In deze sectie worden de twee protocollen beschreven voor delen vanuit een Databricks-werkruimte die is ingeschakeld voor Unity Catalog.
Notitie
In deze sectie wordt ervan uitgegaan dat de provider zich in een Azure Databricks-werkruimte met Unity Catalog-functionaliteit bevindt. Zie github.com/delta-io/delta-sharingvoor meer informatie over het instellen van een opensource Delta Sharing-server om te delen vanuit een niet-Databricks-platform of een niet-Unity Catalog-werkruimte.
De manier waarop een provider Gebruikmaakt van Delta Sharing in Azure Databricks, is afhankelijk van met wie ze gegevens delen:
- Met Delen openen kunt u gegevens delen met elke gebruiker, ongeacht of ze toegang hebben tot Azure Databricks.
- Databricks-to-Databricks delen stelt u in staat om gegevens te delen met Azure Databricks-gebruikers wiens werkruimte is gekoppeld aan een Unity Catalog-metastore die anders is dan die van u. Databricks-to-Databricks biedt ook ondersteuning voor het delen van notebooks, volumes en modellen, die niet beschikbaar zijn voor openen delen.
Wat is Open Delta Sharing?
Als u gegevens wilt delen met gebruikers buiten uw Azure Databricks-werkruimte, ongeacht of ze Databricks gebruiken, kunt u Delta Sharing openen om uw gegevens veilig te delen. Als gegevensprovider genereert u een token en deelt u het veilig met de ontvanger. Ze gebruiken het token om te verifiëren en leestoegang te krijgen tot de tabellen die u hebt opgenomen in de shares waaraan u ze toegang hebt gegeven.
Ontvangers hebben toegang tot de gedeelde gegevens met behulp van veel computerhulpprogramma's en platforms, waaronder:
- Azure Databricks
- Apache Spark
- Pandas
- Power BI
Zie de documentatie over Delta Sharing voor een volledige lijst met Delta Sharing-connectors en informatie over het gebruik ervan.
Zie ook Gegevens delen met behulp van het open sharing-protocol voor Delta Sharing (voor providers).
Wat is Databricks-to-Databricks Delta Sharing?
Als u gegevens wilt delen met gebruikers met een Databricks-werkruimte die is ingeschakeld voor Unity Catalog, kunt u Databricks-to-Databricks Delta Sharing gebruiken. Met het delen van Databricks naar Databricks kunt u gegevens delen met gebruikers in andere Databricks-accounts, ongeacht of ze zich in AWS, Azure of GCP bevinden. Het is ook een uitstekende manier om gegevens veilig te delen in verschillende Unity Catalog-metastores in uw eigen Databricks-account. Houd er rekening mee dat u Delta Sharing niet hoeft te gebruiken om gegevens te delen tussen werkruimten die zijn gekoppeld aan dezelfde Unity Catalog-metastore. In dat scenario kunt u Unity Catalog zelf gebruiken om de toegang tot gegevens in werkruimten te beheren.
Een voordeel van het delen van Databricks naar Databricks is dat de ontvanger van de share geen token nodig heeft om toegang te krijgen tot de share en dat de provider geen tokens voor geadresseerden hoeft te beheren. De beveiliging van de verbinding voor delen, inclusief alle identiteitsverificatie, verificatie en controle, wordt volledig beheerd via Delta Sharing en het Databricks-platform. Een ander voordeel is de mogelijkheid om Databricks-notebookbestanden, weergaven, Unity Catalog-volumes en Unity Catalog-modellen te delen.
Zie ook Gegevens delen met behulp van het Delta Sharing Databricks-to-Databricks-protocol (voor providers).
Hoe kunnen providerbeheerders Delta Sharing instellen?
In deze sectie vindt u een overzicht van hoe providers Delta Sharing kunnen inschakelen en delen kunnen initiëren vanuit een Azure Databricks-werkruimte met Unity Catalog. Zie github.com/delta-io/delta-sharing voor opensource Delta Sharing.
Databricks-to-Databricks delen tussen Unity Catalog-metastores binnen hetzelfde account staat altijd aan. Als u een provider bent die Delta Sharing in staat wil stellen om gegevens te delen met Databricks-werkruimten in andere accounts of niet-Databricks-clients, voert een Azure Databricks-accountbeheerder of metastore-beheerder de volgende installatiestappen uit (op hoog niveau):
Schakel Delta Sharing in voor de Unity Catalog-metastore waarmee de gegevens worden beheerd die u wilt delen.
Notitie
U hoeft Delta Sharing niet in te schakelen in uw metastore als u Delta Sharing wilt gebruiken om alleen gegevens te delen met gebruikers in andere Unity Catalog-metastores in uw account. Het delen van metastore-naar-metastore binnen één Azure Databricks-account is standaard ingeschakeld.
Maak een share die gegevensassets bevat die zijn geregistreerd in de Unity Catalog-metastore.
Als u deelt met een niet-Databricks-ontvanger (ook wel open delen genoemd), kunt u tabellen opnemen in de Delta- of Parquet-format. Als u van plan bent om Databricks-to-Databricks te delen, kunt u ook weergaven, Unity Catalog-volumes, Unity Catalog-modellen en notebookbestanden toevoegen aan een share.
Raadpleeg Het maken en beheren van shares voor Delta Sharing.
Maak een geadresseerde.
Zie Gegevensontvangers maken en beheren voor Delta Sharing.
Als uw ontvanger geen Databricks-gebruiker is of geen toegang heeft tot een Databricks-werkruimte die is ingeschakeld voor Unity Catalog, moet u open delengebruiken. Er wordt een set referenties op basis van tokens gegenereerd voor die ontvanger.
Als uw ontvanger toegang heeft tot een Databricks-werkruimte waarvoor Unity Catalog is ingeschakeld, kunt u Databricks-to-Databricks-delengebruiken en zijn er geen op tokens gebaseerde referenties vereist. U vraagt een deeldentifier aan van de ontvanger,, en gebruikt deze om de beveiligde verbinding tot stand te brengen.
Tip
Gebruik uzelf als testontvanger om het installatieproces uit te proberen.
Geef de ontvanger toegang tot een of meer aandelen.
Zie Toegang tot Delta Sharing-gegevensshares beheren (voor providers).
Notitie
Deze stap kan ook worden uitgevoerd door een niet-beheerder met de
USE SHARE
enUSE RECIPIENT
SET SHARE PERMISSION
bevoegdheden. Zie Unity Catalog-bevoegdheden en beveiligbare objecten.Verzend de geadresseerde de informatie die ze nodig hebben om verbinding te maken met de share (alleen voor delen openen).
Zie De ontvanger de verbindingsgegevens verzenden.
Voor open delen, gebruik een beveiligd kanaal om de geadresseerde een link te sturen waarmee ze hun token-gebaseerde referenties kunnen downloaden.
Voor het delen van Databricks-naar-Databricks zijn de gegevens die zijn opgenomen in de share beschikbaar in de Databricks-werkruimte van de ontvanger zodra u ze toegang verleent tot de share.
De ontvanger heeft nu toegang tot de gedeelde gegevens.
Hoe krijgen ontvangers toegang tot de gedeelde gegevens?
Ontvangers hebben toegang tot gedeelde gegevens in alleen-lezenformaat. Gedeelde notitieblokbestanden zijn alleen-lezen, maar ze kunnen worden gekloond en vervolgens worden gewijzigd en uitgevoerd in de werkruimte van de geadresseerde, net zoals elk ander notitieblok.
Beveiligde toegang is afhankelijk van het model voor delen:
- Open delen (ontvanger heeft geen Databricks-werkruimte ingeschakeld voor Unity Catalog): de ontvanger verstrekt de inloggegevens wanneer ze toegang hebben tot de gegevens in hun hulpprogramma naar keuze, waaronder Apache Spark, pandas, Power BI, Databricks en nog veel meer. Zie Gegevens die zijn gedeeld met Delta Sharing lezen door gebruik te maken van open delen (voor ontvangers).
- Databricks-to-Databricks (de werkruimte van de ontvanger is ingeschakeld voor Unity Catalog): de ontvanger krijgt toegang tot de gegevens met behulp van Databricks. Ze kunnen Unity Catalog gebruiken om andere gebruikers in hun Databricks-account toegang te verlenen en te weigeren. Zie Lezen van gegevens die gedeeld worden via Databricks-to-Databricks Delta Sharing (voor ontvangers).
Wanneer de gegevensprovider gegevenstabellen of -volumes in hun eigen Databricks-account bijwerken, worden de updates bijna in realtime weergegeven in het systeem van de geadresseerde.
Hoe houdt u bij wie gedeelde en gedeelde gegevens deelt en opent?
Gegevensproviders in Azure Databricks-werkruimten met ingeschakelde Unity Catalog kunnen auditlogboeken en systeemtabellen van Azure Databricks gebruiken om het maken en wijzigen van gedeelde gegevens en ontvangers te bewaken, evenals de activiteiten van ontvangers op gedeelde gegevens te monitoren. Zie Gegevens delen controleren en bewaken.
Gegevensontvangers die gebruikmaken van gedeelde gegevens in een Databricks-werkruimte kunnen databricks-auditlogboekregistratie en systeemtabellen gebruiken om te begrijpen wie toegang heeft tot welke gegevens. Zie Gegevens delen controleren en bewaken.
Delen van volumes
U kunt volumes delen met behulp van de delingsstroom tussen Databricks-instanties. Zie Volumes toevoegen aan een share (voor providers) en Gegevens lezen gedeeld met Databricks-to-Databricks Delta Sharing (voor ontvangers) (voor ontvangers).
Modellen delen
U kunt modellen delen met behulp van de Databricks-to-Databricks-stroom voor delen. Zie Modellen toevoegen aan een share (voor aanbieders) en Gegevens lezen die worden gedeeld met Databricks-to-Databricks Delta Sharing (voor ontvangers) (voor ontvangers).
Notitieblokken delen
U kunt Delta Sharing gebruiken om notitieblokbestanden te delen met behulp van de Databricks-naar-Databricks-stroom voor delen. Zie Notitieblokbestanden toevoegen aan een share (voor providers) en Gedeelde notitieblokken lezen (voor ontvangers).
Toegang beperken op rij- en kolomniveau
U kunt dynamische weergaven delen die de toegang tot bepaalde tabelgegevens beperken op basis van eigenschappen van geadresseerden. Voor dynamisch delen van weergaven is de stroom voor delen van Databricks-naar-Databricks vereist. Zie Dynamische weergaven toevoegen aan een share om rijen en kolommente filteren.
Delta Delen en streamen
Delta Sharing ondersteunt Spark Structured Streaming. Een provider kan een tabel delen met de geschiedenis, zodat een ontvanger deze kan gebruiken als een gestructureerde streamingbron, waarbij gedeelde gegevens incrementeel met lage latentie worden verwerkt. Ontvangers kunnen ook Delta Lake-tijdreizenqueries uitvoeren op tabellen die met historische gegevens zijn gedeeld.
Zie Tabellen toevoegen aan een share-voor meer informatie over het delen van tabellen met geschiedenis. Zie Een tabel opvragen met behulp van Apache Spark Structured Streaming (voor ontvangers van Databricks-naar-Databricks delen) of Een gedeelde tabel openen met behulp van Spark Structured Streaming (voor ontvangers van open delen van gegevens).
Zie ook Streamen op Azure Databricks.
Ondersteuningsmatrix voor Delta Lake-functies
Delta Sharing ondersteunt de meeste Delta Lake-functies wanneer u een tabel deelt. Deze ondersteuningsmatrixlijsten:
- Delta-functies waarvoor specifieke versies van Databricks Runtime, de opensource Delta Sharing Spark-connector of de opensource Delta Sharing Python-connector zijn vereist.
- Gedeeltelijk ondersteunde functies.
Functie | Provider | Databricks-geadresseerde | Open source-geadresseerde |
---|---|---|---|
Verwijderingsvectoren | Tabellen delen met deze functie bevindt zich in openbare preview. | - Databricks Runtime 14.1+ voor batchquery's - Databricks Runtime 14.2+ voor CDF- en streamingquery's |
- Delta Sharing Spark-connector 3.1+ - Delta Sharing Python-connector 1.1.0+ - Power BI v2.132.908.0+ |
Kolomtoewijzing | Tabellen delen met deze functie bevindt zich in openbare preview. | - Databricks Runtime 14.1+ voor batchquery's - Databricks Runtime 14.2+ voor CDF- en streamingquery's |
- Delta Sharing Spark-connector 3.1+ - Delta Sharing Python-connector 1.1.0+ - Power BI v2.132.908.0+ |
Uniforme indeling | Tabellen delen met deze functie bevindt zich in openbare preview. | - Databricks Runtime 14.1+ voor batchquery's - Databricks Runtime 14.2+ voor CDF- en streamingquery's |
- Delta Sharing Spark-connector 3.1+ - Delta Sharing Python-connector 1.1.0+ - Power BI v2.132.908.0+ |
V2-controlepunt | Ondersteund met beperkingen | Ondersteund met beperkingen | Ondersteund met beperkingen |
TijdstempelNTZ | Ondersteund | Databricks Runtime 14.1+ | Delta Sharing Spark-connector 3.3+ |
Liquid clustering | Ondersteund met beperkingen | Ondersteund met beperkingen | Ondersteund met beperkingen |
Veelgestelde vragen over Delta Sharing
Hieronder vindt u veelgestelde vragen over Delta Sharing.
Heb ik Unity Catalog nodig om Delta Sharing te kunnen gebruiken?
Nee, u hebt Unity Catalog niet nodig om (als provider) te delen of gedeelde gegevens te gebruiken (als ontvanger). Unity Catalog biedt echter voordelen zoals ondersteuning voor het delen van niet-tabellaire en AI-activa, out-of-the-box-governance, eenvoud en queryprestaties.
Providers kunnen gegevens op twee manieren delen:
Plaats de assets die u wilt delen onder Unity Catalog-beheer en deel ze met behulp van de ingebouwde Azure Databricks Delta Sharing-server.
U hoeft niet alle assets te migreren naar Unity Catalog. U hebt slechts één Azure Databricks-werkruimte nodig die is ingeschakeld voor Unity Catalog om assets te beheren die u wilt delen. In sommige accounts worden nieuwe werkruimten automatisch ingeschakeld voor Unity Catalog. Zie Automatische activering van Unity Catalog.
Implementeer de open Delta Sharing-server om gegevens te delen, zonder dat u uw Azure Databricks-account hoeft te gebruiken.
Ontvangers kunnen gegevens op twee manieren gebruiken:
Zonder een Databricks-werkruimte. Open source Delta Sharing-connectors gebruiken die beschikbaar zijn voor veel gegevensplatforms, waaronder Power BI, pandas en open source Apache Spark. Zie Gegevens lezen die zijn gedeeld via Delta Sharing openlijke delen (voor ontvangers) en het Delta Sharing open-sourceproject.
In een Azure Databricks-werkruimte. Werkruimten van geadresseerden hoeven niet te worden ingeschakeld voor Unity Catalog, maar er zijn voordelen op het gebied van governance, eenvoud en prestaties als ze dat wel zijn.
Ontvangers die deze voordelen willen, hoeven niet alle assets te migreren naar Unity Catalog. U hebt slechts één Azure Databricks-werkruimte nodig die is ingeschakeld voor Unity Catalog om assets te beheren die met u worden gedeeld. In sommige accounts worden nieuwe werkruimten automatisch ingeschakeld voor Unity Catalog. Zie Automatische activering van Unity Catalog.
Zie Gegevens lezen die worden gedeeld met open delen met Delta Sharing (voor ontvangers) en Gegevens lezen die worden gedeeld met Databricks-to-Databricks Delta Sharing (voor ontvangers).
Moet ik een Databricks-klant zijn om Delta Sharing te kunnen gebruiken?
Nee, Delta Sharing is een open protocol. U kunt niet-Databricks-gegevens delen met ontvangers op elk gegevensplatform. Providers kunnen een open Delta Sharing-server configureren om te delen vanaf elk computerplatform. Ontvangers kunnen gedeelde gegevens gebruiken met behulp van open source Delta Sharing-connectors voor veel gegevensproducten, waaronder Power BI, pandas en open source Spark.
Het gebruik van Delta Sharing in Azure Databricks, met name delen vanuit een werkruimte met Unity Catalog- functionaliteit, heeft echter veel voordelen.
Zie de eerste vraag in deze veelgestelde vragen voor meer informatie.
Worden er voor Delta Sharing kosten in rekening voor uitgaand verkeer?
Voor Delta Sharing binnen een regio worden geen kosten voor uitgaand verkeer in rekening gebracht. In tegenstelling tot andere platforms voor het delen van gegevens, vereist Delta Sharing geen gegevensreplicatie. Dit model heeft veel voordelen, maar het betekent dat uw cloudleverancier kosten voor uitgaande gegevens kan in rekening brengen wanneer u gegevens deelt in clouds of regio's. Azure Databricks biedt ondersteuning voor delen vanuit Cloudflare R2, waarvoor geen uitgaande kosten in rekening worden gebracht, en biedt andere hulpprogramma's en aanbevelingen voor het bewaken en voorkomen van uitgaande kosten. Zie Kosten voor uitgaand verkeer van Delta Sharing bewaken en beheren (voor providers).
Kunnen providers de toegang tot ontvangers intrekken?
Ja, toegang tot geadresseerden kan op aanvraag en op opgegeven granulariteitsniveaus worden ingetrokken. U kunt de toegang van ontvangers tot specifieke gedeelde mappen en specifieke IP-adressen weigeren, tabelgegevens voor een ontvanger filteren, ontvangers-tokens intrekken, en ontvangers volledig verwijderen. Zie Toegang voor ontvangers tot een share intrekken en Gegevensontvangers maken en beheren voor Delta Sharing.
Is het niet onveilig om vooraf ondertekende URL's te gebruiken?
Delta Sharing maakt gebruik van vooraf ondertekende URL's om tijdelijke toegang te bieden tot een bestand in objectopslag. Ze worden alleen gegeven aan geadresseerden die al toegang hebben tot de gedeelde gegevens. Ze zijn veilig omdat ze kortlevend zijn en het toegangsniveau niet uitbreiden buiten wat ontvangers al hebben gekregen.
Zijn de tokens die worden gebruikt in het Open Sharing-protocol voor delen van Delta veilig?
Omdat Delta Delen platformoverschrijdend delen mogelijk maakt, in tegenstelling tot andere beschikbare platformen voor het delen van gegevens, is voor het protocol voor delen een open token vereist. Providers kunnen beveiliging van tokens garanderen door de levensduur van het token te configureren, netwerkbesturingselementen in te stellen en toegang op aanvraag in te schakelen. Bovendien breidt het token het toegangsniveau niet uit buiten wat de ontvangers al is verleend. Bekijk Beveiligingsoverwegingen voor tokens.
Als u liever geen tokens gebruikt om de toegang tot shares van ontvangers te beheren, kunt u Databricks-to-Databricks delen gebruiken of contact opnemen met uw Databricks-accountteam voor alternatieven.
Biedt Delta Sharing ondersteuning voor het delen van weergaven?
Ja, Delta Sharing biedt ondersteuning voor het delen van weergaven. Zie Weergaven toevoegen aan een share-.
Neem contact op met uw Databricks-accountteam voor meer informatie over geplande verbeteringen voor het weergeven van delen.
Beperkingen
- Tabelgegevens moeten de Delta-tabelindeling hebben. U kunt Parquet-tabellen eenvoudig converteren naar Delta en weer terug. Zie CONVERT TO DELTA.
- Delta Sharing ondersteunt tabellen die gebruikmaken van liquide clustering en V2-controlepunten, met de volgende beperkingen:
- Ontvangers kunnen alleen momentopnamequery's uitvoeren. Ze kunnen geen gegevensfeed (CDF) of streamingquery's uitvoeren.
- Providers kunnen de tabel niet delen met partitiefiltering.
- Providers kunnen R2-tabellen niet delen met liquid clustering en V2-controlepunt.
- Tabelbeperkingen (beperkingen voor primaire en refererende sleutels) zijn niet beschikbaar in gedeelde tabellen.
- Deelbare weergaven moeten worden gedefinieerd in Delta-tabellen of andere deelbare weergaven. Zie Weergaven toevoegen aan een share- (voor providers) en Gedeelde weergaven lezen (voor ontvangers).
- Delen van notitieblokken wordt alleen ondersteund in het delen van Databricks-naar-Databricks. Zie Notitieblokbestanden toevoegen aan een gedeeld bestand en Gegevens lezen die met Databricks-to-Databricks Delta Sharing (voor ontvangers) worden gedeeld.
- Het delen van volumes wordt alleen ondersteund bij het delen van Databricks naar Databricks. Zie Volumes toevoegen in een share (voor aanbieders) en Gegevens lezen die worden gedeeld met Databricks-to-Databricks Delta Sharing (voor ontvangers).
- Het delen van modellen wordt alleen ondersteund bij het delen van Databricks naar Databricks. Zie Modellen toevoegen aan een share (voor providers) en Gegevens lezen die via Databricks-to-Databricks Delta Sharing worden gedeeld (voor ontvangers).
- Er gelden limieten voor het aantal bestanden in metagegevens dat is toegestaan voor een gedeelde tabel. Zie voor meer informatie fouten bij overschrijden van de resource-limiet.
- Schema's met de naam
information_schema
kunnen niet worden geïmporteerd in een Unity Catalog-metastore, omdat die schemanaam is gereserveerd in Unity Catalog. - Het delen van
SHALLOW CLONE
tabellen wordt niet ondersteund door Delta Sharing. Azure Databricks biedt geen ondersteuning voor vooraf toegewezen URL's voor Delta-logboeken die verwijzen naar absolute paden.
Zie ook de ondersteuningsmatrix voor Delta Lake-functies.
Resourcequota
Azure Databricks dwingt resourcequota af voor alle beveiligbare objecten voor Delta Sharing. Deze quota worden vermeld in resourcelimieten. Als u verwacht deze resourcelimieten te overschrijden, neemt u contact op met uw Azure Databricks-accountteam.
U kunt uw quotumgebruik bewaken met behulp van de quota-API's voor Unity Catalog-resources. Zie Het gebruik van quota's voor Unity Catalog-resources controleren.