Een externe locatie maken voor gegevens in dbFS-hoofdmap
In dit artikel wordt beschreven hoe u een externe locatie in Unity Catalog configureert om de toegang tot uw DBFS-hoofdmap opslaglocatie te beheren. Hoewel Databricks aanraadt om geen gegevens op te slaan in de DBFS-hoofdopslag, kan uw werkruimte dit doen vanwege verouderde praktijken.
Externe locaties zijn beveiligbare objecten in Unity Catalog die opslagreferenties koppelen aan opslagcontainers voor cloudobjecten. Externe locaties worden gebruikt voor het definiëren van beheerde opslaglocaties voor beheerde tabellen en volumes en voor het beheren van de toegang tot de opslaglocaties die externe tabellen en externe volumes bevatten.
U moet een externe locatie maken als uw verouderde Azure Databricks Hive-metastore gegevens opslaat in de DBFS-hoofdmap en u uw verouderde Hive-metastore wilt federeren, zodat uw team kan werken met uw Hive-metastoretabellen met behulp van Unity Catalog. Zie Hive metastore-federatie: schakel Unity Catalog in om tabellen te beheren die geregistreerd zijn in een Hive-metastore en Schakel Hive metastore-federatie in voor een verouderde Hive-metastore.
voordat u begint
Als u een externe locatie voor de DBFS-hoofdmap wilt maken, moet u een opslagreferentie hebben gedefinieerd in Unity Catalog die toegang geeft tot de cloudopslaglocatie van de DBFS-hoofdmap. Als u er nog geen hebt, kan het systeem er een voor u maken tijdens het maken van de externe locatie.
vereisten voor machtigingen:
U moet de
CREATE STORAGE CREDENTIAL
enCREATE EXTERNAL LOCATION
bevoegdheden voor de metastore hebben. Metastore-beheerders hebben deze bevoegdheden standaard.Notitie
Als er al een opslagreferentie voor de opslaglocatie van de DBFS-hoofdmap bestaat, heeft de gebruiker die de externe locatie maakt geen
CREATE STORAGE CREDENTIAL
nodig, maar heeftCREATE EXTERNAL LOCATION
nodig voor zowel de opslagreferentie als de metastore.Je moet een beheerder van de werkruimte zijn opdat het systeem de opslagreferenties voor je kan aanmaken bij het creëren van de externe locatie.
U hoeft geen werkruimtebeheerder te zijn als er al een opslagreferentie is die toegang geeft tot de DBFS-hoofdopslaglocatie en u
CREATE EXTERNAL LOCATION
hebt voor zowel de opslagreferentie als de metastore.
De externe locatie maken
U kunt Catalog Explorer gebruiken om een externe locatie te maken voor de DBFS-hoofdmap.
Klik in de zijbalk op
Catalogus.
Klik op Externe gegevens > en Externe locatie maken.
Voer een externe locatienaam in.
Bij URL, klik op Kopiëren vanuit DBFS-koppeling en selecteer Kopiëren vanuit DBFS-hoofdmap.
De URL- en subpad-velden worden gevuld met het pad voor cloudopslag naar de DBFS-hoofdmap.
Belangrijk
Wanneer u een externe locatie voor de DBFS-hoofdmap maakt, moet u het subpad gebruiken naar de DBFS-hoofdlocatie, niet het pad naar de hele bucket. Het subpad is vooraf ingevuld met
user/hive/warehouse
. Dit is een standaardopslaglocatie voor Hive-metastore-tabellen. Als u meer gedetailleerd toegangsbeheer wilt voor de gegevens in de DBFS-hoofdmap, kunt u afzonderlijke externe locaties maken voor subpaden in de DBFS-hoofdmap.Waarschuwing
Uw DBFS-hoofdmap kan worden opgeslagen in Azure Blob Storage in plaats van Azure Data Lake Storage Gen2. Deze locaties worden geopend met behulp van het
wasb
-stuurprogramma, die geen besturingselementen op map- of bestandsniveau toestaat. Daarom kan Unity Catalog alleen toegangsbeheer afdwingen op containerniveau, wat betekent dat gebruikers met toegang tot deze externe locatie mogelijk toegang hebben tot andere gegevens in dezelfde container als ze clusters met de modus voor toegang tot één gebruiker gebruiken. Om dit te voorkomen, dwingt u het gebruik van clusters in de gedeelde toegangsmodus, SQL-magazijnen of serverloze berekeningen af.Selecteer, als er geen is gedefinieerd, een opslagreferentie die toegang verleent tot de DBFS-hoofdcloudopslaglocatie, of klik op + Nieuwe opslagreferentie maken.
Als u de opslagreferentie wilt maken, selecteert u een referentietype van DBFS-hoofdmap. Er wordt automatisch een opslagreferentie gemaakt wanneer u de externe locatie opslaat.
(Optioneel) Voeg een opmerking toe.
(Optioneel) Klik op Geavanceerde opties en schakel de terugvalmodus in.
De terugvalmodus is bedoeld voor migratiescenario's met verouderde workloads. Zie Terugvalmodus inschakelen op externe locaties.
Klik op maken.
Ga naar het tabblad Machtigingen om toestemming te verlenen voor het gebruik van de externe locatie.
- Klik op Grant.
- Selecteer gebruikers, groepen of service-principals in het Principals-veld en selecteer de bevoegdheid die u wilt verlenen.
- Klik op Grant.
(Optioneel) Stel de werkruimten in die toegang hebben tot deze externe locatie.
Standaard kunnen gebruikers in elke werkruimte die gebruikmaakt van deze Unity Catalog-metastore toegang krijgen tot de gegevens op deze locatie. U kunt die toegang tot specifieke werkruimten beperken. Databricks raadt aan om de toegang tot de werkruimte te beperken waarin de DBFS-hoofdmap zich bevindt.
Zie Een externe locatie koppelen aan een of meer werkruimten.