Toegang tot cloudopslag beheren met behulp van Unity Catalog
Dit artikel bevat een overzicht van het gebruik van Unity Catalog voor het beheren van toegang tot cloudopslag vanuit Azure Databricks. Het introduceert de concepten van externe locatie, opslagreferenties en beheerde opslag.
Notitie
Als u Unity Catalog wilt gebruiken om de toegang tot een externe service in plaats van cloudopslag te beheren, raadpleegt u Toegang tot externe cloudservices beheren met behulp van servicereferenties.
externe locaties en opslagreferenties
Alle gegevens die onder Unity Catalog vallen, moeten zich in de cloudopslag in uw cloudprovideraccount bevinden. Unity Catalog bepaalt de toegang tot cloudopslag met behulp van een beveiligbaar object dat een externe locatie wordt genoemd. Hiermee definieert u een pad naar een cloudopslaglocatie en de referenties die nodig zijn voor toegang tot die locatie. Deze referenties worden op hun beurt gedefinieerd in een beveiligbaar object voor Unity Catalog, een opslagreferentie genoemd. Door toegang te verlenen en in te roepen tot externe locatiebeveiligingen in Unity Catalog, beheert u de toegang tot de gegevens in de cloudopslaglocatie. Door toegang tot opslagreferenties te verlenen en in te roepen in Unity Catalog, kunt u de mogelijkheid beheren om externe locatieobjecten te maken.
Hier volgt een beetje meer informatie over deze twee beveiligbare objecten:
- Een opslagreferentie vertegenwoordigt een verificatie- en autorisatiemechanisme voor toegang tot gegevens die zijn opgeslagen in uw cloudtenant, met behulp van een door Azure beheerde identiteit of service-principal voor Azure Data Lake Storage Gen2-containers of een R2 API-token voor Cloudflare R2-buckets. Bevoegdheden die zijn verleend in Unity Catalog bepalen welke gebruikers en groepen de referentie kunnen gebruiken om externe locaties te definiƫren. Machtigingen voor het maken en gebruiken van opslagreferenties mogen alleen worden verleend aan gebruikers die externe locatieobjecten moeten maken. Zie Een opslagreferentie maken om verbinding te maken met Azure Data Lake Storage Gen2 en een opslagreferentie maken om verbinding te maken met Cloudflare R2.
- Een externe locatie combineert een cloudopslagpad met een opslagreferentie waarmee toegang tot het cloudopslagpad wordt geautoriseerd. Bevoegdheden die zijn verleend in Unity Catalog bepalen welke gebruikers en groepen toegang hebben tot het cloudopslagpad dat is gedefinieerd door de externe locatie. Machtigingen voor het maken en gebruiken van externe locaties mogen alleen worden verleend aan gebruikers die externe tabellen, externe volumes of beheerde opslaglocaties moeten maken. Zie Een externe locatie maken om cloudopslag te verbinden met Azure Databricks.
Externe locaties worden gebruikt in Unity Catalog voor externe gegevensassets, zoals externe tabellen en externe volumes, en voor beheerde gegevensassets, zoals beheerde tabellen en beheerde volumes. Zie Wat zijn tabellen en weergaven? En wat zijn Unity Catalog-volumes voor meer informatie over het verschil tussen externe en beheerde gegevensassets in Unity Catalog.
Zie Externe locaties, externe tabellen en externe volumes beheren voor meer informatie over aanbevolen procedures voor het gebruik van externe locaties.
Externe locaties gebruiken wanneer u externe tabellen en volumes maakt
Externe tabellen en externe volumes die zijn geregistreerd in Unity Catalog, verwijzen in wezen naar gegevens in cloudopslag die u buiten Azure Databricks beheert. Wanneer u een externe tabel of extern volume in Unity Catalog maakt, moet u verwijzen naar een cloudopslagpad dat is opgenomen in een extern locatieobject waarvoor u voldoende bevoegdheden hebt gekregen. Zie Wat zijn tabellen en weergaven? En wat zijn Unity Catalog-volumes voor meer informatie over het verschil tussen externe en beheerde gegevensassets in Unity Catalog. Zie Machtigingen verlenen op een externe locatie voor bevoegdheden.
Externe locaties gebruiken wanneer u beheerde opslag maakt
Beheerde tabellen en beheerde volumes worden volledig beheerd door Unity Catalog. Ze worden standaard opgeslagen in een beheerde opslaglocatie, die kan worden gedefinieerd op metastore-, catalogus- of schemaniveau. Wanneer u een beheerde opslaglocatie toewijst aan een metastore, catalogus of schema, moet u verwijzen naar een extern locatieobject en moet u over voldoende bevoegdheden beschikken om deze te kunnen gebruiken. Zie Geef een beheerde opslaglocatie op in de aanbevolen procedures voor Unity Catalog en Unity Catalog.
Werkstroom voor het beheren van toegang tot cloudopslag in Unity Catalog
Ga als volgt te werk om de toegang tot cloudopslag te beheren met behulp van Unity Catalog:
- Maak een opslagreferentieobject dat een door Azure beheerde identiteit inkapselt die toegang geeft tot het cloudopslagpad.
- Maak een extern locatieobject dat verwijst naar het opslagpad en het opslagreferentieobject.
- Verwijs naar een pad dat is opgenomen in de externe locatie wanneer u externe tabellen, externe volumes of standaard beheerde opslaglocaties maakt. Dit kan het exacte pad zijn dat is gedefinieerd op de externe locatie of een subpad.
Volgende stappen
- Een opslagreferentie maken om verbinding te maken met Azure Data Lake Storage Gen2
- Een opslagreferentie maken om verbinding te maken met Cloudflare R2
- Een externe locatie maken om cloudopslag te verbinden met Azure Databricks
- Een beheerde opslaglocatie opgeven in Unity Catalog
- Opslagreferenties beheren
- Externe locaties beheren