Gegevenstoegang configureren voor opname
In dit artikel wordt beschreven hoe beheerders de toegang tot gegevens in een container in Azure Data Lake Storage Gen2 (ADLS Gen2) kunnen configureren, zodat Azure Databricks-gebruikers gegevens uit ADLS Gen2 kunnen laden in een tabel in Azure Databricks.
In dit artikel worden de volgende manieren beschreven om beveiligde toegang tot brongegevens te configureren:
(Aanbevolen) Maak een Unity Catalog-volume.
Maak een externe locatie voor de Unity-catalogus met een opslagreferentie.
Start een rekenresource die gebruikmaakt van een service-principal.
Tijdelijke referenties genereren (een Blob SAS-token).
Voordat u begint
Voordat u de toegang tot gegevens in ADLS Gen2 configureert, moet u het volgende hebben:
Gegevens in een container in uw Azure-opslagaccount. Zie Een container maken in de Documentatie voor Azure Storage om een container te maken.
Voor toegang tot gegevens met behulp van een Unity Catalog-volume (aanbevolen), de
READ VOLUME
bevoegdheid op het volume. Zie Wat zijn Unity Catalog-volumes? en Unity Catalog-bevoegdheden en beveiligbare objecten voor meer informatie.Voor toegang tot gegevens met behulp van een externe locatie van Unity Catalog, de
READ FILES
bevoegdheid op de externe locatie. Zie Een externe locatie maken om cloudopslag te verbinden met Azure Databricks voor meer informatie.Beheerdersmachtigingen voor Azure Databricks-werkruimten voor toegang tot gegevens met behulp van een rekenresource met een service-principal.
Toegang krijgen tot gegevens met behulp van tijdelijke referenties:
- Beheerdersmachtigingen voor Azure Databricks-werkruimten.
- Machtigingen in uw Azure-account voor het maken van Blob SAS-tokens. Hiermee kunt u tijdelijke referenties genereren.
Een Databricks SQL Warehouse. Zie Een SQL-warehouse maken om een SQL-warehouse te maken.
Bekendheid met de Sql-gebruikersinterface van Databricks.
Toegang tot cloudopslag configureren
Gebruik een van de volgende methoden om toegang tot ADLS Gen2 te configureren:
(Aanbevolen) Maak een Unity Catalog-volume. Zie Wat zijn Unity Catalog-volumes? voor meer informatie.
Configureer een externe locatie van Unity Catalog met een opslagreferentie. Zie Een externe locatie maken om cloudopslag te verbinden met Azure Databricks voor meer informatie over externe locaties.
Configureer een rekenresource voor het gebruik van een service-principal. Zie Een service-principal configureren voor meer informatie.
Genereer tijdelijke referenties (een Blob SAS-token) om te delen met andere Azure Databricks-gebruikers. Zie Tijdelijke referenties genereren voor opname voor meer informatie.
Opschonen
U kunt de gekoppelde resources in uw cloudaccount en Azure Databricks opschonen als u ze niet meer wilt behouden.
Het ADLS Gen2-opslagaccount verwijderen
- Open de Azure-portal voor uw Azure-account, meestal op https://portal.azure.com.
- Blader naar en open uw opslagaccount.
- Klik op Verwijderen.
- Voer de naam van het opslagaccount in en klik vervolgens op Verwijderen.
Het SQL-warehouse stoppen
Als u het SQL Warehouse niet gebruikt voor andere taken, moet u het SQL Warehouse stoppen om extra kosten te voorkomen.
- Klik in de SQL-persona op de zijbalk op SQL Warehouses.
- Klik naast de naam van het SQL Warehouse op Stoppen.
- Wanneer u hierom wordt gevraagd, klikt u nogmaals op Stoppen .
Volgende stappen
Nadat u de stappen in dit artikel hebt voltooid, kunnen gebruikers de COPY INTO
opdracht uitvoeren om de gegevens uit de ADLS Gen2-container in uw Azure Databricks-werkruimte te laden.
Zie Gegevens laden met behulp van COPY INTO met Unity Catalog-volumes of externe locatiesom gegevens te laden met behulp van een Unity Catalog-volume of externe locatie.
Zie Gegevens laden met een SQL Warehouse en een service-principal door COPY INTO te gebruiken.
Als u gegevens wilt laden met behulp van tijdelijke referenties (een Blob SAS-token), raadpleegt u Gegevens laden met behulp van COPY INTO met tijdelijke referenties.