Konfigurera dataåtkomst för inmatning
Den här artikeln beskriver hur administratörsanvändare kan konfigurera åtkomst till data i en container i Azure Data Lake Storage Gen2 (ADLS Gen2) så att Azure Databricks-användare kan läsa in data från ADLS Gen2 till en table i Azure Databricks.
I den här artikeln beskrivs följande sätt att konfigurera säker åtkomst till källdata:
(Rekommenderas) Skapa en Unity-Catalog volym.
Skapa en extern plats för Unity Catalog med en lagringsbehörighet.
Starta en beräkningsresurs som använder tjänstens huvudnamn.
Generate tillfällig credentials (en Blob SAS-token).
Innan du börjar
Kontrollera att du har följande innan du konfigurerar åtkomst till data i ADLS Gen2:
Data i en container i ditt Azure Storage-konto. Information om hur du skapar en container finns i Skapa en container i Azure Storage-dokumentationen.
Om du vill komma åt data med hjälp av en volym av Unity-Catalog (rekommenderas) krävs
READ VOLUME
-behörighet på volymen. Mer information finns i Vad är Unity Catalogvolumes? och Unity Catalog privilegier och skyddsbara objekt.För att få åtkomst till data med en Unity Catalog extern plats behöver man ha
READ FILES
-behörighet på den externa platsen. Mer information finns i Skapa en extern plats för att ansluta molnlagring till Azure Databricks.Om du vill komma åt data med hjälp av en beräkningsresurs med tjänstens huvudnamn, har administratörsbehörigheter för Azure Databricks-arbetsytan.
Så här kommer du åt data med hjälp av tillfälliga credentials:
- Administratörsbehörigheter för Azure Databricks-arbetsytan.
- Behörigheter i ditt Azure-konto för att skapa Blob SAS-token. Detta gör att du kan generate tillfälliga credentials.
Ett Databricks SQL-lager. Information om hur du skapar ett SQL-lager finns i Skapa ett SQL-lager.
Kunskaper om Databricks SQL-användargränssnittet.
Konfigurera åtkomst till molnlagring
Använd någon av följande metoder för att konfigurera åtkomst till ADLS Gen2:
(Rekommenderas) Skapa en Unity-Catalog volym. Mer information finns i Vad är Unity Catalogvolumes?.
Konfigurera en Unity Catalog extern plats med en lagringsreferens. Mer information om externa platser finns i Skapa en extern plats för att ansluta molnlagring till Azure Databricks.
Konfigurera en beräkningsresurs så att den använder tjänstens huvudnamn. Mer information finns i Konfigurera ett huvudnamn för tjänsten.
Generate tillfällig credentials (en Blob SAS-token) att dela med andra Azure Databricks-användare. Mer information finns i Generate tillfälliga credentials för intag.
Rensa
Du kan rensa de associerade resurserna i ditt molnkonto och Azure Databricks om du inte längre vill behålla dem.
Ta bort ADLS Gen2-lagringskontot
- Öppna Azure Portal för ditt Azure-konto, vanligtvis på https://portal.azure.com.
- Bläddra till och öppna ditt lagringskonto.
- Klicka på Ta bort.
- Ange namnet på lagringskontot och klicka sedan på Ta bort.
Stoppa SQL-informationslagret
Om du inte använder SQL-lagret för andra uppgifter bör du stoppa SQL-lagret för att undvika ytterligare kostnader.
- I SQL-personan går du till sidofältet och klickar på SQL Warehouses.
- Bredvid namnet på SQL-lagret klickar du på Stoppa.
- När du uppmanas till det klickar du på Stoppa igen.
Nästa steg
När du har slutfört stegen i den här artikeln kan användarna köra COPY INTO
kommandot för att läsa in data från ADLS Gen2-containern till din Azure Databricks-arbetsyta.
För att läsa in data med en Unity-Catalog volym eller en extern plats, se Läsa in data med COPY INTO med Unity Catalogvolumes eller externa ställen.
Information om hur du läser in data med hjälp av ett SQL-lager med tjänstens huvudnamn finns i Läsa in data med hjälp av COPY INTO med ett tjänsthuvudnamn.
För att läsa in data med hjälp av tillfälliga credentials (en Blob SAS-token), se Läsa in data med hjälp av COPY INTO med tillfälliga credentials.