Configurare l'accesso ai dati per l'inserimento
Questo articolo descrive come gli utenti amministratori possono configurare l'accesso ai dati in un contenitore in Azure Data Lake Storage Gen2 (ADLS Gen2) in modo che gli utenti di Azure Databricks possano caricare dati da ADLS Gen2 in una tabella in Azure Databricks.
Questo articolo descrive i modi seguenti per configurare l'accesso sicuro ai dati di origine:
(Scelta consigliata) Creare un volume del catalogo Unity.
Creare un percorso esterno del catalogo Unity con credenziali di archiviazione.
Avviare una risorsa di calcolo che usa un'entità servizio.
Generare credenziali temporanee (un token di firma di accesso condiviso BLOB).
Operazioni preliminari
Prima di configurare l'accesso ai dati in ADLS Gen2, assicurarsi di disporre degli elementi seguenti:
Dati in un contenitore nell'account di archiviazione di Azure. Per creare un contenitore, vedere Creare un contenitore nella documentazione di Archiviazione di Azure.
Per accedere ai dati usando un volume di Unity Catalog (scelta consigliata), il
READ VOLUME
privilegio per il volume. Per altre informazioni, vedere Che cosa sono i volumi del catalogo Unity? e i privilegi e gli oggetti a protezione diretta di Unity.Per accedere ai dati usando una posizione esterna di Unity Catalog, il
READ FILES
privilegio nella posizione esterna. Per ulteriori informazioni, vedere Creare una posizione esterna per connettere la memorizzazione cloud ad Azure Databricks.Per accedere ai dati usando una risorsa di calcolo con un'entità servizio, autorizzazioni di amministratore dell'area di lavoro di Azure Databricks.
Per accedere ai dati usando credenziali temporanee:
- Autorizzazioni di amministratore dell'area di lavoro di Azure Databricks.
- Autorizzazioni nell'account Azure per creare token di firma di accesso condiviso BLOB. In questo modo è possibile generare credenziali temporanee.
Databricks SQL Warehouse. Per creare un'istanza di SQL Warehouse, vedere Creare un'istanza di SQL Warehouse.
Familiarità con l'interfaccia utente di Databricks SQL.
Configurare l'accesso all'archiviazione cloud
Usare uno dei metodi seguenti per configurare l'accesso ad ADLS Gen2:
(Scelta consigliata) Creare un volume del catalogo Unity. Per altre informazioni, vedere Che cosa sono i volumi di Catalogo Unity?.
Configurare un percorso esterno del catalogo Unity con credenziali di archiviazione. Per altre informazioni sulle posizioni esterne, vedere Creare una posizione esterna per connettere l'archiviazione cloud ad Azure Databricks.
Configurare una risorsa di calcolo per l'uso di un'entità servizio. Per altre informazioni, vedere Configurare un'entità servizio.
Generare credenziali temporanee (un token di firma di accesso condiviso BLOB) da condividere con altri utenti di Azure Databricks. Per altre informazioni, vedere Generare credenziali temporanee per l'inserimento.
Eseguire la pulizia
È possibile pulire le risorse associate nell'account cloud e Azure Databricks se non si vogliono più mantenerle.
Eliminare l'account di archiviazione di ADLS Gen2
- Aprire il portale di Azure per l'account Azure, in genere all'indirizzo https://portal.azure.com.
- Passare a e aprire l'account di archiviazione.
- Fai clic su Elimina.
- Immettere il nome dell'account di archiviazione e quindi fare clic su Elimina.
Arrestare SQL Warehouse
Se non si usa SQL Warehouse per altre attività, è consigliabile arrestare sql warehouse per evitare costi aggiuntivi.
- Nella barra laterale dell'utente SQL fare clic su SQL Warehouse.
- Accanto al nome di SQL Warehouse, fare clic su Arresta.
- Quando richiesto, fare di nuovo clic su Arresta .
Passaggi successivi
Dopo aver completato i passaggi descritti in questo articolo, gli utenti possono eseguire il COPY INTO
comando per caricare i dati dal contenitore ADLS Gen2 nell'area di lavoro di Azure Databricks.
Per caricare dati usando un volume di Unity Catalog o un percorso esterno, vedere Caricare dati usando COPY INTO con volumi del catalogo Unity o posizioni esterne.
Per caricare dati usando un'entità servizio con un'entità servizio, vedere Caricare dati usando COPY INTO con un'entità servizio.
Per caricare i dati usando credenziali temporanee (un token di firma di accesso condiviso BLOB), vedere Caricare i dati usando COPY INTO con credenziali temporanee.