Automatizzare la configurazione del catalogo Unity con Terraform
È possibile automatizzare la configurazione di Unity Catalog usando il provider Databricks Terraform. Questo articolo fornisce collegamenti alla guida alla distribuzione del catalogo Unity del provider Terraform e alla documentazione di riferimento sulle risorse, insieme ai requisiti ("Prima di iniziare") e ai suggerimenti per la convalida e la distribuzione.
Prima di iniziare
Per automatizzare la configurazione del catalogo Unity con Terraform, è necessario disporre degli elementi seguenti:
- L'account Azure Databricks deve trovarsi nel piano Premium.
- Nel tenant di Azure è necessario disporre dell'autorizzazione per creare:
- Un account di archiviazione da usare con Azure Data Lake Storage Gen2. Consulta per creare un account di archiviazione da usare con Azure Data Lake Storage Gen2.
- Una nuova risorsa per ospitare un'identità gestita assegnata dal sistema. È quindi necessario essere un
Contributor
oOwner
di un gruppo di risorse in qualsiasi sottoscrizione nel tenant.
Per usare il provider Databricks Terraform per configurare un metastore per Unity Catalog, l'archiviazione per il metastore, qualsiasi risorsa di archiviazione esterna e tutte le relative credenziali di accesso, è necessario disporre dei seguenti elementi:
- Un account Azure.
- Un utente amministratore a livello di account nell'account Azure.
- Nel computer di sviluppo locale è necessario disporre di:
Interfaccia della riga di comando di Terraform. Vedi Scarica Terraform sul sito Web di Terraform.
L'interfaccia della riga di comando di Azure accede tramite il comando
az login
con un utente che dispone dei dirittiContributor
oOwner
per la tua sottoscrizione. Consulta Come installare Azure CLI. Per accedere usando un'entità servizio Microsoft Entra ID, vedere accesso CLI di Azure con un'entità servizio Microsoft Entra ID. Per accedere usando un account utente di Azure Databricks, vedere accesso CLI di Azure con un account utente di Azure Databricks.Nota
Quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, è consigliabile eseguire l'accesso tramite il comando
az login
con un principale del servizio di Microsoft Entra ID. Vedere Accedere con un principal per il servizio e l'autenticazione con il principal del servizio di Azure.
Per usare il provider Databricks Terraform per configurare tutti gli altri componenti dell'infrastruttura di Unity Catalog, è necessario disporre degli elementi seguenti:
- Un'area di lavoro di Azure Databricks.
- Nel computer di sviluppo locale è necessario disporre di:
- Interfaccia della riga di comando di Terraform. Consultare Scaricare Terraform sul sito web di Terraform.
- Uno dei seguenti:
Interfaccia della riga di comando di Databricks versione 0.205 o successiva, configurata con Azure Databricks token di accesso personale eseguendo
databricks configure --host <workspace-url> --profile <some-unique-profile-name>
. Vedere Installare o aggiornare l'interfaccia della riga di comando di Databricks e l'autenticazione del token di accesso personale di Azure Databricks.Nota
Come procedura consigliata per la sicurezza, quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, Databricks consiglia di usare token di accesso personali appartenenti a entità servizio anziché utenti dell'area di lavoro. Per creare token per le entità di servizio, vedere Gestire i token per un'entità di servizio.
CLI di Azure, connessa tramite il comando
az login
. Consulta Come installare l'interfaccia a riga di comando di Azure. Per accedere utilizzando un'entità servizio Microsoft Entra ID, vedere accesso con l'interfaccia della riga di comando di Azure usando un'entità servizio Microsoft Entra ID. Per accedere usando un account utente di Azure Databricks, vedere accesso dell'interfaccia della riga di comando di Azure con un account utente di Azure Databricks.Nota
Quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, è una buona pratica di sicurezza accedere tramite il comando
az login
utilizzando un principale del servizio di Microsoft Entra ID. Vedi Accedi con un'entità servizio e l'autenticazione con l'entità servizio di Azure.Le due variabili di ambiente di Azure Databricks seguenti:
-
DATABRICKS_HOST
, impostato al valore dell'URL dell'istanza del tuo spazio di lavoro , per esempiohttps://dbc-1234567890123456.cloud.databricks.com
-
DATABRICKS_TOKEN
impostare sul valore del token di Azure Databricks token di accesso personale o l'ID Microsoft Entra (in precedenza Azure Active Directory). Vedi anche Monitorare e revocare i token di accesso personali.
Per impostare queste variabili di ambiente, vedere la documentazione del sistema operativo.
Nota
Come procedura consigliata per la sicurezza, quando si esegue l'autenticazione con strumenti automatizzati, sistemi, script e app, Databricks consiglia di usare token di accesso personali appartenenti a entità servizio anziché utenti dell'area di lavoro. Per creare token per le entità di servizio, consulta Gestire i token per un'entità di servizio.
-
Guida alla distribuzione del catalogo Unity del provider Terraform e documentazione di riferimento sulle risorse
Per informazioni su come distribuire tutti i prerequisiti e abilitare Unity Catalog per un'area di lavoro, vedere Distribuire risorse prerequisiti e abilitare Unity Catalog nella documentazione del provider Databricks Terraform.
Se sono già presenti alcuni componenti dell'infrastruttura del catalogo Unity, è possibile usare Terraform per distribuire componenti aggiuntivi dell'infrastruttura del catalogo Unity in base alle esigenze. Consulta ogni sezione della guida menzionata nel paragrafo precedente e la sezione Unity Catalog della documentazione del provider Databricks Terraform.
Convalidare, pianificare, distribuire o eliminare definitivamente le risorse
- Per convalidare la sintassi delle configurazioni terraform senza distribuirle, eseguire il comando
terraform validate
. - Per visualizzare le azioni eseguite da Terraform per distribuire le configurazioni, eseguire il comando
terraform plan
. Questo comando non distribuisce effettivamente le configurazioni. - Per distribuire le configurazioni, eseguire il comando
terraform deploy
. - Per eliminare le risorse distribuite, eseguire il comando
terraform destroy
.