Creare un servizio collegato per Azure Databricks

Completato

Per eseguire notebook in un'area di lavoro di Azure Databricks, la pipeline di Azure Data Factory deve essere in grado di connettersi all'area di lavoro, e questo richiede un'autenticazione. Per abilitare questa connessione autenticata, è necessario eseguire due attività di configurazione:

  1. Generare un token di accesso per l'area di lavoro di Azure Databricks.
  2. Creare un servizio collegato nella risorsa di Azure Data Factory che usa il token di accesso per connettersi ad Azure Databricks.

Generazione di un token di accesso

Un token di accesso fornisce un metodo di autenticazione per Azure Databricks come alternativa alle credenziali sotto forma di nome utente e password. È possibile generare token di accesso per le applicazioni, specificando un periodo di scadenza dopo il quale il token deve essere rigenerato e aggiornato nelle applicazioni client.

Per creare un token di accesso, usare l'opzione Genera nuovo token nella scheda Sviluppatore della pagina Impostazioni utente nel portale di Azure Databricks.

A screenshot of the Access tokens tab in the User Settings page in the Azure Databricks portal.

Creazione di un servizio collegato

Per connettersi ad Azure Databricks da Azure Data Factory, è necessario creare un servizio collegato per l'ambiente di calcolo di Azure Databricks. È possibile creare un servizio collegato nella pagina Servizi collegati nella sezione Gestione di Azure Data Factory Studio.

A screenshot of the New linked service wizard in Azure Data Factory Studio.

Quando si crea un servizio collegato di Azure Databricks, è necessario specificare le impostazioni di configurazione seguenti:

Impostazione Description
Name Un nome univoco per il servizio collegato.
Descrizione Una descrizione significativa.
Runtime di integrazione Il runtime di integrazione usato per eseguire attività nel servizio collegato. Per altre informazioni, vedere Runtime di integrazione in Azure Data Factory.
Sottoscrizione di Azure La sottoscrizione di Azure in cui viene effettuato il provisioning di Azure Databricks.
Area di lavoro di Databricks L'area di lavoro di Azure Databricks.
Cluster Il cluster Spark in cui verrà eseguito il codice dell'attività. È possibile configurare il provisioning dinamico di un cluster di processi su richiesta in Azure Databricks oppure è possibile specificare un cluster esistente nell'area di lavoro.
Tipo di autenticazione Il modo in cui la connessione collegata verrà autenticata da Azure Databricks, ad esempio tramite un token di accesso. In questo caso, è necessario specificare il token di accesso generato per l'area di lavoro.
Configurazione del cluster La versione del runtime di Databricks, la versione Python, il tipo di nodo di lavoro e il numero di nodi di lavoro per il cluster.