Creare un servizio collegato per Azure Databricks
Per eseguire notebook in un'area di lavoro di Azure Databricks, la pipeline di Azure Data Factory deve essere in grado di connettersi all'area di lavoro, e questo richiede un'autenticazione. Per abilitare questa connessione autenticata, è necessario eseguire due attività di configurazione:
- Generare un token di accesso per l'area di lavoro di Azure Databricks.
- Creare un servizio collegato nella risorsa di Azure Data Factory che usa il token di accesso per connettersi ad Azure Databricks.
Generazione di un token di accesso
Un token di accesso fornisce un metodo di autenticazione per Azure Databricks come alternativa alle credenziali sotto forma di nome utente e password. È possibile generare token di accesso per le applicazioni, specificando un periodo di scadenza dopo il quale il token deve essere rigenerato e aggiornato nelle applicazioni client.
Per creare un token di accesso, usare l'opzione Genera nuovo token nella scheda Sviluppatore della pagina Impostazioni utente nel portale di Azure Databricks.
Creazione di un servizio collegato
Per connettersi ad Azure Databricks da Azure Data Factory, è necessario creare un servizio collegato per l'ambiente di calcolo di Azure Databricks. È possibile creare un servizio collegato nella pagina Servizi collegati nella sezione Gestione di Azure Data Factory Studio.
Quando si crea un servizio collegato di Azure Databricks, è necessario specificare le impostazioni di configurazione seguenti:
Impostazione | Description |
---|---|
Name | Un nome univoco per il servizio collegato. |
Descrizione | Una descrizione significativa. |
Runtime di integrazione | Il runtime di integrazione usato per eseguire attività nel servizio collegato. Per altre informazioni, vedere Runtime di integrazione in Azure Data Factory. |
Sottoscrizione di Azure | La sottoscrizione di Azure in cui viene effettuato il provisioning di Azure Databricks. |
Area di lavoro di Databricks | L'area di lavoro di Azure Databricks. |
Cluster | Il cluster Spark in cui verrà eseguito il codice dell'attività. È possibile configurare il provisioning dinamico di un cluster di processi su richiesta in Azure Databricks oppure è possibile specificare un cluster esistente nell'area di lavoro. |
Tipo di autenticazione | Il modo in cui la connessione collegata verrà autenticata da Azure Databricks, ad esempio tramite un token di accesso. In questo caso, è necessario specificare il token di accesso generato per l'area di lavoro. |
Configurazione del cluster | La versione del runtime di Databricks, la versione Python, il tipo di nodo di lavoro e il numero di nodi di lavoro per il cluster. |