建立 Azure Databricks 的連結服務
若要在 Azure Databricks 工作區中執行 Notebook,Azure Data Factory 管線必須能夠連線到工作區;這需要驗證。 若要啟用此已驗證的連線,您必須執行兩個設定工作:
- 為您的 Azure Databricks 工作區產生存取權杖。
- 在Azure Data Factory資源中建立連結的服務,該資源會使用存取權杖來連線到 Azure Databricks。
產生存取權杖
存取權杖會提供 Azure Databricks 的驗證方法,以替代使用者名稱和密碼形式的認證。 您可以為應用程式產生存取權杖,並指定到期期限,之後必須在用戶端應用程式中重新產生和更新權杖。
若要建立存取權杖,請在 Azure Databricks 入口網站 [使用者設定] 頁面,使用 [開發人員] 索引標籤上的 [產生新權杖] 選項。
建立連結服務
若要從 Azure Data Factory 連線到 Azure Databricks,您必須建立 Azure Databricks 計算的連結服務。 您可以在 Azure Data Factory Studio 的 [管理] 區段中的 [連結服務] 頁面中建立連結服務。
當您建立 Azure Databricks 連結服務時,您必須指定下列組態設定:
設定 | 描述 |
---|---|
Name | 連結服務的唯一名稱 |
描述 | 有意義的描述 |
整合執行階段 | 用來在此連結服務中執行活動的整合執行時間。 如需詳細資訊,請參閱 Azure Data Factory 中的整合執行階段。 |
Azure 訂用帳戶 | 佈建 Azure Databricks 所在的 Azure 訂用帳戶 |
Databricks 工作區 | Azure Databricks 工作區 |
Cluster | 將執行活動程式碼的 Spark 叢集。 您可以讓 Azure Databricks 視需要動態佈建作業叢集,也可以指定工作區中的現有叢集。 |
驗證類型 | Azure Databricks 驗證連結連線的方式。 例如,使用存取權杖 (在此情況下,您必須指定您為工作區產生的存取權杖)。 |
叢集組態 | Databricks 執行階段版本、Python 版本、背景工作節點類型和叢集的背景工作節點數目。 |