線上到 Matillion
Matillion ETL 是專為雲端資料庫平臺所建置的 ETL/ELT 工具,包括 Azure Databricks。 Matillion ETL 具有現代化的瀏覽器型 UI,具有功能強大的下推式 ETL/ELT 功能。
您可以將 Databricks SQL 倉儲(先前稱為 Databricks SQL 端點)和 Azure Databricks 叢集與 Matillion 整合。
使用合作夥伴連線連線到 Matillion
本節說明如何使用 Partner Connect 來簡化將 Azure Databricks 工作區中現有 SQL 倉儲或叢集連線到 Matillion 的程式。
需求
連線的步驟
若要使用 Partner Connect 連線到 Matillion,請遵循本節中的步驟。
提示
如果您有現有的 Matillion 帳戶,Databricks 建議您手動聯機到 Matillion。 這是因為 Partner Connect 中的連線體驗已針對新的合作夥伴帳戶進行最佳化。
在側邊欄中,按一下 [Partner Connect]。
按兩下 [ Matillion ] 圖格。
[電子郵件] 方塊會顯示 Azure Databricks 帳戶的電子郵件地址。 Matillion 會使用此電子郵件位址提示您建立新的 Matillion 帳戶,或登入現有的 Matillion 帳戶。
按兩下 [ 連線到 Matillion ETL ] 或 [登入]。
新的索引標籤會在瀏覽器中開啟,其中顯示 Matillion 中樞。
完成 Matillion 中的螢幕指示,以建立 14 天的試用 Matillion 帳戶,或登入現有的 Matillion 帳戶。
重要
如果顯示錯誤,指出貴組織的某人已經建立與 Matillion 的帳戶,請連絡組織的其中一位系統管理員,並讓他們將您新增至組織的 Matillion 帳戶。 新增您之後,請登入您現有的 Matillion 帳戶。
完成畫面上的指示以提供您的作業詳細數據,然後按兩下 [ 繼續]。
完成建立組織的畫面指示,然後按兩下 [ 繼續]。
按兩下您所建立的組織,然後按兩下 [ 新增 Matillion ETL 實例]。
按兩下 [在 Azure 中繼續]。
Azure 入口網站隨即開啟。
請遵循 從 Matillion ETL 檔中的 Azure ARM 範本 啟動 Matillion ETL,從步驟 6 開始。
請遵循 Matillion ETL 檔中的指示。
Matillion ETL 會在瀏覽器中開啟,[ 建立專案 ] 對話框隨即顯示。
請遵循 在 Matillion 檔中建立 Databricks 專案 上的 Delta Lake。
如需這些指示內 Delta Lake Connection 區段中的設定,請輸入下列資訊:
- 針對 [ 工作區標識符],輸入 Azure Databricks 每個工作區 URL 的工作區標識符。 請勿在第一個“點”之後包含任何專案(
.
)。 請參閱工作區執行個體名稱、URL 和識別碼。 - 對於 [使用者名稱],輸入文字
token
。 - 針對 [ 密碼],輸入 Azure Databricks 個人存取令牌的值。
若要取得 工作區標識碼 併產生個人存取令牌,請執行下列動作:
返回瀏覽器中的 [合作夥伴連線] 索引標籤。
記下 工作區標識碼。
按兩下 [ 產生新的令牌]。
新的索引標籤會在瀏覽器中開啟,其中顯示 Azure Databricks UI 的 [設定 ] 頁面。
按一下 產生新權杖。
選擇性地輸入描述(批注)和到期期間。
按一下 產生。
複製產生的個人存取令牌,並將其儲存在安全的位置。
返回瀏覽器中的 [Matillion] 索引標籤。
針對這些指示內 Delta Lake Defaults 區段中的設定,針對 [叢集],選擇 SQL 倉儲或叢集的名稱。
- 針對 [ 工作區標識符],輸入 Azure Databricks 每個工作區 URL 的工作區標識符。 請勿在第一個“點”之後包含任何專案(
繼續進行後續步驟。
手動聯機到 Matillion
本節說明如何在 Azure Databricks 工作區中手動將現有的 SQL 倉儲或叢集連線到 Matillion。
注意
您可以使用合作夥伴連線來連線到 Matillion,以簡化體驗。
需求
在手動與 Matillion 整合之前,您必須具備下列專案:
Matillion ETL 實例,您可以使用 Azure Marketplace 或 Azure Resource Manager(ARM)來啟動該實例。
Azure Databricks 個人存取令牌或Microsoft Entra ID 令牌。
連線的步驟
若要手動連線到 Matillion,請執行下列動作:
取得工作區內您想要使用的現有計算資源名稱(SQL 倉儲或叢集)。 稍後,您將選擇該名稱,以完成計算資源與 Matillion ETL 實例之間的連線。
請遵循 在 Matillion 檔中建立 Databricks 專案 上的 Delta Lake。
如需這些指示內 Delta Lake Connection 區段中的設定,請輸入下列資訊:
- 針對 [ 工作區標識符],輸入 Azure Databricks 每個工作區 URL 的工作區標識符。 請勿在第一個“點”之後包含任何專案(
.
)。 請參閱工作區執行個體名稱、URL 和識別碼。 - 對於 [使用者名稱],輸入文字
token
。 - 針對 [密碼],輸入 Azure Databricks 個人存取令牌或Microsoft Entra ID 令牌。
針對這些指示內 Delta Lake Defaults 區段中的設定,針對 [叢集],選擇 SQL 倉儲或叢集的名稱。
- 針對 [ 工作區標識符],輸入 Azure Databricks 每個工作區 URL 的工作區標識符。 請勿在第一個“點”之後包含任何專案(
繼續進行後續步驟。
下一步
在 Matillion 網站上探索下列一或多個資源: