共用方式為


針對 Synapse Spark 集區使用外部 Hive 中繼存放區

注意

在 Synapse 中 Apache Spark 3.4 的 Azure Synapse Runtime 之後,後續版本將不再支援外部 Hive 中繼存放區。

Azure Synapse Analytics 允許相同工作區中的 Apache Spark 集區,共用受控 HMS (Hive 中繼存放區) 相容的中繼存放區作為其目錄。 當客戶想要將Hive目錄元數據保存在工作區外部,並與工作區外部的其他計算引擎共用目錄物件,例如 HDInsight 和 Azure Databricks 時,他們可以連線到外部 Hive 中繼存放區。 在本文中,您可以瞭解如何將 Synapse Spark 連線到外部 Apache Hive 中繼存放區。

支援的Hive中繼存放區版本

此功能適用於Spark 3.3。 下表顯示每個 Spark 版本支援的 Hive 中繼存放區版本。

Spark 版本 HMS 2.3.x HMS 3.1.X
3.3 Yes Yes
3.4 Yes Yes

將連結服務設定為Hive中繼存放區

注意

只有 Azure SQL 資料庫適用於 MySQL 的 Azure 資料庫 支援作為外部 Hive 中繼存放區。 這兩種資料庫都支援 SQL(username-password) 驗證。 此外,受控識別(包括系統簽署和使用者指派)驗證僅支援 Azure SQL 資料庫 和 Spark 3.4。 如果提供的資料庫空白,請透過 Hive架構工具來 布建資料庫架構。

請遵循下列步驟,在 Synapse 工作區中設定外部 Hive 中繼存放區的連結服務。

  1. 開啟 Synapse Studio,移至左側的 [管理]> [連結服務],然後按一下 [新增] 來建立新的連結服務。

    設定Hive中繼存放區連結服務的螢幕快照。

  2. 選擇 [Azure SQL Database],按一下 [繼續]。

  3. 提供連結服務的名稱。 記錄連結服務的名稱,這項資訊將用來不久設定 Spark。

  4. 選擇 [舊 版],然後選取 [ 連接字串]。

  5. 從 Azure 訂用帳戶清單中選取外部 Hive 中繼存放區的 Azure SQL 資料庫,或手動輸入資訊。

  6. 將驗證類型設定為 的SQL Authentication其中一個, System-assigned managed identityUser-assigned managed identity。 針對 SQL Authentication,請提供 [用戶名稱 ] 和 [密碼 ] 來設定連線。 針對 System-assigned managed identity,頁面會自動填入與目前工作區相關聯的管理身分識別。 針對 User-assigned managed identity,挑選或建立與使用者指派的受控識別系結的認證。

  7. 測試連線 以確認驗證。

  8. 按一下 [建立]來建立連結服務。