將 Spark 連結庫從 Azure Synapse 遷移至 Fabric
Azure Synapse Spark 集區提供不同的摘要和自定義連結庫選項。 在 Fabric 中,每個執行階段都會隨附一組預安裝的連結庫(內建連結庫)。 不過,根據您的案例和特定需求,您也可以使用 環境連結庫 和 內嵌連結庫來包含其他連結庫。 若要將 Azure Synapse Spark 集區連結庫移至 Fabric,請使用環境連結庫。
如需Spark連結庫考慮,請參閱 Azure Synapse Spark 與 Fabric 之間的差異。
必要條件
- 如果您還沒有網狀架構工作區,請在租用戶中建立 Fabric 工作區。
- 如果您還沒有環境,請在工作區中建立環境。
選項 1:將 Spark 連結庫新增至自定義環境
您可以將 Spark 集區連結庫移至環境,如下所示:
- 開啟 Synapse Studio:登入 Azure。 瀏覽至 Azure Synapse 工作區並開啟 Synapse Studio。
- 找出 Spark 連結庫:
- 移至 管理區域,然後選取Apache Spark 集區。
- 尋找 Apache Spark 集區,選取套件 ,然後找出集區的 Spark 連結庫。
- 取得 Spark 連結庫:找出集區中安裝的requirements.txt、environment.yml或工作區套件。 取得集區上已安裝的連結庫清單。
- 擁有 Spark 連結庫之後,請將自訂 Spark 連結庫新增至 Fabric 中的環境。 在您的 環境中,移至 連結庫並新增連結庫:
- 您可以從 公用連結庫 上傳.yml檔案。 您也可以使用 PyPI 和 Conda 來安裝連結庫。
- 從 自定義連結庫, 您可以使用 .jar/.whl/.tar.gz 檔案來安裝連結庫。
- 按兩下 儲存 併 發佈 變更。
深入瞭解將Spark連結庫新增至 環境。
注意
請注意,連結庫安裝可能需要一些時間。