叢集程式庫
叢集連結庫可供叢集上執行的所有筆記本和作業使用。 本文詳細說明在 Azure Databricks 工作區中使用安裝連結庫 UI。
注意
如果您使用強制執行連結庫安裝的原則建立計算,則無法在計算上安裝或卸載連結庫。 工作區系統管理員會控制原則層級的所有連結庫管理。
您可以使用下列方法將連結庫安裝到叢集:
僅安裝連結庫以搭配特定叢集使用。
使用 REST API 安裝連結庫。 請參閱連結 庫 API。
使用 Databricks CLI 安裝連結庫。 請參閱什麼是 Databricks CLI?。
使用 Terraform 安裝連結庫。 請參閱 Databricks Terraform 提供者 和 databricks_library。
使用定義連結庫安裝的原則建立叢集來安裝連結庫。 請參閱在原則中新增程式庫。
(不建議)使用在叢集建立時執行的init腳本來安裝連結庫。 請參閱使用 init 腳本安裝連結庫(舊版)。
在叢集上安裝連結庫
若要在叢集安裝連結庫:
- 在側邊欄中按下 [計算]。
- 按兩下叢集名稱。
- 按下 [程式庫] 索引標籤。
- 按兩下 [ 安裝新增]。
- [ 安裝連結庫 ] 對話框隨即顯示。
- 選取其中一個 [ 連結庫來源] 選項,完成出現的指示,然後按兩下 [ 安裝]。
重要
使用 Databricks Runtime 14.3 LTS 及更舊版本時,可從 DBFS 安裝程式庫。 不過,任何工作區使用者都可以修改儲存在 DBFS 的程式庫檔案。 若要提高 Azure Databricks 工作區程式庫的安全性,在 Databricks Runtime 15.1 和更新版本預設會取代及停用 DBFS 根目錄中的程式庫檔案。 請參閱在 DBFS 根目錄儲存程式庫已被取代,並預設為停用。
相反地,Databricks 建議將所有程式庫,包括 Python 程式庫、JAR 檔案及 Spark 連接器上傳至工作區檔案或 Unity 目錄磁碟區,或使用程式庫套件存放庫。 如果您的工作負載不支援這些模式,您也可以使用儲存在雲端物件記憶體的程式庫。
並非所有叢集存取模式都支援所有連結庫組態。 請參閱 叢集範圍的連結庫。
連結庫來源 | 指示 |
---|---|
工作區 | 選取工作區檔案或上傳 Whl、ziped wheelhouse、JAR、ZIP、tar 或 requirements.txt 檔案。 請參閱 從工作區檔案安裝連結庫 |
磁碟區 | 從磁碟區選取 Whl、JAR 或 requirements.txt 檔案。 請參閱 從磁碟區安裝連結庫。 |
檔案路徑/ADLS | 選取連結庫類型,並提供連結庫物件的完整 URI(例如: /Workspace/path/to/library.whl 、 /Volumes/path/to/library.whl 或 abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl 。 請參閱 從物件記憶體安裝連結庫。 |
PyPI | 輸入 PyPI 套件名稱。 請參閱 PyPI 套件。 |
Maven | 指定 Maven 座標。 請參閱 Maven 或 Spark 套件。 |
CRAN | 輸入套件的名稱。 請參閱 CRAN套件。 |
DBFS (不建議) | 將 JAR 或 Whl 檔案載入 DBFS 根目錄。 不建議這麼做,因為儲存在 DBFS 中的檔案可由任何工作區使用者修改。 |
當您在叢集上安裝連結庫時,已連結至該叢集的筆記本將不會立即看到新的連結庫。 您必須先 中斷鏈接 ,然後將 筆記本重新附加 至叢集。
注意
安裝超過 2 小時的程式庫將會標示為失敗。
使用原則安裝連結庫
如果您使用強制執行連結庫安裝的原則建立叢集,則指定的連結庫會自動安裝在叢集上。 您無法安裝其他連結庫或卸載任何連結庫。
工作區管理員可以將連結庫新增至原則,以允許他們在使用原則的所有計算上管理和強制執行連結庫安裝。 如需系統管理員指示,請參閱 將連結庫新增至原則。
從叢集卸載連結庫
注意
當您從叢集卸載連結庫時,只有在重新啟動叢集時,才會移除連結庫。 在您重新啟動叢集之前,卸載連結庫的狀態會顯示為 [卸載擱置重新啟動]。
若要卸載連結庫,您可以使用叢集 UI:
- 在側邊欄中按下 [計算]。
- 按兩下叢集名稱。
- 按下 [程式庫] 索引標籤。
- 選取您要卸載連結庫的叢集旁的複選框,按兩下 [卸載],然後按兩下 [ 確認]。 狀態會變更為 [卸載擱置重新啟動]。
按兩下 [重新啟動 ] 和 [確認 ] 以卸載連結庫。 連結庫會從叢集的 [連結庫] 索引標籤中移除。
檢視叢集上安裝的連結庫
- 在側邊欄中按下 [計算]。
- 按兩下叢集名稱。
- 按兩下 [連結庫] 索引 標籤 。針對每個連結庫,索引標籤會顯示名稱和版本、輸入、 安裝狀態,以及上傳來源檔案。
更新叢集安裝的連結庫
若要更新叢集安裝的連結庫,請卸載舊版的連結庫,並安裝新版本。
注意
Requirements.txt檔案不需要卸載和重新啟動。 如果您已修改requirements.txt檔案的內容,您可以直接重新安裝以更新已安裝檔案的內容。