什麼是適用於 Visual Studio Code 的 Databricks 延伸項目?
適用於 Visual Studio Code 的 Databricks 延伸項目可讓您從本機開發電腦上執行的 Visual Studio Code 整合式開發環境 (IDE) 連線到遠端 Azure Databricks 工作區。 接著,您可以:
- 使用 Visual Studio Code UI 定義、部署及執行 Databricks 資產組合,以將 CI/CD 模式和最佳做法套用至 Azure Databricks 作業、Delta Live Tables 管線和 MLOps Stack。 請參閱什麼是 Databricks Asset Bundles?和 Databricks Asset Bundles 延伸項目功能。
- 在遠端工作區中的 Azure Databricks 叢集上,從 Visual Studio Code 執行本機 Python 程式碼檔案。 請參閱在叢集上執行 Python 檔案
- 從 Visual Studio Code 執行本機 Python 程式碼檔案 (
.py
) 和 Python、R、Scala 和 SQL 筆記本 (.py
、.ipynb
、.r
、.scala
和.sql
),作為遠端工作區中的 Azure Databricks 作業。 請參閱執行 Python 檔案作為作業。 - 使用簡單的檢查清單以觸發選擇對話框,設置和配置您的偵錯環境及 Databricks Connect。 請參閲為適用於 Visual Studio Code 的 Databricks 延伸項目使用 Databricks Connect 偵錯程式碼。
- 使用 Databricks Connect 在 Visual Studio Code 內對筆記本逐個資料格地進行偵錯。 請參閱使用適用於 Visual Studio Code 的 Databricks 延伸項目,配合 Databricks Connect 執行和偵錯筆記本資料格。
- 同步處理您使用遠端工作區中的程式碼在 Visual Studio Code 中開發的本機程式碼。 請參閱 將您的工作區資料夾同步至 Databricks
注意
適用於 Visual Studio Code 的 Databricks 延伸項目支援以自動化作業的形式執行 R、Scala 和 SQL 筆記本,但不會在 Visual Studio Code 中提供對這些語言的任何更深入支援。
開始
若要開始使用適用於 Visual Studio Code 的 Databricks 擴充功能:
- 安裝延伸項目。
- 建立 新的 Databricks 專案,或將 現有的 Visual Studio Code 項目 轉換。
- 使用 Databricks 延伸項目 UI 輕鬆地設定專案。
- 在延伸項目教學課程中執行一些 Python 程式碼。
- 使用 Databricks Connect 整合對程式碼進行偵錯。
- 使用
pytest
測試您的程式碼。 請參閱使用適用於 Visual Studio Code 的 Databricks 延伸項目執行 pytest 的測試。
建立新的 Databricks 專案
安裝延伸項目之後,您可以使用適用於 Visual Studio Code 的 Databricks 延伸項目來建立新的 Databricks 專案:
- 啟動 Visual Studio Code。
- 按一下 Visual Studio Code 側邊欄中的 Databricks 圖示,以開啟延伸項目。
- 按一下 建立新專案。
- 在 命令選擇區中,選取專案的主機和驗證方法。 請參閱 為 Visual Studio Code設定 Databricks 擴充套件的授權。
- 在 提供您要新專案的資料夾路徑、輸入您要建立專案之本機開發計算機上資料夾的路徑,或按兩下 [開啟資料夾選取] 對話框,然後選取專案資料夾的路徑。
- 若要讓 範本在 Databricks 專案初始化檢視中使用,請使用向上和向下箭號來選取專案範本,然後按 Enter。 如需配套項目範本的相關資訊,請參閱 Databricks Asset Bundle 項目範本。
- 為專案輸入此專案的唯一名稱,或保留預設專案名稱
my_project
,然後按 Enter 鍵。 - 選擇是否要將存根(範例)筆記本、存根(範例)Delta Live Tables 管線或存根(範例)Python 套件新增至專案,或這些存根的任何組合(範例)。
- 按任意鍵以關閉 Databricks Project Init 編輯器索引標籤。
- 針對 ,選取您想要開啟的專案,請選擇您剛才建立的專案。
開啟現有的 Databricks Asset Bundles 專案
Databricks Asset Bundles 專案在專案的根資料夾中有 databricks.yml
檔案。 請參閱 Databricks Asset Bundle 組態。 如果您想要搭配現有的 Databricks Asset Bundles 專案使用延伸模組:
啟動 Visual Studio Code。 從主功能表中,按一下 [檔案] >[開啟資料夾],然後瀏覽至包含套件組合專案的目錄。
按兩下Visual Studio Code 提要欄中的 Databricks 圖示,以開啟並開始使用延伸模組的功能。
如果 Visual Studio Code 的 Databricks 延伸模組在目前資料夾中探索到多個 Databricks Asset Bundles 專案,它可讓您選擇開啟專案,或在根資料夾中建立專案組態檔。
- 如果您選擇專案,請在 命令選擇區中,選取現有的 Databricks 資產套件組合專案。
- 如果您在根資料夾中建立組態,該資料夾會變成配套專案。
選取專案的主機和驗證方法。 請參閱 為 Visual Studio Code設定 Databricks 擴充套件的授權。
注意
如果您使用適用於 Visual Studio Code v1 的 Databricks 延伸項目開啟建立的專案,則會使用專案現有的驗證和工作區設定自動嘗試移轉。 只有在自動移轉失敗時,才能使用移轉按鈕。
在 Databricks 專案之間切換
適用於 Visual Studio Code 的 Databricks 延伸項目可讓您在 Visual Studio Code 工作區內有多個 Databricks 專案,並輕鬆地在這些專案之間切換。 在 Visual Studio Code 工作區中開啟多套件組合專案:
按一下 Visual Studio Code 側邊欄中的 Databricks 圖示,以開啟延伸項目。
按一下 本機資料夾 選取擴充功能要使用的專案。
注意
執行動作僅適用於使用中套件組合中的檔案。
將項目轉換成 Databricks 專案
如果您有想要轉換成 Databricks 專案的現有專案:
- 啟動 Visual Studio Code。 從主功能表中,按一下 [檔案] >[開啟資料夾],並瀏覽至您的專案以開啟它。
- 按一下 Visual Studio Code 側邊欄中的 Databricks 圖示,以開啟延伸項目。
- 按一下 [建立設定]。
- 在 命令選擇區中,選取專案的主機和驗證方法。 請參閱 為 Visual Studio Code設定 Databricks 擴充套件的授權。