共用方式為


sync 命令群組

注意

此資訊適用於 Databricks CLI 0.205 版和更新版本。 Databricks CLI 處於 公開預覽狀態

Databricks CLI 使用受限於 Databricks 授權Databricks 隱私權注意事項,包括任何使用量數據布建。

sync Databricks CLI 內的命令群組可將本機文件系統目錄中的檔案變更單向同步處理至遠端 Azure Databricks 工作區內的目錄。

注意

  • sync 命令無法同步處理遠端 Azure Databricks 工作區內目錄的檔案變更,回到本機文件系統內的目錄。
  • sync 命令只能將本機開發計算機的檔案變更同步處理至 Azure Databricks 工作區中的工作區使用者 (/Users) 檔案。 它無法同步處理至 DBFSdbfs:/) 檔案。 若要同步處理從本機開發計算機到 Azure Databricks 工作區中 DBFS (dbfs:/) 的檔案變更,請使用 dbx 同步 公用程式。

您可以將 sync 命令附加至 databricks sync 來執行這些命令。 若要顯示 sync 命令的說明,請執行 databricks sync -h

以累加方式同步處理遠端目錄的本機檔案變更

若要執行本機文件系統目錄內檔案變更的單一累加式單向同步處理,到遠端 Azure Databricks 工作區內的目錄,請執行 sync 命令,如下所示:

databricks sync <local-directory-path> <remote-directory-path>

例如,若要對本機目前工作目錄內名為 my-folder 的資料夾內的所有檔案變更執行一次性的單向累加同步處理,請執行下列命令:

databricks sync ./my-folder/ /Users/someone@example.com/

在這裡範例中,只會將命令上次執行 sync 後的檔案變更同步處理至 /Users/someone@example.com/。 根據預設,呼叫端 DEFAULT 配置檔內的工作區URL會用來判斷要同步處理的遠端工作區。

將本機檔案變更完全同步至遠端目錄

若要執行單一、完整、單向同步處理本機文件系統目錄內的檔案變更,到遠端 Azure Databricks 工作區內的目錄,不論上次執行命令 sync 的時間為何,請使用 --full 選項,例如:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

持續同步本機檔案變更至遠端目錄

若要開啟本機文件系統目錄內檔案變更的連續單向同步處理,請在遠端 Azure Databricks 工作區內的目錄使用 --watch 選項,例如:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

單向同步處理會繼續進行,直到命令從終端機停止為止,通常是按 Ctrl + cCtrl + z

根據預設,輪詢可能的同步處理事件會發生一次。 若要變更此間隔,請使用 --interval 選項以及輪詢的秒數,後面接著字元 s,例如 5 秒:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

變更同步處理進度輸出格式

同步處理進度資訊預設會以文字格式輸出至終端機。 若要指定同步處理進度輸出格式,請使用 --output 選項,指定 text (如果未 --output 指定預設值)或 json,例如:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json