sync
grupa poleceń
Uwaga
Te informacje dotyczą interfejsu wiersza polecenia usługi Databricks w wersji 0.205 lub nowszej. Interfejs wiersza polecenia usługi Databricks jest w publicznej wersji zapoznawczej.
Korzystanie z interfejsu wiersza polecenia usługi Databricks podlega licencjom usługi Databricks i powiadomieniom o ochronie prywatności usługi Databricks, w tym wszelkim przepisom dotyczącym danych użycia.
Grupa sync
poleceń w interfejsie wiersza polecenia usługi Databricks umożliwia jednokierunkową synchronizację zmian plików w lokalnym katalogu systemu plików do katalogu w zdalnym obszarze roboczym usługi Azure Databricks.
Uwaga
sync
Polecenia nie mogą synchronizować zmian plików z katalogu w zdalnym obszarze roboczym usługi Azure Databricks z powrotem do katalogu w lokalnym systemie plików.sync
Polecenia mogą synchronizować zmiany plików z lokalnej maszyny dewelopera tylko do plików użytkownika obszaru roboczego (/Users
) w obszarze roboczym usługi Azure Databricks. Nie można zsynchronizować z plikami DBFS (dbfs:/
). Aby zsynchronizować zmiany plików z lokalnej maszyny programistycznej do systemu plików DBFS (dbfs:/
) w obszarze roboczym usługi Azure Databricks, użyj narzędzia do synchronizacji dbx.
sync
Uruchamiasz polecenia, dołączając je do databricks sync
elementu . Aby wyświetlić pomoc dotyczącą sync
polecenia, uruchom polecenie databricks sync -h
.
Przyrostowe synchronizowanie zmian pliku lokalnego w katalogu zdalnym
Aby wykonać pojedynczą, przyrostową, jednokierunkową synchronizację zmian plików w lokalnym katalogu systemu plików, do katalogu w zdalnym obszarze roboczym usługi Azure Databricks, uruchom sync
polecenie w następujący sposób:
databricks sync <local-directory-path> <remote-directory-path>
Aby na przykład wykonać jednorazową, jednokierunkową synchronizację przyrostową wszystkich zmian plików w folderze o nazwie my-folder
w lokalnym bieżącym katalogu roboczym, do określonej ścieżki w zdalnym obszarze roboczym, uruchom następujące polecenie:
databricks sync ./my-folder/ /Users/someone@example.com/
W tym przykładzie tylko zmiany plików od ostatniego sync
uruchomienia polecenia są synchronizowane z elementem /Users/someone@example.com/
. Domyślnie adres URL obszaru roboczego w profilu obiektu wywołującego DEFAULT
służy do określania zdalnego obszaru roboczego do synchronizacji.
W pełni synchronizuj zmiany pliku lokalnego z katalogiem zdalnym
Aby wykonać jedną, pełną, jednokierunkową synchronizację zmian plików w lokalnym katalogu systemu plików do katalogu w zdalnym obszarze roboczym usługi Azure Databricks, niezależnie od tego, kiedy zostało uruchomione ostatnie sync
polecenie, użyj --full
opcji, na przykład:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Ciągłe synchronizowanie zmian pliku lokalnego z katalogiem zdalnym
Aby włączyć ciągłą, jednokierunkową synchronizację zmian plików w lokalnym katalogu systemu plików, do katalogu w zdalnym obszarze roboczym usługi Azure Databricks, użyj --watch
opcji, na przykład:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
Synchronizacja jednokierunkowa trwa do momentu zatrzymania polecenia z terminalu, zazwyczaj przez naciśnięcie Ctrl + c
lub Ctrl + z
.
Sondowanie możliwych zdarzeń synchronizacji odbywa się domyślnie raz na sekundę. Aby zmienić ten interwał, użyj --interval
opcji wraz z liczbą sekund do sondowania, po którym następuje znak s
, na przykład przez pięć sekund:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Zmienianie formatu danych wyjściowych postępu synchronizacji
Informacje o postępie synchronizacji są domyślnie wyświetlane w terminalu w formacie tekstowym. Aby określić format danych wyjściowych postępu synchronizacji, użyj --output
opcji , określając text
wartość (domyślną, jeśli --output
nie określono inaczej) lub json
, na przykład:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json