sync
opdrachtgroep
Notitie
Deze informatie is van toepassing op Databricks CLI-versies 0.205 en hoger. De Databricks CLI bevindt zich in openbare preview.
Databricks CLI-gebruik is onderhevig aan de Databricks-licentie en de privacyverklaring van Databricks, met inbegrip van alle bepalingen voor gebruiksgegevens.
Met sync
de opdrachtgroep in de Databricks CLI kunt u bestandswijzigingen in een lokale bestandssysteemmap in één richting synchroniseren naar een map binnen een externe Azure Databricks-werkruimte.
Notitie
sync
opdrachten kunnen geen bestandswijzigingen vanuit een map in een externe Azure Databricks-werkruimte synchroniseren, terug naar een map binnen een lokaal bestandssysteem.sync
opdrachten kunnen bestandswijzigingen van een lokale ontwikkelcomputer alleen synchroniseren met werkruimtegebruikersbestanden (/Users
) in uw Azure Databricks-werkruimte. Het kan niet worden gesynchroniseerd met DBFS-bestanden (dbfs:/
). Als u bestandswijzigingen van een lokale ontwikkelcomputer wilt synchroniseren met DBFS (dbfs:/
) in uw Azure Databricks-werkruimte, gebruikt u het hulpprogramma dbx-synchronisatie .
U voert opdrachten uit sync
door ze toe te voegen aan databricks sync
. Als u help voor de sync
opdracht wilt weergeven, voert u het volgende uit databricks sync -h
.
Incrementeel lokale bestandswijzigingen synchroniseren naar een externe map
Als u één stapsgewijze synchronisatie van bestandswijzigingen in een lokale bestandssysteemmap wilt uitvoeren naar een map binnen een externe Azure Databricks-werkruimte, voert u de sync
opdracht als volgt uit:
databricks sync <local-directory-path> <remote-directory-path>
Als u bijvoorbeeld een eenmalige, eenrichtingssynchronisatie wilt uitvoeren van alle bestandswijzigingen in de map met de naam my-folder
in de lokale huidige werkmap, naar een specifiek pad binnen de externe werkruimte, voert u de volgende opdracht uit:
databricks sync ./my-folder/ /Users/someone@example.com/
In dit voorbeeld worden alleen bestandswijzigingen sinds de laatste uitvoering van de sync
opdracht gesynchroniseerd met /Users/someone@example.com/
. Standaard wordt de URL van de werkruimte in het profiel van DEFAULT
de beller gebruikt om te bepalen met welke externe werkruimte moet worden gesynchroniseerd.
Lokale bestandswijzigingen volledig synchroniseren naar een externe map
Als u één volledige, volledige synchronisatie van bestandswijzigingen in een lokale bestandssysteemmap naar een map in een externe Azure Databricks-werkruimte wilt uitvoeren, ongeacht wanneer de laatste sync
opdracht is uitgevoerd, gebruikt u de --full
optie, bijvoorbeeld:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Wijzigingen in lokale bestanden continu synchroniseren naar een externe map
Als u continue, eenmalige synchronisatie van bestandswijzigingen in een lokale bestandssysteemmap wilt inschakelen naar een map binnen een externe Azure Databricks-werkruimte, gebruikt u de --watch
optie, bijvoorbeeld:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
Synchronisatie in één richting wordt voortgezet totdat de opdracht is gestopt vanuit de terminal, meestal door op of Ctrl + z
te drukkenCtrl + c
.
Polling voor mogelijke synchronisatie-gebeurtenissen vindt standaard één keer per seconde plaats. Als u dit interval wilt wijzigen, gebruikt u de --interval
optie samen met het aantal seconden om te peilen gevolgd door het teken s
, bijvoorbeeld voor vijf seconden:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
De uitvoerindeling van de synchronisatievoortgang wijzigen
Voortgangsgegevens synchroniseren wordt standaard naar de terminal in tekstindeling uitgevoerd. Als u de uitvoerindeling voor de synchronisatievoortgang wilt opgeven, gebruikt u de --output
optie, waarbij u een van de opties opgeeft text
(de standaardinstelling, indien --output
niet anders opgegeven) of json
bijvoorbeeld:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json