Delen via


sync opdrachtgroep

Notitie

Deze informatie is van toepassing op Databricks CLI-versies 0.205 en hoger. De Databricks CLI bevindt zich in openbare preview.

Databricks CLI-gebruik is onderhevig aan de Databricks-licentie en de privacyverklaring van Databricks, met inbegrip van alle bepalingen voor gebruiksgegevens.

Met sync de opdrachtgroep in de Databricks CLI kunt u bestandswijzigingen in een lokale bestandssysteemmap in één richting synchroniseren naar een map binnen een externe Azure Databricks-werkruimte.

Notitie

  • sync opdrachten kunnen geen bestandswijzigingen vanuit een map in een externe Azure Databricks-werkruimte synchroniseren, terug naar een map binnen een lokaal bestandssysteem.
  • sync opdrachten kunnen bestandswijzigingen van een lokale ontwikkelcomputer alleen synchroniseren met werkruimtegebruikersbestanden (/Users) in uw Azure Databricks-werkruimte. Het kan niet worden gesynchroniseerd met DBFS-bestanden (dbfs:/). Als u bestandswijzigingen van een lokale ontwikkelcomputer wilt synchroniseren met DBFS (dbfs:/) in uw Azure Databricks-werkruimte, gebruikt u het hulpprogramma dbx-synchronisatie .

U voert opdrachten uit sync door ze toe te voegen aan databricks sync. Als u help voor de sync opdracht wilt weergeven, voert u het volgende uit databricks sync -h.

Incrementeel lokale bestandswijzigingen synchroniseren naar een externe map

Als u één stapsgewijze synchronisatie van bestandswijzigingen in een lokale bestandssysteemmap wilt uitvoeren naar een map binnen een externe Azure Databricks-werkruimte, voert u de sync opdracht als volgt uit:

databricks sync <local-directory-path> <remote-directory-path>

Als u bijvoorbeeld een eenmalige, eenrichtingssynchronisatie wilt uitvoeren van alle bestandswijzigingen in de map met de naam my-folder in de lokale huidige werkmap, naar een specifiek pad binnen de externe werkruimte, voert u de volgende opdracht uit:

databricks sync ./my-folder/ /Users/someone@example.com/

In dit voorbeeld worden alleen bestandswijzigingen sinds de laatste uitvoering van de sync opdracht gesynchroniseerd met /Users/someone@example.com/. Standaard wordt de URL van de werkruimte in het profiel van DEFAULT de beller gebruikt om te bepalen met welke externe werkruimte moet worden gesynchroniseerd.

Lokale bestandswijzigingen volledig synchroniseren naar een externe map

Als u één volledige, volledige synchronisatie van bestandswijzigingen in een lokale bestandssysteemmap naar een map in een externe Azure Databricks-werkruimte wilt uitvoeren, ongeacht wanneer de laatste sync opdracht is uitgevoerd, gebruikt u de --full optie, bijvoorbeeld:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Wijzigingen in lokale bestanden continu synchroniseren naar een externe map

Als u continue, eenmalige synchronisatie van bestandswijzigingen in een lokale bestandssysteemmap wilt inschakelen naar een map binnen een externe Azure Databricks-werkruimte, gebruikt u de --watch optie, bijvoorbeeld:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

Synchronisatie in één richting wordt voortgezet totdat de opdracht is gestopt vanuit de terminal, meestal door op of Ctrl + zte drukkenCtrl + c.

Polling voor mogelijke synchronisatie-gebeurtenissen vindt standaard één keer per seconde plaats. Als u dit interval wilt wijzigen, gebruikt u de --interval optie samen met het aantal seconden om te peilen gevolgd door het teken s, bijvoorbeeld voor vijf seconden:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

De uitvoerindeling van de synchronisatievoortgang wijzigen

Voortgangsgegevens synchroniseren wordt standaard naar de terminal in tekstindeling uitgevoerd. Als u de uitvoerindeling voor de synchronisatievoortgang wilt opgeven, gebruikt u de --output optie, waarbij u een van de opties opgeeft text (de standaardinstelling, indien --output niet anders opgegeven) of jsonbijvoorbeeld:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json