Freigeben über


sync-Befehlsgruppe

Hinweis

Diese Informationen gelten für Databricks CLI-Versionen 0.205 und höher. Die Databricks CLI befindet sich in der öffentlichen Vorschau.

Die Verwendung von Databricks CLI unterliegt der Datenbricks-Lizenz - und Databricks-Datenschutzerklärung, einschließlich der Bestimmungen zu Nutzungsdaten.

Die sync-Befehlsgruppe in der Databricks CLI ermöglicht Ihnen, eine unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Dateisystemverzeichnisses mit einem Verzeichnis innerhalb eines Azure Databricks-Remotearbeitsbereichs durchzuführen.

Hinweis

  • Mit sync-Befehlen können Dateiänderungen aus einem Verzeichnis innerhalb eines Azure Databricks-Remotearbeitsbereichs nicht mit einem Verzeichnis innerhalb eines lokalen Dateisystems synchronisiert werden.
  • sync Befehle können Dateiänderungen von einem lokalen Entwicklungscomputer nur mit Arbeitsbereichsbenutzerdateien (/Users) in Ihrem Azure Databricks-Arbeitsbereich synchronisieren. Mit DBFS-Dateien (dbfs:/) kann nicht synchronisiert werden. Um Dateiänderungen von einem lokalen Entwicklungscomputer mit DBFS (dbfs:/) in Ihrem Azure Databricks-Arbeitsbereich zu synchronisieren, verwenden Sie das Hilfsprogramm dbx sync.

Sie führen sync-Befehle aus, indem Sie sie an databricks sync anfügen. Führen Sie databricks sync -h aus, um Hilfe zum sync-Befehl anzuzeigen.

Inkrementelle Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis

Um eine einzelne, inkrementelle unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Dateisystemverzeichnisses mit einem Verzeichnis innerhalb eines Azure Databricks-Remotearbeitsbereichs durchzuführen, führen Sie den sync-Befehl wie folgt aus:

databricks sync <local-directory-path> <remote-directory-path>

Um beispielsweise eine einmalige, unidirektionale, inkrementelle Synchronisierung aller Dateiänderungen im Ordner my-folder im lokalen aktuellen Arbeitsverzeichnis mit einem bestimmten Pfad innerhalb des Remotearbeitsbereichs durchzuführen, führen Sie den folgenden Befehl aus:

databricks sync ./my-folder/ /Users/someone@example.com/

In diesem Beispiel werden nur Dateiänderungen seit der letzten Ausführung des sync-Befehls mit /Users/someone@example.com/synchronisiert. Standardmäßig wird die Arbeitsbereichs-URL im DEFAULT-Profil des Aufrufers verwendet, um den Remotearbeitsbereich zu bestimmen, mit dem synchronisiert werden soll.

Vollständige Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis

Um eine einzelne, vollständige, unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Dateisystemverzeichnisses mit einem Verzeichnis innerhalb eines Azure Databricks-Remotearbeitsbereichs unabhängig davon durchzuführen, wann der letzte sync-Befehl ausgeführt wurde, verwenden Sie die Option --full, z. B.:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Fortlaufende Synchronisierung lokaler Dateiänderungen mit einem Remoteverzeichnis

Um eine fortlaufende, unidirektionale Synchronisierung von Dateiänderungen innerhalb eines lokalen Dateisystemverzeichnisses mit einem Verzeichnis innerhalb eines Azure Databricks-Remotearbeitsbereichs durchzuführen, verwenden Sie die Option --watch, z. B.:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

Die unidirektionale Synchronisierung wird fortgesetzt, bis der Befehl über das Terminal beendet wird, was in der Regel durch Drücken von Ctrl + c oder Ctrl + z geschieht.

Das Abfragen möglicher Synchronisierungsereignisse werden standardmäßig einmal pro Sekunde ausgeführt. Um dieses Intervall zu ändern, verwenden Sie die Option --interval zusammen mit der Anzahl der Sekunden, nach der abgerufen werden sollen, gefolgt vom Zeichen s. Geben Sie z. B. Folgendes an, um das Intervall in fünf Sekunden zu ändern:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Ändern des Ausgabeformats für den Synchronisierungsstatus

Informationen zum Synchronisierungsstatus werden standardmäßig im Textformat an das Terminal ausgegeben. Um das Ausgabeformat für den Synchronisierungsstatus anzugeben, verwenden Sie die Option --output, und geben Sie entweder text (Standardeinstellung, wenn --output nichts anderes angegeben wird) oder json an, z. B.:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json