Compartir a través de


Grupo de comandos sync

Nota:

Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks. La CLI de Databricks está en versión preliminar pública.

El uso de la CLI de Databricks está sujeto a la licencia de Databricks y al aviso de privacidad de Databricks, incluidas las disposiciones de datos de uso.

El grupo de comandos sync dentro de la CLI de Databricks permite la sincronización unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks.

Nota:

  • Los comandos sync no pueden sincronizar los cambios de archivo desde un directorio dentro de un área de trabajo remota de Azure Databricks, dentro de un directorio dentro de un sistema de archivos local.
  • sync los comandos pueden sincronizar los cambios de archivo desde una máquina de desarrollo local solo a los archivos de usuario del área de trabajo (/Users) del área de trabajo de Azure Databricks. No se puede sincronizar con archivos DBFS (dbfs:/). Para sincronizar los cambios de archivo de una máquina de desarrollo local con DBFS (dbfs:/) en el área de trabajo de Azure Databricks, use la utilidad de sincronización dbx.

Ejecute los comandos sync anexándolos a databricks sync. A fin de mostrar la ayuda para este comando sync, ejecute databricks sync -h.

Sincronización incremental de los cambios de archivo local en un directorio remoto

Para realizar una sincronización única, incremental y unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local, a un directorio dentro de un área de trabajo remota de Azure Databricks, ejecute el comando sync de la siguiente manera:

databricks sync <local-directory-path> <remote-directory-path>

Por ejemplo, para realizar una sincronización incremental unidireccional y única de todos los cambios de archivo en la carpeta denominada my-folder dentro del directorio de trabajo actual local, a una ruta de acceso específica dentro del área de trabajo remota, ejecute el siguiente comando:

databricks sync ./my-folder/ /Users/someone@example.com/

En este ejemplo, solo los cambios de archivo desde la última ejecución del comando sync se sincronizan con /Users/someone@example.com/. De forma predeterminada, la dirección URL del área de trabajo dentro del perfil DEFAULT del autor de llamada se usa para determinar el área de trabajo remota con la que se va a sincronizar.

Sincronización completa de los cambios de archivo local en un directorio remoto

Para realizar una sincronización única, completa y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local en un directorio dentro de un área de trabajo remota de Azure Databricks, independientemente de cuándo se ejecutó el último comando sync, use la opción --full, por ejemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronizar continuamente los cambios de archivo local en un directorio remoto

Para activar la sincronización continua y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks, use la opción --watch, por ejemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

La sincronización unidireccional continúa hasta que el comando se detiene desde el terminal, normalmente presionando Ctrl + c o Ctrl + z.

El sondeo de posibles eventos de sincronización se produce una vez por segundo de forma predeterminada. Para cambiar este intervalo, use la opción --interval junto con el número de segundos que se van a sondear seguidos del carácter s, por ejemplo, durante cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Cambiar el formato de salida del progreso de sincronización

La información de progreso de sincronización se envía al terminal en formato de texto de forma predeterminada. Para especificar el formato de salida de progreso de sincronización, use la opción --output, especificando text (el valor predeterminado, si --output no se especifica de otro modo) o json, por ejemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json