Grupo de comandos sync
Nota:
Esta información se aplica a las versiones 0.205 y posteriores de la CLI de Databricks. La CLI de Databricks está en versión preliminar pública.
El uso de la CLI de Databricks está sujeto a la licencia de Databricks y al aviso de privacidad de Databricks, incluidas las disposiciones de datos de uso.
El grupo de comandos sync
dentro de la CLI de Databricks permite la sincronización unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks.
Nota:
- Los comandos
sync
no pueden sincronizar los cambios de archivo desde un directorio dentro de un área de trabajo remota de Azure Databricks, dentro de un directorio dentro de un sistema de archivos local. sync
los comandos pueden sincronizar los cambios de archivo desde una máquina de desarrollo local solo a los archivos de usuario del área de trabajo (/Users
) del área de trabajo de Azure Databricks. No se puede sincronizar con archivos DBFS (dbfs:/
). Para sincronizar los cambios de archivo de una máquina de desarrollo local con DBFS (dbfs:/
) en el área de trabajo de Azure Databricks, use la utilidad de sincronización dbx.
Ejecute los comandos sync
anexándolos a databricks sync
. A fin de mostrar la ayuda para este comando sync
, ejecute databricks sync -h
.
Sincronización incremental de los cambios de archivo local en un directorio remoto
Para realizar una sincronización única, incremental y unidireccional de cambios de archivos dentro de un directorio del sistema de archivos local, a un directorio dentro de un área de trabajo remota de Azure Databricks, ejecute el comando sync
de la siguiente manera:
databricks sync <local-directory-path> <remote-directory-path>
Por ejemplo, para realizar una sincronización incremental unidireccional y única de todos los cambios de archivo en la carpeta denominada my-folder
dentro del directorio de trabajo actual local, a una ruta de acceso específica dentro del área de trabajo remota, ejecute el siguiente comando:
databricks sync ./my-folder/ /Users/someone@example.com/
En este ejemplo, solo los cambios de archivo desde la última ejecución del comando sync
se sincronizan con /Users/someone@example.com/
. De forma predeterminada, la dirección URL del área de trabajo dentro del perfil DEFAULT
del autor de llamada se usa para determinar el área de trabajo remota con la que se va a sincronizar.
Sincronización completa de los cambios de archivo local en un directorio remoto
Para realizar una sincronización única, completa y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local en un directorio dentro de un área de trabajo remota de Azure Databricks, independientemente de cuándo se ejecutó el último comando sync
, use la opción --full
, por ejemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Sincronizar continuamente los cambios de archivo local en un directorio remoto
Para activar la sincronización continua y unidireccional de los cambios de archivos dentro de un directorio del sistema de archivos local con un directorio dentro de un área de trabajo remota de Azure Databricks, use la opción --watch
, por ejemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
La sincronización unidireccional continúa hasta que el comando se detiene desde el terminal, normalmente presionando Ctrl + c
o Ctrl + z
.
El sondeo de posibles eventos de sincronización se produce una vez por segundo de forma predeterminada. Para cambiar este intervalo, use la opción --interval
junto con el número de segundos que se van a sondear seguidos del carácter s
, por ejemplo, durante cinco segundos:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Cambiar el formato de salida del progreso de sincronización
La información de progreso de sincronización se envía al terminal en formato de texto de forma predeterminada. Para especificar el formato de salida de progreso de sincronización, use la opción --output
, especificando text
(el valor predeterminado, si --output
no se especifica de otro modo) o json
, por ejemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json