grupo de comandos sync
Observação
Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.
O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.
O sync
grupo de comandos dentro da CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks.
Observação
- Os comandos
sync
não podem sincronizar alterações de arquivo de um diretório em um workspace remoto do Azure Databricks, de volta para um diretório dentro de um sistema de arquivos local. sync
Os comandos podem sincronizar alterações de arquivo de um computador de desenvolvimento local somente com arquivos de usuário (/Users
) do workspace em seu workspace do Azure Databricks. Ele não pode sincronizar com arquivos DBFS (dbfs:/
). Para sincronizar as alterações de arquivo de um computador de desenvolvimento local para o DBFS (dbfs:/
) no workspace do Azure Databricks, use o utilitário de sincronização dbx.
Você executa comandos sync
anexando-os a databricks sync
. Para exibir a ajuda para o comando sync
, execute databricks sync -h
.
Sincronizar incrementalmente as alterações de arquivo local em um diretório remoto
Para executar uma sincronização única e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório dentro de um workspace remoto do Azure Databricks, execute o comando sync
da seguinte maneira:
databricks sync <local-directory-path> <remote-directory-path>
Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta nomeada my-folder
dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:
databricks sync ./my-folder/ /Users/someone@example.com/
Neste exemplo, somente as alterações de arquivo desde a última execução do sync
comando são sincronizadas com /Users/someone@example.com/
. Por padrão, a URL do workspace no perfil do DEFAULT
chamador é usada para determinar o workspace remoto ao qual sincronizar.
Sincronizar totalmente as alterações de arquivo local em um diretório remoto
Para executar uma sincronização unidirecional única e completa de alterações de arquivo em um diretório de sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks, independentemente de quando o último sync
comando foi executado, use a opção --full
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Sincronizar continuamente as alterações de arquivo local em um diretório remoto
Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um espaço de trabalho remoto do Azure Databricks, use a opção --watch
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
A sincronização unidirecional continua até que o comando seja interrompido do terminal, normalmente pressionando Ctrl + c
ou Ctrl + z
.
A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por padrão. Para alterar esse intervalo, use a opção --interval
juntamente com o número de segundos para sondar seguido pelo caractere s
, por exemplo, por cinco segundos:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Alterar o formato de saída de progresso da sincronização
As informações de progresso da sincronização são a saída para o terminal no formato de texto por padrão. Para especificar o formato de saída de progresso da sincronização, use a opção --output
especificando text
(o padrão, se --output
não for especificado de outra forma) ou json
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json