grupo de comandos `sync`

Artigo
10/30/2024

Observação

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.

O sync grupo de comandos dentro da CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks.

Observação

Os comandos sync não podem sincronizar alterações de arquivo de um diretório em um workspace remoto do Azure Databricks, de volta para um diretório dentro de um sistema de arquivos local.
sync Os comandos podem sincronizar alterações de arquivo de um computador de desenvolvimento local somente com arquivos de usuário (/Users) do workspace em seu workspace do Azure Databricks. Ele não pode sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivo de um computador de desenvolvimento local para o DBFS (dbfs:/) no workspace do Azure Databricks, use o utilitário de sincronização dbx.

Você executa comandos sync anexando-os a databricks sync. Para exibir a ajuda para o comando sync, execute databricks sync -h.

Sincronizar incrementalmente as alterações de arquivo local em um diretório remoto

Para executar uma sincronização única e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório dentro de um workspace remoto do Azure Databricks, execute o comando sync da seguinte maneira:

databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta nomeada my-folder dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:

databricks sync ./my-folder/ /Users/someone@example.com/

Neste exemplo, somente as alterações de arquivo desde a última execução do sync comando são sincronizadas com /Users/someone@example.com/. Por padrão, a URL do workspace no perfil do DEFAULT chamador é usada para determinar o workspace remoto ao qual sincronizar.

Sincronizar totalmente as alterações de arquivo local em um diretório remoto

Para executar uma sincronização unidirecional única e completa de alterações de arquivo em um diretório de sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks, independentemente de quando o último sync comando foi executado, use a opção --full , por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronizar continuamente as alterações de arquivo local em um diretório remoto

Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um espaço de trabalho remoto do Azure Databricks, use a opção --watch, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

A sincronização unidirecional continua até que o comando seja interrompido do terminal, normalmente pressionando Ctrl + c ou Ctrl + z.

A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por padrão. Para alterar esse intervalo, use a opção --interval juntamente com o número de segundos para sondar seguido pelo caractere s, por exemplo, por cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Alterar o formato de saída de progresso da sincronização

As informações de progresso da sincronização são a saída para o terminal no formato de texto por padrão. Para especificar o formato de saída de progresso da sincronização, use a opção --output especificando text (o padrão, se --output não for especificado de outra forma) ou json, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json

Compartilhar via

grupo de comandos `sync`

Sincronizar incrementalmente as alterações de arquivo local em um diretório remoto

Sincronizar totalmente as alterações de arquivo local em um diretório remoto

Sincronizar continuamente as alterações de arquivo local em um diretório remoto

Alterar o formato de saída de progresso da sincronização

Comentários

Recursos adicionais

Compartilhar via

grupo de comandos sync

Sincronizar incrementalmente as alterações de arquivo local em um diretório remoto

Sincronizar totalmente as alterações de arquivo local em um diretório remoto

Sincronizar continuamente as alterações de arquivo local em um diretório remoto

Alterar o formato de saída de progresso da sincronização

Comentários

Recursos adicionais

grupo de comandos `sync`