Compartilhar via


grupo de comandos sync

Observação

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.

O sync grupo de comandos dentro da CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks.

Observação

  • Os comandos sync não podem sincronizar alterações de arquivo de um diretório em um workspace remoto do Azure Databricks, de volta para um diretório dentro de um sistema de arquivos local.
  • sync Os comandos podem sincronizar alterações de arquivo de um computador de desenvolvimento local somente com arquivos de usuário (/Users) do workspace em seu workspace do Azure Databricks. Ele não pode sincronizar com arquivos DBFS (dbfs:/). Para sincronizar as alterações de arquivo de um computador de desenvolvimento local para o DBFS (dbfs:/) no workspace do Azure Databricks, use o utilitário de sincronização dbx.

Você executa comandos sync anexando-os a databricks sync. Para exibir a ajuda para o comando sync, execute databricks sync -h.

Sincronizar incrementalmente as alterações de arquivo local em um diretório remoto

Para executar uma sincronização única e unidirecional de alterações de arquivo em um diretório de sistema de arquivos local, para um diretório dentro de um workspace remoto do Azure Databricks, execute o comando sync da seguinte maneira:

databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental única e unidirecional de todas as alterações de arquivo na pasta nomeada my-folder dentro do diretório de trabalho atual local, para um caminho específico dentro do workspace remoto, execute o seguinte comando:

databricks sync ./my-folder/ /Users/someone@example.com/

Neste exemplo, somente as alterações de arquivo desde a última execução do sync comando são sincronizadas com /Users/someone@example.com/. Por padrão, a URL do workspace no perfil do DEFAULT chamador é usada para determinar o workspace remoto ao qual sincronizar.

Sincronizar totalmente as alterações de arquivo local em um diretório remoto

Para executar uma sincronização unidirecional única e completa de alterações de arquivo em um diretório de sistema de arquivos local para um diretório dentro de um workspace remoto do Azure Databricks, independentemente de quando o último sync comando foi executado, use a opção --full , por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronizar continuamente as alterações de arquivo local em um diretório remoto

Para ativar a sincronização contínua e unidirecional das alterações de arquivos em um diretório do sistema de arquivos local para um diretório em um espaço de trabalho remoto do Azure Databricks, use a opção --watch, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

A sincronização unidirecional continua até que o comando seja interrompido do terminal, normalmente pressionando Ctrl + c ou Ctrl + z.

A sondagem de possíveis eventos de sincronização ocorre uma vez por segundo por padrão. Para alterar esse intervalo, use a opção --interval juntamente com o número de segundos para sondar seguido pelo caractere s, por exemplo, por cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Alterar o formato de saída de progresso da sincronização

As informações de progresso da sincronização são a saída para o terminal no formato de texto por padrão. Para especificar o formato de saída de progresso da sincronização, use a opção --output especificando text (o padrão, se --output não for especificado de outra forma) ou json, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json