O que é a extensão do Databricks para Visual Studio Code?
A extensão do Databricks para Visual Studio Code permite que você se conecte aos workspaces remotos do Azure Databricks usando o IDE (ambiente de desenvolvimento integrado) do Visual Studio Code em execução no seu computador de desenvolvimento local. Em seguida, você pode:
- Defina, implante e execute os Pacotes de Ativos do Databricks para aplicar os padrões de CI/CD e as práticas recomendadas aos trabalhos do Azure Databricks, pipelines do Delta Live Tables e pilhas de MLOps usando a interface do usuário do Visual Studio Code. Confira O que são os Pacotes de Ativos do Databricks? e Recursos de extensão dos Pacotes de Ativos do Databricks.
- Executar arquivos de código Python locais usando o Visual Studio Code em clusters do Azure Databricks em workspaces remotos. Consulte Executar um arquivo Python em um cluster
- Executar arquivos de código Python locais (
.py
) e notebooks Python, R, Scala e SQL (.py
,.ipynb
,.r
,.scala
e.sql
) do Visual Studio Code como trabalhos do Azure Databricks em seus espaços de trabalho remotos. Consulte Executar um arquivo Python como um trabalho. - Instale e configure seu ambiente de depuração e o Databricks Connect usando uma lista de verificação simples que dispara caixas de diálogo de seleção. Confira Depurar código usando o Databricks Connect da extensão do Databricks para Visual Studio Code.
- Depure notebooks célula por célula no Visual Studio Code com o Databricks Connect. Consulte Executar e depurar células de notebook com o Databricks Connect usando a extensão Databricks para Visual Studio Code.
- Sincronizar o código local que você desenvolve no Visual Studio Code com o código em seus workspaces remotos.
Observação
A extensão do Databricks para Visual Studio Code dá suporte à execução de notebooks R, Scala e SQL como trabalhos automatizados, mas não fornece suporte mais profundo para essas linguagens no Visual Studio Code.
Introdução
Para começar a usar a extensão do Databricks para Visual Studio Code:
- Instalar a extensão.
- Crie um novo projeto do Databricks ou migre um projeto existente do Visual Studio Code.
- Configure seu projeto facilmente usando a interface do usuário da extensão do Databricks.
- Execute algum código Python como parte do tutorial de extensão.
- Depure seu código usando a integração do Databricks Connect.
- Teste seu código usando
pytest
. Confira Executar testes com o pytest para a extensão do Databricks para Visual Studio Code.
Criar um novo projeto do Databricks
Depois que a extensão for instalada, você poderá criar um novo projeto do Databricks usando a extensão do Databricks para Visual Studio Code:
- Inicie o Visual Studio Code.
- Clique no ícone do Databricks na barra lateral do Visual Studio Code para abrir a extensão.
- Clique em Criar um novo Projeto do Databricks.
- Na Paleta de comandos, selecione um host e um método de autenticação para o projeto. Confira Configuração de autenticação da extensão do Databricks para Visual Studio Code.
- Em Fornecer um caminho para uma pasta onde você deseja que seu novo projeto esteja, insira o caminho para uma pasta no computador de desenvolvimento local onde você deseja criar o projeto ou clique em Abrir caixa de diálogo de seleção de pasta e selecione o caminho para a pasta do projeto.
- Para Modelo a ser usado, na exibição de inicialização do projeto do Databricks, use as setas para cima e para baixo para selecionar um modelo de projeto e pressione Enter. Para obter informações sobre os modelos de projetos do pacote, consulte Modelos de Projeto do Pacote de Ativos do Databricks.
- Digite um Nome exclusivo para este projeto ou deixe o nome do projeto padrão de
my_project
e pressione Enter. - Escolha se deseja adicionar um notebook de stub (exemplo), um pipeline de stub (exemplo) do Delta Live Tables ou um pacote Python de stub (exemplo) ao projeto ou qualquer combinação desses stubs (exemplos).
- Pressione qualquer tecla para fechar a guia do editor de Inicialização do projeto do Databricks.
- Para Selecione o projeto que deseja abrir, escolha o projeto que você acabou de criar.
Migrar um projeto para um projeto do Databricks
Se você tiver um projeto existente e quiser migrá-lo para um projeto do Databricks, abra-o com a extensão do Databricks para Visual Studio Code para iniciar a migração:
- Inicie o Visual Studio Code. No menu principal, clique em Arquivo>Abrir pasta e navegue até o projeto para abri-lo.
- Clique no ícone do Databricks na barra lateral do Visual Studio Code para abrir a extensão.
- Clique em Migrar para um projeto do Databricks.
- Na Paleta de comandos, selecione um host e um método de autenticação para o projeto. Confira Configuração de autenticação da extensão do Databricks para Visual Studio Code.
Observação
Se você abrir um projeto criado usando a extensão do Databricks para Visual Studio Code v1, a migração tentará ocorrer automaticamente usando a autenticação existente do projeto e a configuração do workspace. O botão de migração só estará disponível se a migração automática falhar.
Abrir um projeto existente de Pacotes de Ativos do Databricks
Se a extensão do Databricks para Visual Studio Code descobrir mais de um projeto de Pacotes de Ativos do Databricks na pasta atual, a extensão do Databricks para Visual Studio Code permitirá que você escolha qual projeto abrir.
Observação
Um projeto de Pacotes de Ativos do Databricks tem um arquivo databricks.yml
na pasta raiz do projeto. Confira Configuração do Pacote de Ativos do Databricks.
Inicie o Visual Studio Code. No menu principal, clique em Arquivo>Abrir Pasta e navegue até o diretório que contém seu projeto de pacote.
Clique no ícone do Databricks na barra lateral do Visual Studio Code para abrir a extensão.
Clique em Abrir projeto existente do Databricks.
Na Paleta de Comandos, selecione seu projeto existente dos Pacotes de Ativos do Databricks.
Na Paleta de comandos, selecione um host e um método de autenticação para o projeto. Confira Configuração de autenticação da extensão do Databricks para Visual Studio Code.
Adicionar outro projeto do Databricks ao espaço de trabalho
A extensão do Databricks para Visual Studio Code permite que você tenha vários projetos do Databricks em seu espaço de trabalho do Visual Studio Code e alterne facilmente entre eles. Para adicionar outro projeto:
Inicie o Visual Studio Code. No menu principal, clique em Arquivo>Adicionar pasta ao espaço de trabalho e navegue até o diretório que contém seu outro projeto de pacote.
Clique no ícone do Databricks na barra lateral do Visual Studio Code para abrir a extensão.
Clique em Pasta do Espaço de Trabalho Ativo para selecionar o projeto a ser usado pela extensão.