Código de depuração usando Databricks Connect para a extensão Databricks para Visual Studio Code
Este artigo descreve como usar a integração Databricks Connect na extensão Databricks para Visual Studio Code para executar e depurar arquivos Python (.py
) individuais. Consulte O que é a extensão Databricks para Visual Studio Code?.
A integração do Databricks Connect também permite executar e depurar células do bloco de anotações. Consulte Executar e depurar células do bloco de anotações com o Databricks Connect usando a extensão Databricks para Visual Studio Code.
Requisitos
Antes de poder usar o Databricks Connect de dentro da extensão Databricks para Visual Studio Code, você deve primeiro atender aos requisitos do Databricks Connect. Esses requisitos incluem coisas como um espaço de trabalho habilitado para Unity Catalog, requisitos de computação e requisitos de versão para sua instalação local do Python.
Ativar um ambiente virtual Python
Ative um ambiente virtual Python para seu projeto Python. Os ambientes virtuais Python ajudam a certificar-se de que o seu projeto está a utilizar versões compatíveis dos pacotes Python e Python (neste caso, o pacote Databricks Connect).
No painel Configuração:
- Clique no item vermelho Ativar Ambiente Virtual em Ambiente Python.
- Na Paleta de Comandos, select Venv ou Conda.
- Select as dependências que deseja instalar, se houver.
Instalar o Databricks Connect
Na visualização Configuração em Ambiente Python:
- Clique no botão vermelho Install databricks-connect play.
- Anexe um cluster.
- Se a seção Cluster ainda não estiver configurada na extensão, a seguinte mensagem será exibida: "Anexe um cluster para usar o Databricks Connect". Clique em Anexar Cluster e select um cluster que cumpra os requisitos do Databricks Connect.
- Se a seção de Cluster
estiver configurada, mas o cluster não for compatível com o Databricks Connect, clique no botão vermelho desativado do Databricks Connect, clique em Anexar de Cluster eum cluster compatível.
- Se o pacote Databricks Connect (e suas dependências) ainda não estiver instalado, a seguinte mensagem será exibida: "Para depuração interativa e preenchimento automático, você precisa do Databricks Connect. Gostaria de instalá-lo no ambiente
<environment-name>
." Clique em Install (Instalar). - Na barra de status do Visual Studio Code, se o botão vermelho Databricks Connect disabled for exibido, clique nele e conclua as instruções na tela para habilitá-lo.
- Depois que o botão Databricks Connect ativado for exibido, você estará pronto para usar o Databricks Connect.
Nota
Se você usar o Poetry, poderá sincronizar seus pyproject.toml
arquivos e poetry.lock
com o pacote Databricks Connect instalado (e suas dependências) executando o seguinte comando. Certifique-se de substituir 13.3.2
pela versão do pacote Databricks Connect que corresponde àquela que foi instalada pela extensão Databricks para Visual Studio Code para seu projeto.
poetry add databricks-connect==13.3.2
Executar ou depurar seu código Python
Depois de ativar o Databricks Connect, execute ou depure seu arquivo Python (.py
):
Em seu projeto, abra o arquivo Python que você deseja executar ou depurar.
Set quaisquer pontos de interrupção de depuração dentro do arquivo Python.
Clique no ícone Executar no Databricks ao lado das guias list do editor e, em seguida, clique em Databricks Connect: Depurar arquivo atual.
A saída aparece no painel Debug Console .
Você também pode clicar com o botão direito do mouse no
.py
arquivo e, em seguida, clicar em Executar no Databricks Databricks>Connect: Depurar arquivo atual.