Use o JupyterLab com o Databricks Connect para Python

Artigo
03/01/2024

Observação

Esse artigo aborda o Databricks Connect para Databricks Runtime 13.3 LTS e superior.

Este artigo aborda como usar o Databricks Connect para Python com JupyterLab. O Databricks Connect permite que você conecte servidores de notebook, IDEs populares e outros aplicativos personalizados aos clusters do Azure Databricks. Consulte O que é o Databricks Connect?.

Observação

Antes de começar a utilizar o Databricks Connect, você deve configurar o cliente Databricks Connect.

Para usar o Databricks Connect com o JupyterLab e Python, siga estas instruções.

Para instalar o JupyterLab, com o ambiente virtual Python ativado, execute o seguinte comando no terminal ou no Prompt de Comando:
```
pip3 install jupyterlab
```
Para iniciar o JupyterLab no navegador da Web, execute o seguinte comando no ambiente virtual Python ativado:
```
jupyter lab
```
Se o JupyterLab não aparecer no navegador da Web, copie o URL que começa com localhost ou 127.0.0.1 do seu ambiente virtual e insira-o na barra de endereços do navegador da Web.
Crie um novo notebook: no JupyterLab, clique em Arquivo > Novo > Notebook no menu principal, selecione Python 3 (ipykernel) e clique em Selecionar.
Na primeira célula do notebook, insira o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá inicializar DatabricksSession no mínimo conforme mostrado no código de exemplo.
Para executar o notebook, clique em Executar > Executar Todas as Células. Todos os códigos são executados localmente, enquanto todos os códigos que envolvem operações do DataFrame são executados no cluster no workspace remoto do Azure Databricks e as respostas de execução são enviadas de volta para o chamador local.
Para depurar o notebook, clique no ícone de bug (Habilitar Depurador) ao lado de Python 3 (ipykernel) na barra de ferramentas do notebook. Defina um ou mais pontos de interrupção e clique em Executar > Executar Todas as Células. Todos os códigos são depurados localmente, enquanto todos os códigos do Spark continuam sendo executados no cluster no workspace remoto do Azure Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.
Para desligar o JupyterLab, clique em Arquivo > Desligado. Se o processo do JupyterLab ainda estiver em execução no seu terminal ou prompt de comando, interrompa esse processo pressionando Ctrl + c e, em seguida, inserindo y para confirmar.

Para obter instruções de depuração mais específicas, confira Depurador.

Compartilhar via

Use o JupyterLab com o Databricks Connect para Python

Comentários

Recursos adicionais