Use o JupyterLab com o Databricks Connect para Python
Observação
Esse artigo aborda o Databricks Connect para Databricks Runtime 13.3 LTS e superior.
Este artigo aborda como usar o Databricks Connect para Python com JupyterLab. O Databricks Connect permite que você conecte servidores de notebook, IDEs populares e outros aplicativos personalizados aos clusters do Azure Databricks. Consulte O que é o Databricks Connect?.
Observação
Antes de começar a utilizar o Databricks Connect, você deve configurar o cliente Databricks Connect.
Para usar o Databricks Connect com o JupyterLab e Python, siga estas instruções.
Para instalar o JupyterLab, com o ambiente virtual Python ativado, execute o seguinte comando no terminal ou no Prompt de Comando:
pip3 install jupyterlab
Para iniciar o JupyterLab no navegador da Web, execute o seguinte comando no ambiente virtual Python ativado:
jupyter lab
Se o JupyterLab não aparecer no navegador da Web, copie o URL que começa com
localhost
ou127.0.0.1
do seu ambiente virtual e insira-o na barra de endereços do navegador da Web.Crie um novo notebook: no JupyterLab, clique em Arquivo > Novo > Notebook no menu principal, selecione Python 3 (ipykernel) e clique em Selecionar.
Na primeira célula do notebook, insira o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá inicializar
DatabricksSession
no mínimo conforme mostrado no código de exemplo.Para executar o notebook, clique em Executar > Executar Todas as Células. Todos os códigos são executados localmente, enquanto todos os códigos que envolvem operações do DataFrame são executados no cluster no workspace remoto do Azure Databricks e as respostas de execução são enviadas de volta para o chamador local.
Para depurar o notebook, clique no ícone de bug (Habilitar Depurador) ao lado de Python 3 (ipykernel) na barra de ferramentas do notebook. Defina um ou mais pontos de interrupção e clique em Executar > Executar Todas as Células. Todos os códigos são depurados localmente, enquanto todos os códigos do Spark continuam sendo executados no cluster no workspace remoto do Azure Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.
Para desligar o JupyterLab, clique em Arquivo > Desligado. Se o processo do JupyterLab ainda estiver em execução no seu terminal ou prompt de comando, interrompa esse processo pressionando
Ctrl + c
e, em seguida, inserindoy
para confirmar.
Para obter instruções de depuração mais específicas, confira Depurador.