Compartilhar via


Use o JupyterLab com o Databricks Connect para Python

Observação

Esse artigo aborda o Databricks Connect para Databricks Runtime 13.3 LTS e superior.

Este artigo aborda como usar o Databricks Connect para Python com JupyterLab. O Databricks Connect permite que você conecte servidores de notebook, IDEs populares e outros aplicativos personalizados aos clusters do Azure Databricks. Consulte O que é o Databricks Connect?.

Observação

Antes de começar a utilizar o Databricks Connect, você deve configurar o cliente Databricks Connect.

Para usar o Databricks Connect com o JupyterLab e Python, siga estas instruções.

  1. Para instalar o JupyterLab, com o ambiente virtual Python ativado, execute o seguinte comando no terminal ou no Prompt de Comando:

    pip3 install jupyterlab
    
  2. Para iniciar o JupyterLab no navegador da Web, execute o seguinte comando no ambiente virtual Python ativado:

    jupyter lab
    

    Se o JupyterLab não aparecer no navegador da Web, copie o URL que começa com localhost ou 127.0.0.1 do seu ambiente virtual e insira-o na barra de endereços do navegador da Web.

  3. Crie um novo notebook: no JupyterLab, clique em Arquivo > Novo > Notebook no menu principal, selecione Python 3 (ipykernel) e clique em Selecionar.

  4. Na primeira célula do notebook, insira o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá inicializar DatabricksSession no mínimo conforme mostrado no código de exemplo.

  5. Para executar o notebook, clique em Executar > Executar Todas as Células. Todos os códigos são executados localmente, enquanto todos os códigos que envolvem operações do DataFrame são executados no cluster no workspace remoto do Azure Databricks e as respostas de execução são enviadas de volta para o chamador local.

  6. Para depurar o notebook, clique no ícone de bug (Habilitar Depurador) ao lado de Python 3 (ipykernel) na barra de ferramentas do notebook. Defina um ou mais pontos de interrupção e clique em Executar > Executar Todas as Células. Todos os códigos são depurados localmente, enquanto todos os códigos do Spark continuam sendo executados no cluster no workspace remoto do Azure Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.

  7. Para desligar o JupyterLab, clique em Arquivo > Desligado. Se o processo do JupyterLab ainda estiver em execução no seu terminal ou prompt de comando, interrompa esse processo pressionando Ctrl + c e, em seguida, inserindo y para confirmar.

Para obter instruções de depuração mais específicas, confira Depurador.