Partilhar via


Integração do DBeaver com o Azure Databricks

Observação

Este artigo aborda o DBeaver, que é desenvolvido por terceiros. Para entrar em contato com o provedor, consulte a página problemas de do repositório dbeaver/dbeaver no GitHub.

DBeaver é uma ferramenta de banco de dados local e multiplataforma para desenvolvedores, administradores de banco de dados, analistas de dados, engenheiros de dados e outros que precisam trabalhar com bancos de dados. O DBeaver suporta o Azure Databricks, bem como outros bancos de dados populares.

Este artigo descreve como usar sua máquina de desenvolvimento local para instalar, configurar e usar o DBeaver Community Edition (CE) gratuito e de código aberto para trabalhar com bancos de dados no Azure Databricks.

Observação

Este artigo foi testado com macOS, Databricks JDBC Driver versão 2.6.36 e DBeaver CE versão 23.3.0.

Requerimentos

Antes de instalar o DBeaver, sua máquina de desenvolvimento local deve atender aos seguintes requisitos:

  • Um sistema operacional Linux de 64 bits, macOS ou Windows de 64 bits. (Linux de 32 bits é suportado, mas não recomendado.)
  • Instale o Databricks JDBC Driver na sua máquina de desenvolvimento local, extraindo o arquivo DatabricksJDBC42.jar do arquivo DatabricksJDBC42-<version>.zip baixado.

Você também deve ter um Azure Databricks cluster ou SQL warehouse para se conectar ao DBeaver.

Etapa 1: Instalar o DBeaver

Faça o download e instale DBeaver CE da seguinte maneira:

  • Linux: Faça o download e execute um dos instaladores Linux desde a página Download no site do DBeaver. As opções de instalação snap e flatpak também são fornecidas nesta página.
  • macOS: Use Homebrew para executar brew install --cask dbeaver-communityou use MacPorts para executar sudo port install dbeaver-community. Um instalador do macOS também está disponível na página Download no site do DBeaver.
  • Windows: Use Chocolatey para executar choco install dbeaver. Um instalador do Windows também está disponível na página Download no site do DBeaver.

Etapa 2: Configurar o driver JDBC do Azure Databricks para DBeaver

Configure o DBeaver com informações sobre o Databricks JDBC Driver que você baixou anteriormente.

  1. Inicie o DBeaver.
  2. Se lhe for pedido para criar uma nova base de dados, clique em Não.
  3. Se você for solicitado a se conectar ou selecionar um banco de dados, clique em Cancelar.
  4. Clique em Base de Dados > Driver Manager.
  5. Na caixa de diálogo Driver Manager, clique em Novo.
  6. Na caixa de diálogo Criar novo driver, clique no separador Bibliotecas.
  7. Clique Adicionar arquivo.
  8. Navegue até a pasta para a qual você extraiu o Driver JDBC do Azure Databricks.
  9. Navegue um nível mais baixo para encontrar o arquivo .jar.
  10. Realce o arquivo .jar e clique em Abrir.
  11. No separador Configurações , para o Nome do Controlador, introduza Databricks.
  12. No separador Definições, para Nome da Classe, introduza com.databricks.client.jdbc.Driver.
  13. Clique OK.
  14. Na caixa de diálogo do Driver Manager, clique em Fechar.

Etapa 3: Conectar o DBeaver aos bancos de dados do Azure Databricks

Use o DBeaver para se conectar ao cluster ou ao SQL warehouse para acessar os bancos de dados em seu espaço de trabalho do Azure Databricks.

  1. No DBeaver, clique em Database > New Database Connection.

  2. Na caixa de diálogo Ligar a uma base de dados, no separador Todos, clique em Databrickse, em seguida, clique em Seguinte.

  3. Clique na aba Principal e insira um valor no campo URL JDBC para o seu recurso Azure Databricks. Para a sintaxe do campo URL JDBC , consulte as definições de autenticação para o Databricks JDBC Driver.

  4. Clique em Testar Conexão .

    Dica

    Você deve iniciar seu recurso Azure Databricks antes de testar sua conexão. Caso contrário, o teste pode levar vários minutos para ser concluído enquanto o recurso é iniciado.

  5. Se a conexão for bem-sucedida, na caixa de diálogo de Teste de Conexão, clique em OK.

  6. Na caixa de diálogo Ligar a uma base de dados, clique em Concluir.

Na janela do Navegador de Banco de Dados , uma entrada Databricks é exibida. Para alterar o nome da conexão para facilitar a identificação:

  1. Clique com o botão direito do rato Databrickse, em seguida, clique em Editar Conexão.
  2. Na caixa de diálogo de configuração Conexão, clique em Geral.
  3. Para Nome da conexão, substitua Databricks por um nome diferente para a conexão.
  4. Clique OK.

Repita as instruções nesta etapa para cada recurso que você deseja que o DBeaver acesse.

Etapa 4: Usar o DBeaver para procurar objetos de dados

Use o DBeaver para acessar objetos de dados em seu espaço de trabalho do Azure Databricks, como tabelas e propriedades de tabela, exibições, índices, tipos de dados e outros tipos de objeto de dados.

  1. No DBeaver, na janela Database Navigator, clique com o botão direito do mouse na conexão que você deseja usar.

  2. Se Connect estiver ativado, clique nele. (Se Connect estiver desativado, você já está conectado.)

    Dica

    Você deve iniciar seu recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Expanda a conexão à qual você acabou de se conectar.

  4. Expanda e procure objetos de dados disponíveis. Clique duas vezes em um objeto de dados para obter mais informações sobre ele.

Repita as instruções nesta etapa para acessar objetos de dados adicionais.

Etapa 5: Usar o DBeaver para executar instruções SQL

Utilize o DBeaver para carregar a tabela de amostra trips do catálogo samples e do esquema nyctaxi.

  1. No DBeaver, na janela Database Navigator, clique com o botão direito do mouse na conexão que você deseja usar.

  2. Se Connect estiver ativado, clique nele. (Se Connect estiver desativado, você já está conectado.)

    Dica

    Você deve iniciar seu recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Clique em Editor SQL > Novo Script SQL.

  4. Na guia (nome da conexão) Script-1, insira esta instrução SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Clique no Editor SQL e > execute o script SQL.

Próximos passos

Recursos adicionais