Compartilhar via


Integração do DBeaver ao Azure Databricks

Nota

Este artigo aborda o DBeaver, que é desenvolvido por terceiros. Para entrar em contato com o provedor, confira a página problemas do repositório dbeaver/dbeaver no GitHub.

DBeaver é uma ferramenta de banco de dados local de várias plataformas para desenvolvedores, administradores de banco de dados, analistas de dados, engenheiros de dados e outros que precisam trabalhar com bancos de dados. O DBeaver dá suporte ao Azure Databricks, bem como a outros bancos de dados populares.

Este artigo descreve como usar seu computador de desenvolvimento local para instalar, configurar e usar o DBeaver Community Edition (CE) gratuito e de software livre para trabalhar com bancos de dados no Azure Databricks.

Nota

Este artigo foi testado com macOS, Databricks JDBC Driver versão 2.6.36 e DBeaver CE versão 23.3.0.

Requisitos

Antes de instalar o DBeaver, seu computador de desenvolvimento local deve atender aos seguintes requisitos:

  • Um sistema operacional Linux de 64 bits, macOS ou Windows de 64 bits. (Há suporte para Linux de 32 bits, mas não é recomendado.)
  • Baixe o Driver JDBC do Databricks no computador de desenvolvimento local, extraindo o arquivo DatabricksJDBC42.jar do arquivo DatabricksJDBC42-<version>.zip baixado.

Você também precisa ter um cluster do Azure Databricks ou um SQL warehouse para se conectar ao DBeaver.

Etapa 1: Instalar o DBeaver

Baixe e instale do DBeaver CE da seguinte maneira:

  • Linux: baixe e execute um dos instaladores do Linux na página Download no site do DBeaver. as opções de instalação snap e flatpak também são fornecidas nesta página.
  • macOS: use Homebrew para executar brew install --cask dbeaver-communityou use MacPorts para executar sudo port install dbeaver-community. Um instalador do macOS também está disponível na página Download no site do DBeaver.
  • Windows: use Chocolatey para executar choco install dbeaver. Um instalador do Windows também está disponível na página Download no site do DBeaver.

Etapa 2: Configurar o JDBC Driver do Azure Databricks para DBeaver

Configure o DBeaver com informações sobre o Driver JDBC do Databricks que você baixou anteriormente.

  1. Inicie o DBeaver.
  2. Se for solicitado que você crie um novo banco de dados, clique em No.
  3. Se for solicitado que você se conecte ou selecione um banco de dados, clique em Cancelar.
  4. Selecione Banco de Dados > Gerenciador de Driver.
  5. Na caixa de diálogo Gerenciador de Driver, clique em Novo.
  6. Na caixa de diálogo Criar driver, selecione a guia Bibliotecas.
  7. Clique em Adicionar Arquivo.
  8. Navegue até a pasta para a qual você extraiu o JDBC Driver do Azure Databricks.
  9. Navegue um nível mais baixo para localizar o arquivo .jar.
  10. Destaque o arquivo .jar e clique em Abrir.
  11. Na guia Configurações, em Nome do Driver, insira Databricks.
  12. Na guia Configurações, em Nome da Classe, insira com.databricks.client.jdbc.Driver.
  13. Clique em OK.
  14. Na caixa de diálogo Gerenciador de Driver, selecione Fechar.

Etapa 3: Conectar o DBeaver aos bancos de dados do Azure Databricks

Use o DBeaver para se conectar ao cluster ou ao SQL Warehouse para acessar os bancos de dados no workspace do Azure Databricks.

  1. Em DBeaver, selecione Banco de Dados > Nova Conexão de Banco de Dados.

  2. Na caixa de diálogo Conectar-se a um banco de dados, na guia Tudo, selecione Databricks e depois Avançar.

  3. Selecione a guia Principal e insira um valor no campo URL do JDBC para seu recurso do Azure Databricks. Para obter a sintaxe do campo URL do JDBC, confira Configurações de autenticação para o Driver JDBC do Databricks.

  4. Selecione Testar Conexão.

    Dica

    Você deve iniciar o recurso do Azure Databricks antes de testar sua conexão. Caso contrário, o teste pode levar vários minutos para ser concluído enquanto o recurso é iniciado.

  5. Se a conexão for bem-sucedida, na caixa de diálogo Teste de Conexão, clique em OK.

  6. Na caixa de diálogo Conectar-se a um banco de dados, selecione Concluir.

Na janela do Database Navigator, uma entrada do Databricks é exibida. Para alterar o nome da conexão para facilitar a identificação:

  1. Clique com o botão direito do mouse em Databricks e selecione Editar Conexão.
  2. Na caixa de diálogo Configuração de conexão, clique em Geral.
  3. Em Nome da conexão, substitua Databricks por um nome diferente para a conexão.
  4. Clique em OK.

Repita as instruções nesta etapa para cada recurso que você deseja que o DBeaver acesse.

Etapa 4: Usar o DBeaver para procurar objetos de dados

Use o DBeaver para acessar objetos de dados em seu workspace do Azure Databricks, como tabelas e propriedades de tabela, exibições, índices, tipos de dados e outros tipos de objeto de dados.

  1. No DBeaver, na janela do Database Navigator, clique com o botão direito do mouse na conexão que você deseja usar.

  2. Se Connect estiver habilitado, clique nele. (Se Connect estiver desabilitado, você já estará conectado.)

    Dica

    Você deve iniciar o recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Expanda a conexão à qual você acabou de se conectar.

  4. Expanda e procure os objetos de dados disponíveis. Clique duas vezes em um objeto de dados para obter mais informações sobre ele.

Repita as instruções nesta etapa para acessar objetos de dados adicionais.

Etapa 5: Usar o DBeaver para executar instruções SQL

Use o DBeaver para carregar a tabela trips de exemplo do esquema nyctaxi do catálogo samples.

  1. No DBeaver, na janela do Database Navigator, clique com o botão direito do mouse na conexão que você deseja usar.

  2. Se Connect estiver habilitado, clique nele. (Se Connect estiver desabilitado, você já estará conectado.)

    Dica

    Você deve iniciar o recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Selecione SQL Editor > Novo Script SQL.

  4. Na guia (nome da conexão) Script-1, insira esta instrução SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Selecione Editor SQL> Executar script SQL.

Próximas etapas

  • Utilize o editor de objetos Banco de Dados para trabalhar com as propriedades, dados e diagramas de relação de entidade dos objetos de banco de dados.
  • Use o editor de dados para exibir e editar dados em uma tabela ou exibição de banco de dados.
  • Use o editor SQL para trabalhar com scripts SQL.
  • Trabalhe com diagramas de relacionamento de entidades (ERDs) no DBeaver.
  • Importe e exporte dados no DBeaver.
  • Migrar dados usando o DBeaver.
  • Solucionar problemas de driver do JDBC com o DBeaver.

Recursos adicionais