Partilhar via


Integração do DBeaver com o Azure Databricks

Nota

Este artigo aborda o DBeaver, que não é fornecido nem suportado pelo Databricks. Para entrar em contato com o provedor, consulte usar a página Problemas do repositório dbeaver/dbeaver no GitHub.

DBeaver é uma ferramenta de banco de dados local e multiplataforma para desenvolvedores, administradores de banco de dados, analistas de dados, engenheiros de dados e outros que precisam trabalhar com bancos de dados. O DBeaver suporta o Azure Databricks, bem como outros bancos de dados populares.

Este artigo descreve como usar sua máquina de desenvolvimento local para instalar, configurar e usar o DBeaver Community Edition (CE) gratuito e de código aberto para trabalhar com bancos de dados no Azure Databricks.

Nota

Este artigo foi testado com macOS, Databricks JDBC Driver versão 2.6.36 e DBeaver CE versão 23.3.0.

Requisitos

Antes de instalar o DBeaver, sua máquina de desenvolvimento local deve atender aos seguintes requisitos:

  • Um sistema operacional Linux de 64 bits, macOS ou Windows de 64 bits. (Linux de 32 bits é suportado, mas não recomendado.)
  • O Databricks JDBC Driver em sua máquina de desenvolvimento local, extraindo o DatabricksJDBC42.jar arquivo do arquivo baixado DatabricksJDBC42-<version>.zip .

Você também deve ter um cluster do Azure Databricks ou um armazém SQL para se conectar ao DBeaver.

Etapa 1: Instalar o DBeaver

Faça o download e instale o DBeaver CE da seguinte maneira:

  • Linux: Faça o download e execute um dos instaladores Linux na página Download no site do DBeaver. snap e flatpak as opções de instalação também são fornecidas nesta página.
  • macOS: Use o Homebrew para executar brew install --cask dbeaver-communityo , ou use MacPorts para executar sudo port install dbeaver-communityo . Um instalador do macOS também está disponível na página Download no site do DBeaver.
  • Windows: Use o Chocolatey para executar choco install dbeavero . Um instalador do Windows também está disponível na página Download no site do DBeaver.

Etapa 2: Configurar o driver JDBC do Azure Databricks para DBeaver

Configure o DBeaver com informações sobre o Databricks JDBC Driver que você baixou anteriormente.

  1. Inicie o DBeaver.
  2. Se você for solicitado a criar um novo banco de dados, clique em Não.
  3. Se você for solicitado a se conectar ou selecionar um banco de dados, clique em Cancelar.
  4. Clique em Gerenciador de driver de banco de dados>.
  5. Na caixa de diálogo Gerenciador de Driver, clique em Novo.
  6. Na caixa de diálogo Criar novo driver, clique na guia Bibliotecas.
  7. Clique em Adicionar arquivo.
  8. Navegue até a pasta para a qual você extraiu o Driver JDBC do Azure Databricks.
  9. Navegue um nível mais baixo para localizar o .jar arquivo.
  10. Realce o .jar ficheiro e clique em Abrir.
  11. Na guia Configurações, para Nome do driver, digite Databricks.
  12. Na guia Configurações, para Nome da classe, digite com.databricks.client.jdbc.Driver.
  13. Clique em OK.
  14. Na caixa de diálogo Gerenciador de driver , clique em Fechar.

Etapa 3: Conectar o DBeaver aos bancos de dados do Azure Databricks

Use o DBeaver para se conectar ao cluster ou ao SQL warehouse para acessar os bancos de dados em seu espaço de trabalho do Azure Databricks.

  1. No DBeaver, clique em Database > New Database Connection.

  2. Na caixa de diálogo Ligar a uma base de dados, no separador Todos, clique em Databricks e, em seguida, clique em Seguinte.

  3. Clique na guia Principal e insira um valor no campo URL JDBC para seu recurso Azure Databricks. Para obter a sintaxe do campo URL JDBC, consulte Configurações de autenticação para o driver JDBC Databricks.

  4. Clique em Testar Ligação.

    Gorjeta

    Você deve iniciar seu recurso Azure Databricks antes de testar sua conexão. Caso contrário, o teste pode levar vários minutos para ser concluído enquanto o recurso é iniciado.

  5. Se a conexão for bem-sucedida, na caixa de diálogo Teste de Conexão, clique em OK.

  6. Na caixa de diálogo Conectar a um banco de dados, clique em Concluir.

Na janela Navegador de Banco de Dados, uma entrada Databricks é exibida. Para alterar o nome da conexão para facilitar a identificação:

  1. Clique com o botão direito do rato em Databricks e, em seguida, clique em Editar Ligação.
  2. Na caixa de diálogo Configuração da conexão , clique em Geral.
  3. Em Nome da conexão, substitua Databricks por um nome diferente para a conexão.
  4. Clique em OK.

Repita as instruções nesta etapa para cada recurso que você deseja que o DBeaver acesse.

Etapa 4: Usar o DBeaver para procurar objetos de dados

Use o DBeaver para acessar objetos de dados em seu espaço de trabalho do Azure Databricks, como tabelas e propriedades de tabela, exibições, índices, tipos de dados e outros tipos de objeto de dados.

  1. No DBeaver, na janela Navegador de Banco de Dados , clique com o botão direito do mouse na conexão que deseja usar.

  2. Se Conectar estiver habilitado, clique nele. (Se Conectar está desativado, você já está conectado.)

    Gorjeta

    Você deve iniciar seu recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Expanda a conexão à qual você acabou de se conectar.

  4. Expanda e procure objetos de dados disponíveis. Clique duas vezes em um objeto de dados para obter mais informações sobre ele.

Repita as instruções nesta etapa para acessar objetos de dados adicionais.

Etapa 5: Usar o DBeaver para executar instruções SQL

Use o DBeaver para carregar a tabela de exemplo trips do esquema do nyctaxi samples catálogo.

  1. No DBeaver, na janela Navegador de Banco de Dados , clique com o botão direito do mouse na conexão que deseja usar.

  2. Se Conectar estiver habilitado, clique nele. (Se Conectar está desativado, você já está conectado.)

    Gorjeta

    Você deve iniciar seu recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Clique em Editor > SQL Novo Script SQL.

  4. Na guia (nome da conexão) Script-1 , insira esta instrução SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Clique em Editor > SQL Executar script SQL.

Próximos passos

Recursos adicionais