Compartir a través de


Integración de DBeaver con Azure Databricks

Nota

En este artículo se trata DBeaver, desarrollado por un tercero. Para ponerse en contacto con el proveedor, consulte la página Problemas del repositorio dbeaver/dbeaver en GitHub.

DBeaver es una herramienta de base de datos local y multiplataforma para desarrolladores, administradores de bases de datos, analistas de datos, ingenieros de datos y otros que necesitan trabajar con bases de datos. DBeaver admite Azure Databricks, así como otras bases de datos populares.

En este artículo se describe cómo usar la máquina de desarrollo local para instalar, configurar y usar DBeaver Community Edition (CE) de código abierto gratuito para trabajar con bases de datos en Azure Databricks.

Nota

Este artículo se ha probado con macOS, Databricks JDBC Driver versión 2.6.36 y DBeaver CE versión 23.3.0.

Requisitos

Antes de instalar DBeaver, la máquina de desarrollo local debe cumplir los siguientes requisitos:

  • Un sistema operativo Linux de 64 bits, macOS o Windows de 64 bits. (Se admite Linux de 32 bits, pero no se recomienda).
  • Instale el controlador JDBC de Databricks en el equipo de desarrollo local, extrayendo el archivo DatabricksJDBC42.jar del archivo DatabricksJDBC42-<version>.zip descargado.

También debe tener un clúster de Azure Databricks o SQL Warehouse para conectarse a DBeaver.

Paso 1: Instalar DBeaver

Descargue e instale DBeaver CE de la manera siguiente:

  • Linux: Descargue y ejecute uno de los instaladores de Linux desde la página Download (Descargar) del sitio web de DBeaver. Las opciones de instalación snap y flatpak también se encuentran en esta página.
  • macOS: use Homebrew para ejecutar brew install --cask dbeaver-communityo use MacPorts para ejecutar sudo port install dbeaver-community. También hay disponible un instalador de macOS en la página Descargar en el sitio web de DBeaver.
  • Windows: Usa Chocolatey para ejecutar choco install dbeaver. También hay disponible un instalador de Windows en la página Download (Descargar) del sitio web de DBeaver.

Paso 2: Configuración del controlador JDBC de Azure Databricks para DBeaver

Configura DBeaver con la información sobre el controlador JDBC de Databricks que descargaste anteriormente.

  1. Inicie DBeaver.
  2. Si se le pide que cree una nueva base de datos, haga clic en No.
  3. Si se le pide que se conecte o seleccione una base de datos, haga clic en Cancelar.
  4. Haga clic en Database > Driver Manager (Base de datos > Administrador de controladores).
  5. En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en New (Nuevo).
  6. En el cuadro de diálogo Create new driver (Crear nuevo controlador), haga clic en la pestaña Libraries (Bibliotecas).
  7. Haga clic en Agregar archivo.
  8. Navegue a la carpeta donde extrajo el controlador JDBC de Azure Databricks.
  9. Navegue por un nivel inferior para buscar el archivo .jar.
  10. Resalte el archivo .jar y haga clic en Abrir.
  11. En la pestaña Settings (Configuración), en Driver Name (Nombre del controlador), escriba Databricks.
  12. En la pestaña Configuración , para Nombre de Clase, escriba com.databricks.client.jdbc.Driver.
  13. Haga clic en Aceptar.
  14. En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en Close (Cerrar).

Paso 3: Conexión de DBeaver a las bases de datos de Azure Databricks

Use DBeaver para conectarse al clúster o a SQL Warehouse para acceder a las bases de datos del área de trabajo de Azure Databricks.

  1. En DBeaver, haga clic en Database > New Database Connection (Base de datos > Nueva conexión a base de datos).

  2. En el cuadro de diálogo Connect to a database (Conexión a una base de datos), en la pestaña All (Todos), haga clic en Databricks y, a continuación, haga clic en Next (Siguiente).

  3. Haga clic en la pestaña principal y escriba un valor en el campo URL de JDBC para el recurso de Azure Databricks. Para obtener la sintaxis del campo URL de JDBC, consulte Configuración de la autenticación del controlador JDBC de Databricks.

  4. Haga clic en Probar conexión.

    Sugerencia

    Debe iniciar el recurso de Azure Databricks antes de probar la conexión. De lo contrario, la prueba puede tardar varios minutos en completarse mientras se inicia el recurso.

  5. Si la conexión se establece correctamente, en el cuadro de diálogo Connection Test (Prueba de conexión), haga clic en OK (Aceptar).

  6. En el cuadro de diálogo Connect to a database (Conexión a una base de datos), haga clic en Finish (Finalizar).

En la ventana Database Navigator (Navegador de bases de datos), se muestra la entrada Databricks. Para cambiar el nombre de la conexión para facilitar la identificación:

  1. Haga clic con el botón derecho en Databricks y, a continuación, haga clic en Edit connection (Editar conexión).
  2. En el cuadro de diálogo Connection configuration (Configuración de conexión), haga clic en General.
  3. En Connection name (Nombre de la conexión), reemplace Databricks por otro nombre para la conexión.
  4. Haga clic en Aceptar.

Repita las instrucciones de este paso para cada recurso al que desea que acceda DBeaver.

Paso 4: Usar DBeaver para examinar objetos de datos

Use DBeaver para acceder a objetos de datos en el área de trabajo de Azure Databricks, como tablas y propiedades de tabla, vistas, índices, tipos de datos y otros tipos de objetos de datos.

  1. En DBeaver, en la ventana Database Navigator, haga clic con el botón derecho en la conexión que desea usar.

  2. Si Connect (Conectar) está habilitado, haga clic allí. (Si Connect está deshabilitado, ya está conectado).

    Sugerencia

    Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.

  3. Expanda la conexión a la que acaba de conectarse.

  4. Expanda y examine los objetos de datos disponibles. Haga doble clic en un objeto de datos para obtener más información sobre él.

Repita las instrucciones de este paso para acceder a objetos de datos adicionales.

Paso 5: Uso de DBeaver para ejecutar instrucciones SQL

Use DBeaver para cargar la tabla de ejemplo trips desde el esquema nyctaxi del catálogo samples.

  1. En DBeaver, en la ventana Database Navigator, haga clic con el botón derecho en la conexión que desea usar.

  2. Si Connect está habilitado, haga clic en él. (Si Connect está deshabilitado, ya está conectado).

    Sugerencia

    Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.

  3. Haga clic en SQL Editor > New SQL Script (Editor SQL > Nuevo script SQL).

  4. En la pestaña Script-1 (nombre de conexión), escriba esta instrucción SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Haga clic en Editor SQL > Ejecutar script SQL.

Pasos siguientes

Recursos adicionales