Integración de DBeaver con Azure Databricks
Nota
En este artículo se trata DBeaver, desarrollado por un tercero. Para ponerse en contacto con el proveedor, consulte la página Problemas del repositorio dbeaver/dbeaver en GitHub.
DBeaver es una herramienta de base de datos local y multiplataforma para desarrolladores, administradores de bases de datos, analistas de datos, ingenieros de datos y otros que necesitan trabajar con bases de datos. DBeaver admite Azure Databricks, así como otras bases de datos populares.
En este artículo se describe cómo usar la máquina de desarrollo local para instalar, configurar y usar DBeaver Community Edition (CE) de código abierto gratuito para trabajar con bases de datos en Azure Databricks.
Nota
Este artículo se ha probado con macOS, Databricks JDBC Driver versión 2.6.36 y DBeaver CE versión 23.3.0.
Requisitos
Antes de instalar DBeaver, la máquina de desarrollo local debe cumplir los siguientes requisitos:
- Un sistema operativo Linux de 64 bits, macOS o Windows de 64 bits. (Se admite Linux de 32 bits, pero no se recomienda).
- Instale el controlador JDBC de Databricks en el equipo de desarrollo local, extrayendo el archivo
DatabricksJDBC42.jar
del archivoDatabricksJDBC42-<version>.zip
descargado.
También debe tener un clúster de Azure Databricks o SQL Warehouse para conectarse a DBeaver.
Paso 1: Instalar DBeaver
Descargue e instale DBeaver CE de la manera siguiente:
- Linux: Descargue y ejecute uno de los instaladores de Linux desde la página Download (Descargar) del sitio web de DBeaver. Las opciones de instalación
snap
yflatpak
también se encuentran en esta página. - macOS: use Homebrew para ejecutar
brew install --cask dbeaver-community
o use MacPorts para ejecutarsudo port install dbeaver-community
. También hay disponible un instalador de macOS en la página Descargar en el sitio web de DBeaver. - Windows: Usa Chocolatey para ejecutar
choco install dbeaver
. También hay disponible un instalador de Windows en la página Download (Descargar) del sitio web de DBeaver.
Paso 2: Configuración del controlador JDBC de Azure Databricks para DBeaver
Configura DBeaver con la información sobre el controlador JDBC de Databricks que descargaste anteriormente.
- Inicie DBeaver.
- Si se le pide que cree una nueva base de datos, haga clic en No.
- Si se le pide que se conecte o seleccione una base de datos, haga clic en Cancelar.
- Haga clic en Database > Driver Manager (Base de datos > Administrador de controladores).
- En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en New (Nuevo).
- En el cuadro de diálogo Create new driver (Crear nuevo controlador), haga clic en la pestaña Libraries (Bibliotecas).
- Haga clic en Agregar archivo.
- Navegue a la carpeta donde extrajo el controlador JDBC de Azure Databricks.
- Navegue por un nivel inferior para buscar el archivo
.jar
. - Resalte el archivo
.jar
y haga clic en Abrir. - En la pestaña Settings (Configuración), en Driver Name (Nombre del controlador), escriba
Databricks
. - En la pestaña Configuración , para Nombre de Clase, escriba
com.databricks.client.jdbc.Driver
. - Haga clic en Aceptar.
- En el cuadro de diálogo Driver Manager (Administrador de controladores), haga clic en Close (Cerrar).
Paso 3: Conexión de DBeaver a las bases de datos de Azure Databricks
Use DBeaver para conectarse al clúster o a SQL Warehouse para acceder a las bases de datos del área de trabajo de Azure Databricks.
En DBeaver, haga clic en Database > New Database Connection (Base de datos > Nueva conexión a base de datos).
En el cuadro de diálogo Connect to a database (Conexión a una base de datos), en la pestaña All (Todos), haga clic en Databricks y, a continuación, haga clic en Next (Siguiente).
Haga clic en la pestaña principal y escriba un valor en el campo URL de JDBC para el recurso de Azure Databricks. Para obtener la sintaxis del campo URL de JDBC, consulte Configuración de la autenticación del controlador JDBC de Databricks.
Haga clic en Probar conexión.
Sugerencia
Debe iniciar el recurso de Azure Databricks antes de probar la conexión. De lo contrario, la prueba puede tardar varios minutos en completarse mientras se inicia el recurso.
Si la conexión se establece correctamente, en el cuadro de diálogo Connection Test (Prueba de conexión), haga clic en OK (Aceptar).
En el cuadro de diálogo Connect to a database (Conexión a una base de datos), haga clic en Finish (Finalizar).
En la ventana Database Navigator (Navegador de bases de datos), se muestra la entrada Databricks. Para cambiar el nombre de la conexión para facilitar la identificación:
- Haga clic con el botón derecho en Databricks y, a continuación, haga clic en Edit connection (Editar conexión).
- En el cuadro de diálogo Connection configuration (Configuración de conexión), haga clic en General.
- En Connection name (Nombre de la conexión), reemplace
Databricks
por otro nombre para la conexión. - Haga clic en Aceptar.
Repita las instrucciones de este paso para cada recurso al que desea que acceda DBeaver.
Paso 4: Usar DBeaver para examinar objetos de datos
Use DBeaver para acceder a objetos de datos en el área de trabajo de Azure Databricks, como tablas y propiedades de tabla, vistas, índices, tipos de datos y otros tipos de objetos de datos.
En DBeaver, en la ventana Database Navigator, haga clic con el botón derecho en la conexión que desea usar.
Si Connect (Conectar) está habilitado, haga clic allí. (Si Connect está deshabilitado, ya está conectado).
Sugerencia
Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.
Expanda la conexión a la que acaba de conectarse.
Expanda y examine los objetos de datos disponibles. Haga doble clic en un objeto de datos para obtener más información sobre él.
Repita las instrucciones de este paso para acceder a objetos de datos adicionales.
Paso 5: Uso de DBeaver para ejecutar instrucciones SQL
Use DBeaver para cargar la tabla de ejemplo trips
desde el esquema nyctaxi
del catálogo samples
.
En DBeaver, en la ventana Database Navigator, haga clic con el botón derecho en la conexión que desea usar.
Si Connect está habilitado, haga clic en él. (Si Connect está deshabilitado, ya está conectado).
Sugerencia
Debe iniciar el recurso antes de intentar conectarse a él. De lo contrario, la conexión puede tardar varios minutos en completarse mientras se inicia el recurso.
Haga clic en SQL Editor > New SQL Script (Editor SQL > Nuevo script SQL).
En la pestaña Script-1 (nombre de conexión), escriba esta instrucción SQL:
SELECT * FROM samples.nyctaxi.trips;
Haga clic en Editor SQL > Ejecutar script SQL.
Pasos siguientes
- Use el editor de objetos de la base de datos para trabajar con propiedades de objetos de base de datos, datos y diagramas de relación de entidades.
- Use el editor de datos de para ver y editar datos en una tabla o vista de base de datos.
- Utiliza el editor de SQL para trabajar con scripts SQL.
- Trabaje con diagramas de relación de entidad (ERD) en DBeaver.
- Importar y exportar datos hacia y desde DBeaver.
- Migrar datos mediante DBeaver.
- Solución de problemas del controlador JDBC con DBeaver.