Integración de DataGrip con Azure Databricks
Nota:
En este artículo se trata DataGrip, que no se proporciona ni es compatible con Databricks. Para ponerse en contacto con el proveedor, consulte Soporte técnico de DataGrip.
DataGrip es un entorno de desarrollo integrado (IDE) para desarrolladores de bases de datos, que proporciona una consola de consulta, navegación de esquemas, planes de explicación, finalización de código inteligente, análisis en tiempo real y correcciones rápidas, refactorizaciones, integración del control de versiones y otras características.
En este artículo se describe cómo usar la máquina de desarrollo local para instalar, configurar y usar DataGrip, para trabajar con bases de datos de Azure Databricks.
Nota:
Este artículo se ha probado con macOS, Databricks JDBC Driver versión 2.6.36, y DataGrip versión 2023.3.1.
Requisitos
Antes de instalar DataGrip, la máquina de desarrollo local debe cumplir los siguientes requisitos:
- Un sistema operativo Windows, macOS o Linux.
- Descargue Databricks JDBC Driver en la máquina de desarrollo local, extrayendo el archivo
DatabricksJDBC42.jar
del archivo descargadoDatabricksJDBC42-<version>.zip
. - Un clúster de Azure Databricks o un almacén de SQL para conectar con DataGrip.
Paso 1: instalación de DataGrip
Descarga e instalación de DataGrip.
- Linux: descargue el archivo
.zip
, extraiga su contenido, y después siga las instrucciones del archivoInstall-Linux-tar.txt
. - macOS: descargue y ejecute el archivo
.dmg
. - Windows: descargue y ejecute el archivo
.exe
.
Para más información, consulte Instalación de DataGrip en el sitio web de DataGrip.
Paso 2: configuración de Databricks JDBC Driver para DataGrip
Configure DataGrip con información sobre Databricks JDBC Driver, que descargó anteriormente.
- Inicio de DataGrip.
- Haga clic en Archivo > Orígenes de datos.
- En el cuadro de diálogo Orígenes de datos y controladores, haga clic en la pestaña Controladores.
- Haga clic en el botón + (Controlador) para agregar un controlador.
- En Nombre, escriba
Databricks
. - En la pestaña General, en la lista Archivos de controlador, haga clic en el botón + (Agregar).
- Haga clic en JAR personalizados.
- Examine y seleccione el archivo
DatabricksJDBC42.jar
que extrajo anteriormente, y después haga clic en Abrir. - En Class (Clase), seleccione
com.databricks.client.jdbc.Driver
. - Haga clic en Aceptar.
Paso 3: conexión de DataGrip a las bases de datos de Azure Databricks
En DataGrip, haga clic en Archivo > Orígenes de datos.
En la pestaña Orígenes de datos, haga clic en el botón + (Agregar).
Seleccione el controlador de Databricks que agregó en el paso anterior.
En la pestaña General, para Dirección URL, escriba el valor del campo URL de JDBC en el recurso de Azure Databricks, como se muestra a continuación. Para obtener la sintaxis del campo URL de JDBC, consulte Configuración de la autenticación del controlador JDBC de Databricks.
Nota:
La
ConnCatalog
configuración de la funcionalidad del controlador debe especificarse en la dirección URL de JDBC; de lo contrario, no se pueden identificar esquemas.Haga clic en Probar conexión.
Sugerencia
Debe iniciar el recurso antes de probar la conexión. De lo contrario, la prueba puede tardar varios minutos en completarse mientras se inicia el recurso.
Si la conexión se realiza correctamente, en la pestaña Esquemas, compruebe las casillas de los esquemas a los que desea poder acceder, por ejemplo, Todos los esquemas.
Haga clic en OK.
Repita las instrucciones de este paso para cada recurso al que quiera que acceda DataGrip.
Paso 4: uso de DataGrip para examinar tablas
Use DataGrip para acceder a las tablas del área de trabajo de Azure Databricks.
- En DataGrip, en la ventana Base de datos, expanda el nodo de recursos, expanda el esquema que desea examinar, y después expanda tablas.
- Haga doble clic en una tabla. Se muestra el primer conjunto de filas de la tabla.
Repita las instrucciones de este paso para acceder a tablas adicionales.
Para acceder a las tablas de otros esquemas, en la barra de herramientas de la ventana Base de datos, haga clic en el icono Propiedades del origen de datos. En el cuadro de diálogo Orígenes de datos y controladores, en la pestaña Esquemas, active la casilla de cada esquema adicional al que desee acceder, y después haga clic en Aceptar.
Paso 5: uso de DataGrip para ejecutar instrucciones SQL
Use DataGrip para cargar la tabla de ejemplo trips
desde el samples
esquema de catálogonyctaxi
.
En DataGrip, haga clic en Archivo> nuevo > archivo SQL.
Escriba un nombre para el archivo, por ejemplo
select_trips
.En la pestaña archivo
select_trips.sql
, escriba la siguiente instrucción SQL:SELECT * FROM samples.nyctaxi.trips;
Seleccione la instrucción
SELECT
.En la barra de herramientas de la pestaña Archivo, haga clic en el icono Ejecutar.
Pasos siguientes
- Obtenga información sobre la consola de consulta en DataGrip.
- Obtenga información sobre el Editor de datos en DataGrip.
- Obtenga información sobre las distintas ventanas de herramientas en DataGrip.
- Obtenga información sobre cómo buscar en DataGrip.
- Obtenga información sobre cómo exportar datos en DataGrip.
- Obtenga información sobre cómo buscar y reemplazar texto mediante expresiones regulares en DataGrip.