Compartir vía


Integración de DataGrip con Azure Databricks

Nota:

En este artículo se describe DataGrip, desarrollado por un tercero. Para ponerse en contacto con el proveedor, consulte Soporte técnico de DataGrip.

DataGrip es un entorno de desarrollo integrado (IDE) para desarrolladores de bases de datos, que proporciona una consola de consulta, navegación de esquemas, planes de explicación, finalización de código inteligente, análisis en tiempo real y correcciones rápidas, refactorizaciones, integración del control de versiones y otras características.

En este artículo se describe cómo usar la máquina de desarrollo local para instalar, configurar y usar DataGrip, para trabajar con bases de datos de Azure Databricks.

Nota:

Este artículo se ha probado con macOS, Databricks JDBC Driver versión 2.6.36, y DataGrip versión 2023.3.1.

Requisitos

Antes de instalar DataGrip, la máquina de desarrollo local debe cumplir los siguientes requisitos:

  • Un sistema operativo Windows, macOS o Linux.
  • Descargue Databricks JDBC Driver en la máquina de desarrollo local, extrayendo el archivo DatabricksJDBC42.jar del archivo descargado DatabricksJDBC42-<version>.zip.
  • Un clúster de Azure Databricks o un almacén de SQL para conectar con DataGrip.

Paso 1: instalación de DataGrip

Descarga e instalación de DataGrip.

  • Linux: descargue el archivo .zip, extraiga su contenido, y después siga las instrucciones del archivo Install-Linux-tar.txt.
  • macOS: descargue y ejecute el archivo .dmg.
  • Windows: descargue y ejecute el archivo .exe.

Para más información, consulte Instalación de DataGrip en el sitio web de DataGrip.

Paso 2: configuración de Databricks JDBC Driver para DataGrip

Configure DataGrip con información sobre Databricks JDBC Driver, que descargó anteriormente.

  1. Inicio de DataGrip.
  2. Haga clic en Archivo > Orígenes de datos.
  3. En el cuadro de diálogo Orígenes de datos y controladores, haga clic en la pestaña Controladores.
  4. Haga clic en el botón + (Controlador) para agregar un controlador.
  5. En Nombre, escriba Databricks.
  6. En la pestaña General, en la lista Archivos de controlador, haga clic en el botón + (Agregar).
  7. Haga clic en JAR personalizados.
  8. Examine y seleccione el archivo DatabricksJDBC42.jar que extrajo anteriormente, y después haga clic en Abrir.
  9. En Class (Clase), seleccione com.databricks.client.jdbc.Driver.
  10. Haga clic en Aceptar.

Paso 3: conexión de DataGrip a las bases de datos de Azure Databricks

  1. En DataGrip, haga clic en Archivo > Orígenes de datos.

  2. En la pestaña Orígenes de datos, haga clic en el botón + (Agregar).

  3. Seleccione el controlador de Databricks que agregó en el paso anterior.

  4. En la pestaña General, para Dirección URL, escriba el valor del campo URL de JDBC en el recurso de Azure Databricks, como se muestra a continuación. Para obtener la sintaxis del campo URL de JDBC, consulte Configuración de la autenticación del controlador JDBC de Databricks.

    Nota:

    La ConnCatalogconfiguración de la funcionalidad del controlador debe especificarse en la dirección URL de JDBC; de lo contrario, no se pueden identificar esquemas.

  5. Haga clic en Probar conexión.

    Sugerencia

    Debe iniciar el recurso antes de probar la conexión. De lo contrario, la prueba puede tardar varios minutos en completarse mientras se inicia el recurso.

  6. Si la conexión se realiza correctamente, en la pestaña Esquemas, compruebe las casillas de los esquemas a los que desea poder acceder, por ejemplo, Todos los esquemas.

  7. Haga clic en Aceptar.

Repita las instrucciones de este paso para cada recurso al que quiera que acceda DataGrip.

Paso 4: uso de DataGrip para examinar tablas

Use DataGrip para acceder a las tablas del área de trabajo de Azure Databricks.

  1. En DataGrip, en la ventana Base de datos, expanda el nodo de recursos, expanda el esquema que desea examinar, y después expanda tablas.
  2. Haga doble clic en una tabla. Se muestra el primer conjunto de filas de la tabla.

Repita las instrucciones de este paso para acceder a tablas adicionales.

Para acceder a las tablas de otros esquemas, en la barra de herramientas de la ventana Base de datos, haga clic en el icono Propiedades del origen de datos. En el cuadro de diálogo Orígenes de datos y controladores, en la pestaña Esquemas, active la casilla de cada esquema adicional al que desee acceder, y después haga clic en Aceptar.

Paso 5: uso de DataGrip para ejecutar instrucciones SQL

Use DataGrip para cargar la tabla de ejemplo trips desde el samplesesquema de catálogonyctaxi.

  1. En DataGrip, haga clic en Archivo> nuevo > archivo SQL.

  2. Escriba un nombre para el archivo, por ejemplo select_trips.

  3. En la pestaña archivoselect_trips.sql, escriba la siguiente instrucción SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. Seleccione la instrucción SELECT.

  5. En la barra de herramientas de la pestaña Archivo, haga clic en el icono Ejecutar.

Pasos siguientes

Recursos adicionales