Conexión al almacén SQL
Un almacén de SQL es un recurso de proceso que permite consultar y explorar datos en Azure Databricks.
La mayoría de los usuarios tienen acceso a los almacenes de SQL configurados por los administradores.
Para obtener información sobre la arquitectura del plano de proceso sin servidor, consulte Plano de proceso sin servidor.
Databricks recomienda usar almacenes de SQL sin servidor cuando estén disponibles.
Uso de almacenes de SQL
Los almacenes de SQL a los que tenga acceso aparecerán en los menús desplegables de proceso de las interfaces de usuario del área de trabajo que admitan el proceso de almacenes de SQL, incluyendo el editor de consultas, el Explorador de catálogos y los paneles.
Otra forma de ver, ordenar y buscar almacenes de SQL disponibles es hacer clic en Almacenes de SQL, en la barra lateral. De manera predeterminada, los almacenes se ordenan por estado (primero los almacenes en ejecución) y, a continuación, en orden alfabético.
La interfaz de usuario indica si se está ejecutando o no un almacén en ese momento. La ejecución de consultas en almacenes detenidos las iniciará automáticamente en caso de tener acceso al almacén. Consulte Iniciar un almacén de SQL.
Nota:
Para ayudarle a empezar a trabajar, Azure Databricks crea automáticamente un pequeño almacén de SQL llamado Almacén inicial. Puede editar o eliminar este almacén de SQL.
Importante
También puede adjuntar un cuaderno a un almacén SQL pro o sin servidor. Consulte Cuadernos y almacenes de SQL para ver más información y las limitaciones.
¿Qué son los almacenes SQL sin servidor?
Nota:
Antes de poder crear un almacén de SQL sin servidor en una región que admita la característica, es posible que se requieran algunos pasos. Consulte Habilitación de almacenes de SQL sin servidor.
Databricks SQL ofrece un precio y un rendimiento óptimos con almacenes SQL sin servidor. Entre las principales ventajas de los almacenes sin servidor sobre modelos pro y clásicos se incluyen:
- Proceso instantáneo y elástico: elimina la espera de recursos de infraestructura y evita el exceso de aprovisionamiento de recursos durante los picos de uso. La administración inteligente de cargas de trabajo controla dinámicamente el escalado. Consulte Tipos de almacenes SQL para obtener más información sobre la administración inteligente de cargas de trabajo y otras características sin servidor.
- Sobrecarga de administración mínima: Azure Databricks controla la administración de la capacidad, la aplicación de revisiones, las actualizaciones y la optimización del rendimiento, lo que simplifica las operaciones y conduce a precios predecibles.
- Menor costo total de propiedad (TCO): el aprovisionamiento automático y el escalado de recursos según sea necesario ayudan a evitar el aprovisionamiento excesivo y a reducir los tiempos de inactividad, lo que reduce el TCO.
Iniciar un almacén de SQL
Para iniciar manualmente un almacén de SQL detenido, haga clic en Almacenes SQL en la barra lateral y, luego, haga clic en el icono de iniciar que hay al lado del almacén.
Los almacenes de SQL se reiniciarán automáticamente en las siguientes condiciones:
- Se detiene un almacén e intenta ejecutar una consulta.
- Un trabajo asignado a un almacén detenido está programado para ejecutarse.
- Se establece una conexión a un almacenamiento detenido desde una interfaz JDBC/ODBC.
- Se abre un panel asociado a un almacén de nivel de panel.
Creación de un almacén de SQL
La configuración y el inicio de almacenes de SQL requiere permisos elevados restringidos normalmente a administradores. Consulte Configuración de administrador de almacenes de SQL y Creación de almacenes de SQL.
El catálogo de Unity rige los permisos de acceso a datos en los almacenes de SQL para la mayoría de los recursos. Los administradores configuran la mayoría de los permisos de acceso a datos. Los almacenes de SQL pueden tener acceso a datos personalizado configurado en lugar de o adicionalmente al catálogo de Unity. Consulte Habilitar la configuración de acceso a datos.
Póngase en contacto con un administrador en las siguientes situaciones:
- No es posible conectarse a ningún almacén de SQL.
- No se pueden ejecutar consultas porque se detiene un almacén de SQL.
- No es posible acceder a tablas ni a datos desde el almacén de SQL.
Nota:
Algunas organizaciones podrían permitir que los usuarios modifiquen privilegios en objetos de base de datos o almacenes de SQL. Consulte con compañeros de equipo y administradores para comprender cómo administra la organización el acceso a los datos.
Comportamiento de ajuste de tamaño y escalado automático del almacén
Para obtener información sobre cómo funcionan los almacenes de SQL clásicos y pro y cómo funciona el escalado automático, consulte Comportamiento de ajuste de tamaño, escalado y puesta en cola del almacén de SQL.
Almacenes de SQL y herramientas de BI de terceros
Databricks SQL admite muchas herramientas de visualización y BI de terceros que pueden conectarse a almacenes de SQL, incluyendo las siguientes:
Herramientas de desarrollo para almacenes de SQL
Use la API de REST, la CLI y otros controladores e integraciones para configurar y ejecutar comandos en almacenes de SQL. Vea lo siguiente:
- API de REST de SQL de Databricks
- CLI de Databricks SQL
- Databricks Driver for SQLTools en Visual Studio Code
- Integración de DataGrip con Azure Databricks
- Integración de DBeaver con Azure Databricks
- Conexión manual a SQL Workbench/J
Almacenes de SQL frente a puntos de conexión de SQL
Tanto los almacenes de SQL como los puntos de conexión de SQL hacen referencia a un tipo de recurso de proceso optimizado para SQL que impulsa Databricks SQL. En 2023, se cambió el nombre de los puntos de conexión de SQL como almacenes de SQL.