Notas de la versión de Databricks SQL
En este artículo se enumeran las nuevas características y mejoras de Databricks SQL, junto con incidencias conocidas y las preguntas más frecuentes.
Proceso de lanzamiento
Databricks lanza actualizaciones para la interfaz de usuario de la aplicación web de Databricks SQL de forma continua y todos los usuarios reciben las mismas actualizaciones, que se implementan durante un breve período de tiempo.
Además, Databricks normalmente publica nuevas versiones de proceso del almacén de SQL periódicamente. Siempre hay dos canales disponibles: la versión preliminar y la actual.
Nota:
Las versiones se publican por fases. Es posible que la cuenta de Databricks no se actualice con una nueva versión del almacén de SQL o una característica de Databricks SQL hasta una semana o más después de la fecha de lanzamiento inicial.
Nota:
Databricks SQL sin servidor no está disponible en Azure China. Databricks SQL no está disponible en las regiones de Azure Government.
Canales
Los canales le permiten elegir si va a usar la versión de proceso del almacén de SQL actual o la versión preliminar. Las versiones preliminares permiten probar la funcionalidad antes de que se convierta en el estándar de Databricks SQL. Aproveche las versiones preliminares para probar los paneles y consultas de producción en relación con los próximos cambios.
Normalmente, una versión preliminar se promueve al canal actual aproximadamente dos semanas después de publicarse en el canal de versión preliminar. Algunas características, como las características de seguridad, las actualizaciones de mantenimiento y las correcciones de errores, se pueden lanzar directamente en el canal actual. De vez en cuando, Databricks puede promover una versión preliminar al canal actual según una programación diferente. Cada versión nueva se anunciará en las secciones siguientes.
Para aprender a cambiar un almacén de SQL existente al canal de versión preliminar, consulte Canales de versión preliminar. Las características enumeradas en las secciones de actualizaciones de la interfaz de usuario son independientes de las versiones de cálculo de SQL Warehouse descritas en la sección Canales de las notas de la versión.
Versiones disponibles de Databricks SQL
canal actual: Databricks SQL versión 2024.50
Canal de versión preliminar: Databricks SQL versión 2024.50
- Consulte las características de 2024.50.
30 de enero de 2025
Las siguientes características y actualizaciones se publicaron durante la semana del 30 de enero de 2025.
Actualizaciones de la interfaz de usuario
Almacén de SQL
Ahora hay disponible un Recuento de consultas completadas (versión preliminar pública) en la interfaz de usuario de supervisión de Almacén de SQL. En este nuevo gráfico se muestra el número de consultas finalizadas en un período de tiempo, incluidas las consultas canceladas y con errores. El gráfico se puede usar con los demás gráficos y la tabla Historial de consultas para evaluar y solucionar problemas del rendimiento del almacenamiento. La consulta se asigna en el período de tiempo que se completa. Los recuentos se promedian por minuto. Para obtener más información, consulte Supervisar un almacén SQL.
Editor SQL
- visualización de datos expandidos en gráficos: Visualizaciones creadas en el editor de SQL ahora admiten hasta 15 000 filas de datos.
23 de enero de 2025
Las siguientes características y actualizaciones se publicaron durante la semana del 23 de enero de 2025.
Cambios en 2024.50
Databricks SQL versión 2024.50 incluye los siguientes cambios de comportamiento, nuevas características y mejoras.
Cambios en el comportamiento
- El
VARIANT
tipo de datos ya no se puede usar con operaciones que requieran comparaciones
No se pueden usar las cláusulas o operadores siguientes en las consultas que incluyen un VARIANT
tipo de datos:
DISTINCT
INTERSECT
EXCEPT
UNION
DISTRIBUTE BY
Estas operaciones realizan comparaciones y comparaciones que usan el tipo de datos VARIANT producen resultados indefinidos y no se admiten en Databricks. Si usa el tipo VARIANT en las tablas o cargas de trabajo de Azure Databricks, Databricks recomienda los cambios siguientes:
- Actualice las consultas o expresiones para convertir
VARIANT
explícitamente valores en tipos de datos que noVARIANT
sean. - Si tiene campos que se deben usar con cualquiera de las operaciones anteriores, extraiga esos campos del tipo de datos
VARIANT
y almacénelos mediante tipos de datos que no seanVARIANT
.
Para más información, accede a Consulta de datos de variante.
Nuevas características y mejoras
- Soporte para parametrizar la
USE CATALOG with IDENTIFIER
cláusula
Se admite la cláusula IDENTIFIER para la instrucción USE CATALOG. Con esta soporte, puede parametrizar el catálogo actual en función de una variable de cadena o un marcador de parámetro.
-
COMMENT ON COLUMN
soporte con tablas y vistas
La instrucción COMMENT ON admite la modificación de comentarios para las columnas de vistas y tablas.
- Nuevas funciones SQL
Están disponibles las siguientes nuevas funciones SQL integradas:
- dayname(expr) devuelve el acrónimo inglés de tres letras del día de la semana para la fecha especificada.
- uniform(expr1, expr2 [,seed]) devuelve un valor aleatorio con valores independientes y distribuidos de forma idéntica dentro del intervalo de números especificado.
- randstr(length) devuelve una cadena aleatoria de
length
caracteres alfanuméricos. - Invocación de parámetros con nombre para más funciones
Las funciones siguientes admiten invocación de parámetros con nombre:
Corrección de errores
- Los tipos anidados ahora aceptan correctamente restricciones NULL
Esta versión corrige un error que afecta a algunas columnas generadas por Delta de tipos anidados, por ejemplo, STRUCT
. Estas columnas a veces rechazaban incorrectamente expresiones basadas en las restricciones NULL
o NOT NULL
de campos anidados. Esto se ha solucionado.
15 de enero de 2025
Las siguientes actualizaciones se publicaron durante la semana del 15 de enero de 2025.
Actualizaciones de la interfaz de usuario
Editor SQL
El nuevo editor de SQL (versión preliminar pública) ahora tiene las siguientes características:
- Nomenclatura de descarga: a las salidas descargadas ahora se les asigna un nombre según la consulta.
- Ajustes de tamaño de fuente: Ajustar rápidamente el tamaño de fuente en el editor de SQL mediante
Alt +
yAlt -
para Windows/Linux, oOpt +
yOpt -
para macOS. - @Menciones en comentarios: menciona a usuarios específicos con
@
en comentarios. Los usuarios mencionados recibirán notificaciones por correo electrónico. - Cambio de pestaña mejorado: rendimiento de cambio de pestañas es hasta un 80 % más rápido para las pestañas cargadas y el 62 % más rápido para las pestañas descargadas.
- Consulte los detalles del almacén: El tamaño de SQL Warehouse ahora está visible en el selector de computación sin necesidad de hacer clics adicionales.
- Editar valores de parámetro: use
Ctrl + Enter
para Windows/Linux, oCmd + Enter
para macOS, para ejecutar una consulta mientras edita un valor de parámetro. - Conservar los resultados de la consulta en el historial de versiones: los resultados de la consulta ahora se almacenan con el historial de versiones.
Visualizaciones
- Los nuevos gráficos ahora están disponibles con carácter general: Nuevos gráficos con un rendimiento mejorado, colores mejorados e interactividad más rápido ahora están disponibles con carácter general. Consulte Visualización de Databricks SQL y Tipos de visualización.
problemas conocidos
- Las lecturas de orígenes de datos que no sean Delta Lake en puntos de conexión de SQL con equilibrio de carga de varios clústeres pueden ser incoherentes.
- Las tablas Delta a las que se accede en Databricks SQL cargan su esquema y propiedades de tablas en el metastore configurado. Si usa una metastore externa, podrá ver la información de Delta Lake en la metastore. Delta Lake realiza grandes esfuerzos para mantener esta información tan actualizada como sea posible. También puede usar el comando
DESCRIBE <table>
para asegurarse de que la información se actualiza en metastore. - Databricks SQL no admite el uso de diferencias de zona, como "GMT+8", para establecer zonas horarias de sesión. La solución alternativa a este inconveniente consiste en el uso de una zona horaria basada en regiones (https://en.wikipedia.org/wiki/List_of_tz_database_time_zones), como "Etc/GMT+8", en su lugar. Consulte SET TIME ZONE para obtener más información sobre cómo establecer zonas horarias.
Preguntas más frecuentes
Use la lista siguiente para obtener información sobre las respuestas a preguntas comunes.
¿Cómo se cobran las cargas de trabajo de Databricks SQL?
Las cargas de trabajo de Databricks SQL se cobran según la SKU de Proceso de trabajos estándar.
¿Dónde se ejecutan los almacenes de SQL?
Los almacenes de SQL clásicos y profesionales se crean y administran en su cuenta de Azure. Los almacenes de SQL administran clústeres optimizados para SQL automáticamente en su cuenta y se escalan para que coincidan con la demanda del usuario final.
Almacenes SQL sin servidor, por otro lado, usan recursos de computación dentro de tu cuenta de Databricks. los almacenes de SQL sin servidor pueden simplificar la configuración y el uso de SQL Warehouse, y acelerar los tiempos de inicio. La opción sin servidor solo está disponible si se ha habilitado para el área de trabajo. Para obtener más información, consulte Plano de proceso sin servidor.
¿Puedo usar almacenes de SQL desde un cuaderno en la misma área de trabajo?
Sí. Para obtener información sobre cómo adjuntar un cuaderno a una instancia de SQL Warehouse, consulte Uso de un cuaderno con una instancia de SQL Warehouse.
Se me ha concedido acceso a los datos mediante una credencial de proveedor en la nube. ¿Por qué no puedo acceder a estos datos en Databricks SQL?
En Databricks SQL, todo el acceso a los datos está sujeto al control de acceso a datos y es preciso que un administrador o el propietario de los datos le concedan antes los privilegiosadecuados.