Agosto de 2021
Estas características y las mejoras de la plataforma Azure Databricks se publicaron en agosto de 2021.
Nota:
Las versiones se lanzan en fases. Es posible que su cuenta de Azure Databricks no se actualice hasta después de una semana o más de la fecha de lanzamiento inicial.
GA de Databricks Repos
31 de agosto de 2021
Databricks Repos ahora está disponible con carácter general. Con Repos puede crear repositorios Git o clonar otros ya existentes en Azure Databricks, trabajar con cuadernos en estos repositorios, seguir los procedimientos recomendados de colaboración y desarrollo basados en Git e integrar sus flujos de trabajo de CI/CD con API de Repos. Databricks Repos se integra con GitHub, Bitbucket, GitLab y Azure DevOps. Para más detalles, consulte Integración de Git para las carpetas de Git de Databricks y API de Repos.
Mayor tiempo de espera para trabajos de cuadernos de larga ejecución
23-30 de agosto de 2021: versión 3.53
Ahora puede ejecutar trabajos de flujo de trabajo de cuaderno que tarden hasta 30 días en completarse. Anteriormente, solo se admitían trabajos de flujo de trabajo de cuaderno que tardaran un máximo de 48 horas en completarse. Consulta Organización de cuadernos y modularización de código en cuadernos para obtener más información.
Mejoras de escalabilidad y estabilidad del servicio de trabajos
23-30 de agosto de 2021: versión 3.53
Los siguientes cambios aumentan la estabilidad y escalabilidad del servicio Trabajos:
- A cada ejecución y trabajo nuevos se les asigna un identificador único, numérico y no secuencial de mayor longitud. Los clientes que usan la API de trabajos y dependen de una longitud de identificador fija o de identificadores secuenciales o de aumento monótono deben modificarse para aceptar identificadores que sean más largos, no secuenciales y desordenados. El tipo de identificador de
int64
no sufre cambios; además, se mantiene la compatibilidad con los clientes que usan números de punto flotante IEEE 754 de 64 bits, como los clientes de JavaScript. - El valor del campo
number_in_job
, que se incluye en la respuesta a algunas solicitudes de la API de trabajos, ahora se establece en el mismo valor querun_id
.
Nota:
Esta característica se ha retrasado hasta febrero de 2022.
Los derechos de usuario concedidos por la pertenencia a grupos se muestran en la consola de administración
23-30 de agosto de 2021: versión 3.53
Los derechos de usuario concedidos por la pertenencia a grupos ahora se muestran con relación a cada usuario en la pestaña "Usuarios" de la consola de administración.
Administración de permisos de experimentos de MLflow (versión preliminar pública)
23-30 de agosto de 2021: versión 3.53
Ahora puede administrar los permisos de un experimento de MLflow desde la página del experimento. Para obtener más información, consulta Cambio de permisos para un experimento.
Creación de trabajos mejorada a partir de cuadernos
23-30 de agosto de 2021: versión 3.53
Ahora puede editar y clonar trabajos asociados a un cuaderno. Para obtener más información, consulte Creación y administración de trabajos de cuaderno programados.
Máquinas virtuales de la serie Ddsv4 (versión preliminar pública)
23-30 de agosto de 2021: versión 3.53
Azure Databricks ahora es compatible con máquinas virtuales de la serie Ddsv4. Para obtener más información sobre estas máquinas virtuales, consulte Series Ddv4 y Ddsv4.
Compatibilidad mejorada para contraer encabezados de cuaderno
23-30 de agosto de 2021: versión 3.53
Ahora puede contraer o expandir todos los encabezados contraíbles en un cuaderno. Anteriormente, solo podía contraer o expandir un solo encabezado a la vez. Para obtener más información, consulte Encabezados contraíbles.
Databricks Runtime 9.0 y 9.0 ML están disponibles con carácter general; 9.0 Photon está disponible en versión preliminar pública
17 de agosto de 2021
Databricks Runtime 9.0 y 9.0 ML ahora están disponibles con carácter general. 9.0 Photon está disponible en versión preliminar pública.
Para obtener información, consulte las notas completas de la versión en Databricks Runtime 9.0 (EoS) y Databricks Runtime 9.0 para ML (EoS).
Databricks Runtime 9.0 (versión beta)
10 de agosto de 2021
Databricks Runtime 9.0 y Databricks Runtime 9.0 ML ahora están disponibles en versión beta.
Para obtener información, consulte las notas completas de la versión en Databricks Runtime 9.0 (EoS) y Databricks Runtime 9.0 para ML (EoS).
Administración de repositorios mediante programación con la CLI de Databricks (versión preliminar pública)
9-16 de agosto de 2021: versión 3.52
Ahora puede administrar repositorios de Git remotos mediante la interfaz de la línea de comandos (CLI) de Databricks. Consulte la CLI de Databricks (heredada).
Administración de repositorios mediante programación con la API REST de Databricks (versión preliminar pública)
9-16 de agosto de 2021: versión 3.52
Ahora puede administrar repositorios de Git remotos mediante la API de REST de Databricks. Consulta API de Repos.
Fin del soporte técnico de la serie 7.6 de Databricks Runtime
8 de agosto de 2021
El soporte para Databricks Runtime 7.6, Databricks Runtime 7.6 para Machine Learning y Databricks Runtime 7.6 para Genomics finalizó el 8 de agosto. Consulte Ciclo de vida del soporte técnico de Databricks.
Los eventos de auditoría se registran al interactuar con Databricks Repos
9-13 de agosto de 2021: versión 3.52
Cuando está habilitado el registro de auditoría, ahora se registra un evento de auditoría al crear, actualizar o eliminar un repositorio de Databricks, al enumerar todos los repositorios de Databricks asociados a un área de trabajo y al sincronizar los cambios entre un repositorio de Databricks y otro remoto. Para más información, consulte Eventos de carpeta de Git.
Flujo de trabajo de administración y creación de trabajos mejorado
9-13 de agosto de 2021: versión 3.52
Ahora puede ver y administrar los trabajos asociados a un cuaderno. En concreto, puede iniciar la ejecución de un trabajo, ver la ejecución en curso o más reciente, pausar o reanudar la programación del trabajo y eliminarlo.
Se ha revisado la interfaz de usuario de creación de trabajos de cuaderno y se han agregado nuevas opciones de configuración. Para obtener más información, consulte Creación y administración de trabajos de cuaderno programados.
Los entornos de ejecución de Photon ya están disponibles (versión preliminar pública)
9-13 de agosto de 2021: versión 3.52
Photon es el nuevo motor vectorizado nativo de Azure Databricks, directamente compatible con API de Apache Spark. Para aprovisionar clústeres con Photon, debe usar una imagen de Photon.
Instrucciones simplificadas para establecer las credenciales de Git (versión preliminar pública)
9-13 de agosto de 2021: versión 3.52
Se han simplificado las instrucciones de la pestaña "Integración de Git" de la página "Configuración de usuario".
Importación de varios cuadernos en formato
9-13 de agosto de 2021: versión 3.52
Ahora puede importar varios cuadernos en formato .html
en un archivo .zip
. Anteriormente, solo podía importar un único cuaderno en formato .html
a la vez.
El archivo .zip
puede contener carpetas y cuadernos en formato .html
o en formato de archivo de origen (Python, Scala, SQL o R). Un archivo .zip
no puede incluir ambos formatos.
Mejoras en la facilidad de uso de Delta Live Tables
9-13 de agosto de 2021: versión 3.52
Esta versión incluye las siguientes mejoras del entorno de ejecución y la interfaz de usuario de Delta Live Tables:
- Al crear una canalización, ahora puede especificar una base de datos de destino para publicar las tablas y metadatos de Delta Live Tables. Consulte Uso de canalizaciones de Delta Live Tables con metastore de Hive heredado para obtener más información sobre la publicación de conjuntos de datos.
- Los cuadernos ahora admiten el resaltado de la sintaxis de palabras clave en definiciones de conjunto de datos de SQL. Puede usar este resaltado para garantizar la corrección de las instrucciones SQL de Delta Live Tables. Consulte la referencia del lenguaje SQL para obtener más información sobre la sintaxis SQL de Delta Live Tables.
- El entorno de ejecución de Delta Live Tables ahora emite el gráfico de canalización antes de ejecutarla, por lo que le permite ver el gráfico en la interfaz de usuario en una fase anterior.
- Todas las bibliotecas de Python configuradas en sus cuadernos ahora se instalan antes de ejecutar cualquier código de Python, lo que garantiza que las bibliotecas estén accesibles globalmente para cualquier cuaderno de Python de la canalización. Consulte Administración de dependencias de Python para canalizaciones de Delta Live Tables.