Marzo de 2018
Las versiones se publican por fases. Es posible que su cuenta de Azure Databricks no se actualice hasta una semana después de la fecha de lanzamiento inicial.
Detalles de ejecución de los comandos
Del 27 de marzo al 3 de abril de 2018: versión 2.68
Al ejecutar un comando en un cuaderno, ahora se verá información de progreso detallada.
La CLI de Databricks es compatible con
Del 27 de marzo al 3 de abril de 2018: versión 2.68
La CLI de Databricks 0.6.1 admite --profile
en todas las posiciones.
Consulte la CLI de Databricks (heredada).
Las ACL están habilitadas de forma predeterminada para los nuevos clientes de SKU Premium
Del 27 de marzo al 3 de abril de 2018: versión 2.68
Las listas de control de acceso (ACL) ahora están habilitadas de forma predeterminada para todos los clientes nuevos de SKU Premium. Los clientes existentes deben seguir habilitando las ACL manualmente.
Consulte Las listas de controles de acceso ya no se pueden deshabilitar.
Azure Databricks ya está disponible con carácter general
22 de marzo de 2018
Nos complace anunciar que Azure Databricks está disponible con carácter general. En las últimas semanas, hemos agregado funcionalidad para ayudar a mejorar la experiencia Azure Databricks, entre las que se incluyen:
- Emparejamiento de red virtual (VNet), que permite usar Apache Kafka en HDInsight con Azure Databricks
- Microsoft Power BI ahora incluye un conector de Spark integrado
- Conector de Azure Synapse Analytics
- Soporte técnico de Azure Data Factory v2 (versión preliminar)
- Administración de secretos (versión preliminar)
- Más regiones de Azure
- Rendimiento y documentación mejorados
Y, por supuesto, Azure Databricks continúa proporcionando integraciones sencillas con Azure Blob Storage, Azure Data Lake Store y Azure Cosmos DB.
Como complemento a la documentación proporcionada en este sitio, learn.microsoft.com brinda material introductorio, información sobre la administración de cuentas de Azure y tutoriales completos.
Nuevo tema del sitio de documentación
21 de marzo de 2018
Hemos actualizado la apariencia de nuestro sitio de documentación. Esperamos que le guste.
Escalado automático del almacenamiento local
Del 13 al 20 de marzo de 2018: versión 2.67
Todos los clústeres de Azure Databricks se inician con el almacenamiento local de escalado automático habilitado. Esto significa que Azure Databricks acopla automáticamente los discos administrados adicionales a las máquinas virtuales de trabajo del clúster siempre que se ejecuten de forma lenta en el disco.
Consulte Habilitación del escalado automático del almacenamiento local para más información.
Emparejamiento de red virtual (VNet)
Del 13 al 20 de marzo de 2018: versión 2.67
Añade soporte para el emparejamiento de redes virtuales (VNet) que permite que la red virtual en la que se ejecuta el recurso de Azure Databricks se empareje con otra red virtual de Azure.
Consulte Redes virtuales del mismo nivel para obtener más información.
Registro de eventos de clúster
Del 13 al 20 de marzo de 2018: versión 2.67
La página de detalles del clúster tiene una nueva pestaña de Registro de eventos que muestra eventos importantes del ciclo de vida del clúster. Los eventos históricos se pueden ver durante 60 días, lo que es comparable con otros tiempos de retención de datos en Azure Databricks.
Consulte Registros de eventos de proceso para más información.
Lanzamiento de CLI de Databricks: 0.6.0
13 de marzo de 2018: databricks-cli 0.6.0
La CLI de Databricks ahora admite Python 3.
Consulte la CLI de Databricks (heredada) para obtener más información.
Administración de las ejecuciones de trabajos
Del 13 al 20 de marzo de 2018: versión 2.67
Ahora se puede eliminar una ejecución de trabajo en la página de detalles del trabajo y en la página de ejecución del trabajo.
El punto de conexión Get Output de la ejecución del trabajo es de disponibilidad general y la salida máxima devuelta se ha aumentado a 5 MB.
La edición de los permisos de clúster ahora requiere el modo de edición
Del 13 al 20 de marzo de 2018: versión 2.67
Anteriormente era posible editar los permisos de un clúster sin hacer clic en Editar, lo que era incoherente con otros atributos del clúster.
Un efecto secundario de este cambio es que ya no se pueden editar permisos de clúster mientras un clúster está pendiente.
Exportación de modelos de Machine Learning en Databricks
1 de marzo de 2018
En la documentación se explica ahora cómo usar Databricks ML Model Export, que permite exportar modelos y canalizaciones de ML desde Apache Spark. Estos modelos y canalizaciones exportados se pueden importar en otras plataformas (propias y ajenas a Spark) para realizar la puntuación y las predicciones. Model Export está destinado a aplicaciones ligeras de baja latencia con tecnología ML.
Nota:
Esta característica requiere Databricks Runtime 4.0+.
Consulte Exportación de modelos de ML de MLeap para más información.