Abril de 2019

Artigo
01/21/2025

Esses recursos e aprimoramentos da plataforma Azure Databricks foram lançados em abril de 2019.

Nota

Os lançamentos são encenados. Sua conta do Azure Databricks pode não ser atualizada até uma semana após a data de lançamento inicial.

MLflow no Azure Databricks (Disponibilidade Geral)

Abril 25, 2019

O MLflow gerenciado no Azure Databricks agora está disponível ao público em geral. O MLflow no Azure Databricks oferece uma versão hospedada do MLflow totalmente integrada ao modelo de segurança Databricks e ao espaço de trabalho interativo. Consulte MLflow parade ciclo de vida do agente de IA de geração e do modelo de ML.

Delta Lake no Azure Databricks

Abril 24, 2019

A Databricks abriu o projeto Delta Lake . O Delta Lake é uma camada de armazenamento que traz confiabilidade aos data lakes construídos em HDFS e armazenamento em nuvem, fornecendo transações ACID por meio de controle de simultaneidade otimista entre gravações e isolamento de snapshot para leituras consistentes durante as gravações. O Delta Lake também fornece controle de versão de dados integrado para facilitar reversões e reprodução de relatórios.

Nota

O que antes era chamado de Databricks Delta agora é o projeto de código aberto Delta Lake, além de otimizações disponíveis no Azure Databricks. Veja O que é Delta Lake?.

9 a 16 de abril de 2019: Versão 2.95

Agora você pode visualizar as execuções do MLflow e as revisões do bloco de anotações que produziram essas execuções em uma barra lateral ao lado do seu bloco de anotações. Na barra lateral direita do bloco de notas, clique no Experiment iconícone Experiência .

Consulte Criar experiência de bloco de anotações.

Acesse o Azure Data Lake Storage Gen1 e Gen2 automaticamente com suas credenciais de ID do Microsoft Entra (GA)

9 a 16 de abril de 2019: Versão 2.95

Temos o prazer de anunciar a disponibilidade geral da autenticação automática para o Azure Data Lake Storage Gen1 e Gen2 a partir de clusters do Azure Databricks usando a mesma identidade de ID do Microsoft Entra que você usa para fazer logon no Azure Databricks.

Basta habilitar seu cluster para passagem de credenciais do Microsoft Entra ID e os comandos executados nesse cluster poderão ler e gravar seus dados no Azure Data Lake Storage Gen1 e Gen2 sem exigir que você configure as credenciais da entidade de serviço para acesso ao armazenamento.

Para obter mais informações, consulte Access Azure Data Lake Storage using Microsoft Entra ID credential passthrough (legacy).

Databricks Runtime 5.3 (Disponibilidade Geral)

Abril 3, 2019

O Databricks Runtime 5.3 agora está disponível para o público em geral. O Databricks Runtime 5.3 inclui novos recursos e atualizações do Delta Lake e bibliotecas Python, R, Java e Scala atualizadas.

As principais atualizações incluem:

Databricks Delta viagem no tempo GA
Replicação de tabela MySQL para Delta, visualização pública
Pasta DBFS FUSE otimizada para cargas de trabalho de aprendizagem profunda
Melhorias na biblioteca com escopo de bloco de anotações
Novas dicas do Databricks Advisor

Para obter detalhes, consulte Databricks Runtime 5.3 (EoS).

Databricks Runtime 5.3 ML (Disponibilidade Geral)

Abril 3, 2019

Com o Databricks Runtime 5.3 para Machine Learning, alcançamos nosso primeiro GA de Databricks Runtime ML! O Databricks Runtime ML fornece um ambiente pronto para uso para aprendizado de máquina e ciência de dados. Ele se baseia no Databricks Runtime e adiciona muitas bibliotecas populares de aprendizado de máquina, incluindo TensorFlow, PyTorch, Keras e XGBoost. Também suporta a preparação distribuída com o Horovod.

Esta versão é construída no Databricks Runtime 5.3, com bibliotecas adicionais, algumas versões de bibliotecas diferentes e gerenciamento de pacotes Conda para bibliotecas Python. Os principais novos recursos desde o Databricks Runtime 5.2 ML Beta incluem:

Integração MLlib com MLflow (Private Preview), que fornece registro automático de execuções MLflow para modelos ajustados usando os algoritmos CrossValidator de ajuste PySpark e TrainValidationSplit.

Se você quiser participar da visualização, entre em contato com sua equipe de conta Databricks.
Atualizações para as bibliotecas PyArrow, Orovod e TensorboardX.

A atualização do PyArrow adiciona a capacidade de usar BinaryType quando efetua a conversão baseada em Arrow e a disponibiliza em pandas UDF.

Para obter mais informações, consulte Databricks Runtime 5.3 ML (EoS). Para obter instruções sobre como criar um cluster de ML do Databricks Runtime, consulte IA e aprendizado de máquina no Databricks.

Partilhar via

Abril de 2019

MLflow no Azure Databricks (Disponibilidade Geral)

Delta Lake no Azure Databricks

Barra lateral de execuções do MLflow

Acesse o Azure Data Lake Storage Gen1 e Gen2 automaticamente com suas credenciais de ID do Microsoft Entra (GA)

Databricks Runtime 5.3 (Disponibilidade Geral)

Databricks Runtime 5.3 ML (Disponibilidade Geral)

Comentários

Recursos adicionais