Março de 2022
Esses recursos e melhorias na plataforma Azure Databricks foram lançados em março de 2022.
Nota
Os lançamentos são realizados em fases. Sua conta do Azure Databricks pode não ser atualizada até uma semana ou mais após a data de lançamento inicial.
Melhor desempenho e custo para seus pipelines DLT com o dimensionamento automático aprimorado do Databricks
31 de março de 2022
O dimensionamento automático aprimorado do Databricks melhora a funcionalidade de dimensionamento automático de cluster existente ao adicionar otimizações para cargas de trabalho em streaming e suporte aprimorado para cargas de trabalho batch. As melhorias aprimoradas no dimensionamento automático proporcionam uma utilização mais eficiente do cluster, menor uso de recursos e menor custo. Veja Otimizar a utilização do cluster das pipelines DLT com o aprimoramento do dimensionamento automático.
Arquivos em repositórios habilitados por padrão em novos espaços de trabalho
30 de março de 2022
A funcionalidade Arquivos em Repositórios agora está ativada por padrão em espaços de trabalho recém-criados.
Databricks Feature Store está geralmente disponível
22 de março de 2022
O Databricks Feature Store está agora amplamente disponível. O Databricks Feature Store permite o compartilhamento e a descoberta de recursos em toda a sua organização e também garante um código de computação de recursos consistente para treinamento e inferência de modelos.
Partilhar uma experiência a partir da página da experiência
21 a 28 de março de 2022: Versão 3.68
O botão Permissões na página do experimento MLflow foi renomeado para Compartilhar. A caixa de diálogo agora inclui um link compartilhável para o experimento. Ver Alterar permissões para uma experiência.
Correção de bug do RStudio Workbench
21 a 28 de março de 2022: Versão 3.68
O RStudio Workbench mais recente depende de cookies quando você usa um arquivo de licença. Esses cookies não foram incluídos na lista de permissões para o proxy. Esse problema foi corrigido.
Novas opções de idioma do espaço de trabalho
21 de março de 2022
Os espaços de trabalho estão agora disponíveis nos seguintes idiomas:
- Español
- Português (Brasil)
Databricks Runtime 10.4 LTS e 10.4 LTS ML estão Geralmente Disponíveis; 10.4 Photon está em Pré-visualização Pública.
18 de março de 2022
Databricks Runtime 10.4 LTS e Databricks Runtime 10.4 LTS ML estão agora disponíveis para o público em geral. O Databricks Runtime 10.4 Photon está em Visualização Pública.
Nota
LTS significa que esta versão está sob suporte a longo prazo. Consulte Ciclo de vida da versão do Databricks Runtime LTS.
Consulte Databricks Runtime 10.4 LTS e Databricks Runtime 10.4 LTS para Aprendizagem Automática.
O Catálogo Unity está disponível em Visualização Pública
10 de março de 2022
O Unity Catalog (Preview) é uma solução de governança refinada para dados e IA no lago Databricks.
O Unity Catalog ajuda a simplificar a segurança e a governança de seus dados com os seguintes recursos principais:
- Defina uma vez, seguro em qualquer lugar: O Unity Catalog oferece um único local para administrar políticas de acesso a dados que se aplicam a todos os espaços de trabalho e personas.
- Modelo de segurança compatível com Standards: O modelo de segurança do Unity Catalog é baseado no padrão ANSI SQL e permite que os administradores concedam permissões no nível de catálogos, bancos de dados (também chamados de esquemas), tabelas e exibições em seu data lake existente usando sintaxe familiar.
- Auditoria incorporada: o Unity Catalog captura automaticamente os logs de auditoria a nível de utilizador que registam o acesso aos seus dados.
Você pode aceder a dados no católogo Unity da mesma forma que acede a dados locais num workspace: num cluster de Ciência de Dados e Engenharia ou num cluster de Databricks Mosaic AI, num armazém SQL, no editor SQL do Databricks ou usando a API REST do Unity Catalog ou a interface de linha de comando (CLI) do Unity Catalog.
Para obter mais informações, consulte O que é o Unity Catalog?. Para participar da visualização pública do Catálogo Unity, entre em contato com sua equipe de conta do Azure Databricks.
O Delta Sharing está disponível na Pré-visualização Pública
10 de março de 2022
Delta Sharing (Preview) é um protocolo aberto desenvolvido pela Databricks para compartilhamento seguro de dados com outras organizações, independentemente de quais plataformas de computação elas usam. Um usuário do Databricks, chamado de "provedor de dados", pode usar o Delta Sharing para compartilhar dados em um metastore do Unity Catalog com uma pessoa ou grupo fora de sua organização, chamado de "destinatário de dados". Os destinatários dos dados podem começar imediatamente a trabalhar com a versão mais recente dos dados compartilhados. Para obter uma lista completa de conectores e informações sobre como usá-los, consulte a documentação do projeto Delta Sharing. Quando o Compartilhamento Delta está habilitado em um metastore do Unity Catalog, o Unity Catalog executa um servidor de Compartilhamento Delta.
Para obter mais informações, consulte O que é o Delta Sharing?. Para participar da visualização pública do Delta Sharing, entre em contato com sua equipe de conta do Azure Databricks.
Girar a chave gerenciada pelo cliente para serviços gerenciados
10 de março de 2022
Você pode adicionar uma chave gerenciada pelo cliente (CMK) para serviços gerenciados. O Azure Databricks utiliza a sua chave para proteger e controlar o acesso à chave que encripta os dados no plano de controlo para a origem dos notebooks, segredos e histórico de consultas SQL do Databricks. Esta funcionalidade está em Pré-visualização Pública.
Agora podes girar (atualizar) a chave.
Controle de acesso aprimorado para pipelines DLT
9 de março de 2022
Agora você tem mais controle sobre o acesso aos seus pipelines DLT, incluindo o proprietário de um pipeline, quem pode visualizar ou gerenciar o pipeline e quem pode executar o pipeline. Consulte as ACLs do pipeline de DLT .
Testar a funcionalidade de pré-visualização do DLT com a configuração channel
(Pré-visualização Pública)
7 a 14 de março de 2022: Versão 3.67
Você pode testar as novas funcionalidades nos seus pipelines de DLT com a nova configuração channel
. Para testar o seu pipeline com as próximas funcionalidades, configure channel
para preview
. Para voltar para a versão atual, defina channel
como current
.
Tratamento de erros melhorado para funções DLT Python (Visualização pública)
7 a 14 de março de 2022: Versão 3.67
Esta versão adiciona verificação de tipo para validar que as funções DLT Python usam o tipo de dados string
ao definir nomes e valores para propriedades da tabela. Anteriormente, definir propriedades de tabela usando valores que não fossem de cadeia de caracteres poderia fazer com que seu pipeline falhasse sem uma mensagem de erro indicando a causa subjacente.
Melhorias no Databricks Repos
7 a 14 de março de 2022: Versão 3.67
As seguintes melhorias foram feitas no Databricks Repos.
- Pesquisa de texto e substituição em ficheiros em repositórios. O editor de arquivos agora tem os menus Arquivo e Editar que fornecem funcionalidades de pesquisa, substituir e substituir tudo.
- Anteriormente, a Databricks recomendava que o número total de blocos de anotações e arquivos em um repositório não excedesse 2000. Esse limite foi aumentado para 5000.
Registo de diagnóstico para alterações de políticas de cluster
7 a 14 de março de 2022: Versão 3.67
Quando o log de auditoria está habilitado, um evento de auditoria agora é registrado quando você cria, atualiza ou exclui uma diretiva de cluster ou quando atualiza as permissões de usuário para uma diretiva de cluster. Para obter mais informações, consulte a Referência do registo de diagnóstico.
Databricks Runtime 10.4 (Beta)
4 de março de 2022
Databricks Runtime 10.4, 10.4 Photon e 10.4 ML estão agora disponíveis como versões Beta.
Consulte as notas de versão completas em Databricks Runtime 10.4 LTS e Databricks Runtime 10.4 LTS for Machine Learning.