Atualizações de manutenção para Databricks Runtime (arquivado)
Esta página arquivada lista as atualizações de manutenção emitidas para versões do Databricks Runtime que não são mais suportadas. Para adicionar uma atualização de manutenção a um cluster existente, reinicie o cluster.
Importante
Esta documentação foi desativada e pode não ser atualizada. Os produtos, serviços ou tecnologias mencionados neste conteúdo chegaram ao fim do suporte. Consulte Notas de versão, versões e compatibilidade do Databricks Runtime.
Nota
Este artigo contém referências ao termo whitelist, um termo que o Azure Databricks não usa. Quando o termo for removido do software, iremos removê-lo deste artigo.
Versões do Databricks Runtime
Atualizações de manutenção por versão:
- Tempo de execução do Databricks 15.1
- Tempo de execução do Databricks 15.0
- Tempo de execução do Databricks 14.2
- Tempo de execução do Databricks 14.0
- Tempo de execução do Databricks 13.1
- Tempo de execução do Databricks 12.2 LTS
- Tempo de execução do Databricks 11.3 LTS
- Tempo de execução do Databricks 10.4 LTS
- Tempo de execução do Databricks 9.1 LTS
- Tempo de execução do Databricks 13.0 (EoS)
- Tempo de execução do Databricks 12.1 (EoS)
- Tempo de execução do Databricks 12.0 (EoS)
- Tempo de execução do Databricks 11.2 (EoS)
- Tempo de execução do Databricks 11.1 (EoS)
- Databricks Runtime 11.0 (EoS)
- Tempo de execução do Databricks 10.5 (EoS)
- Tempo de execução do Databricks 10.3 (EoS)
- Tempo de execução do Databricks 10.2 (EoS)
- Tempo de execução do Databricks 10.1 (EoS)
- Tempo de execução do Databricks 10.0 (EoS)
- Tempo de execução do Databricks 9.0 (EoS)
- Tempo de execução do Databricks 8.4 (EoS)
- Tempo de execução do Databricks 8.3 (EoS)
- Tempo de execução do Databricks 8.2 (EoS)
- Tempo de execução do Databricks 8.1 (EoS)
- Tempo de execução do Databricks 8.0 (EoS)
- Tempo de execução do Databricks 7.6 (EoS)
- Tempo de execução do Databricks 7.5 (EoS)
- Tempo de execução do Databricks 7.3 LTS (EoS)
- Suporte estendido (EoS) do Databricks Runtime 6.4
- Tempo de execução do Databricks 5.5 LTS (EoS)
- Suporte estendido a Databricks Light 2.4
- Tempo de execução do Databricks 7.4 (EoS)
- Tempo de execução do Databricks 7.2 (EoS)
- Tempo de execução do Databricks 7.1 (EoS)
- Tempo de execução do Databricks 7.0 (EoS)
- Tempo de execução do Databricks 6.6 (EoS)
- Tempo de execução do Databricks 6.5 (EoS)
- Tempo de execução do Databricks 6.3 (EoS)
- Databricks Runtime 6.2 (EoS)
- Tempo de execução do Databricks 6.1 (EoS)
- Tempo de execução do Databricks 6.0 (EoS)
- Databricks Runtime 5,4 ML (EoS)
- Tempo de execução do Databricks 5.4 (EoS)
- Tempo de execução do Databricks 5.3 (EoS)
- Tempo de execução do Databricks 5.2 (EoS)
- Tempo de execução do Databricks 5.1 (EoS)
- Databricks Runtime 5.0 (EoS)
- Databricks Runtime 4.3 (EoS)
- Tempo de execução do Databricks 4.2 (EoS)
- Databricks Runtime 4.1 ML (EoS)
- Tempo de execução do Databricks 4.1 (EoS)
- Tempo de execução do Databricks 4.0 (EoS)
- Databricks Runtime 3.5 LTS (EoS)
- Tempo de execução do Databricks 3.4 (EoS)
Para obter as atualizações de manutenção em versões suportadas do Databricks Runtime, consulte Atualizações de manutenção do Databricks Runtime.
Tempo de execução do Databricks 15.1
Consulte Databricks Runtime 15.1 (EoS).
- Outubro 22, 2024
- [FAÍSCA-49863][SQL] Corrigir NormalizeFloatingNumbers para preservar a anulabilidade de estruturas aninhadas
- [FAÍSCA-46632][SQL] Corrigir a eliminação de subexpressões quando expressões ternárias equivalentes têm filhos diferentes
- [FAÍSCA-49782][SQL] A regra ResolveDataFrameDropColumns resolve UnresolvedAttribute com saída filho
- [FAÍSCA-49905] Use ShuffleOrigin dedicado para operador stateful para evitar que o shuffle seja modificado a partir do AQE
- [FAÍSCA-49829] Revisar a otimização na adição de entrada ao armazenamento de estado na junção de fluxo de fluxo (correção de correção)
- Atualizações de segurança do sistema operacional.
- 10 de outubro de 2024
- [FAÍSCA-49688][CONECTAR] Corrigir uma corrida de dados entre o plano de interrupção e execução
- [FAÍSCA-49743][SQL] OptimizeCsvJsonExpr não deve alterar campos de esquema ao remover GetArrayStructFields
- [BACKPORT][[FAÍSCA-49474]]https://issues.apache.org/jira/browse/SPARK-49474)[SS] Classify Error class for FlatMapGroupsWithState user function error
- Atualizações de segurança do sistema operacional.
- 25 de setembro de 2024
- [FAÍSCA-49628][SQL] ConstantFolding deve copiar a expressão com estado antes de avaliar
- [FAÍSCA-48719][SQL] Corrigir o bug de cálculo de RegrSlope & RegrIntercept quando o primeiro parâmetro é nulo
- [FAÍSCA-49492][CONECTAR] Reanexar tentativa em ExecutionHolder inativo
- [FAÍSCA-49000][SQL] Corrija "select count(distinct 1) from t" onde t é uma tabela vazia expandindo RewriteDistinctAggregates
- [FAÍSCA-49458][CONECTAR][PYTHON] Forneça a ID da sessão do lado do servidor via ReattachExecute
- Atualizações de segurança do sistema operacional.
- 17 de setembro de 2024
- [FAÍSCA-49336][CONECTAR] Limitar o nível de aninhamento ao truncar uma mensagem protobuf
- [FAÍSCA-49526][CONECTAR] Suporte a caminhos no estilo do Windows no ArtifactManager
- [FAÍSCA-49409][CONECTAR] Ajuste o valor padrão de CONNECT_SESSION_PLAN_CACHE_SIZE
- [FAÍSCA-43242][CORE] Corrigir lançamento 'Tipo inesperado de BlockId' no diagnóstico de corrupção aleatória
- [FAÍSCA-49366][CONECTAR] Tratar o nó União como folha na resolução da coluna do quadro de dados
- 29 de agosto de 2024
- [FAÍSCA-49263][CONECTAR] Cliente python do Spark Connect: manipule consistentemente as opções do leitor de Dataframe booleano
- [FAÍSCA-49056][SQL] ErrorClassesJsonReader não pode manipular null corretamente
-
[FAÍSCA-48862][PYTHON][CONECTAR] Evite ligar
_proto_to_string
quando o nível INFO não estiver ativado - [FAÍSCA-49146][SS] Mover erros de asserção relacionados à marca d'água ausente nas consultas de streaming do modo de acréscimo para a estrutura de erros
- 14 de agosto de 2024
- [FAÍSCA-48941][FAÍSCA-48970] Correções de gravador/leitor de backport ML
- [FAÍSCA-48050][SS] Registrar o plano lógico no início da consulta
- [FAÍSCA-48706][PYTHON] Python UDF em funções de ordem superior não deve lançar erro interno
- [FAÍSCA-48597][SQL] Introduzir um marcador para a propriedade isStreaming na representação de texto do plano lógico
- [FAÍSCA-49065][SQL] A rebase em formatters/analisadores herdados deve suportar fusos horários não padrão da JVM
- [FAÍSCA-49047][PYTHON][CONECTAR] Truncar a mensagem para registro em log
- [FAÍSCA-48740][SQL] Detetar erro de especificação de janela ausente antecipadamente
- 1 de agosto de 2024
- Na computação sem servidor para blocos de anotações e trabalhos, o modo ANSI SQL é habilitado por padrão. Consulte Parâmetros de configuração do Spark suportados.
- Na computação configurada com o modo de acesso compartilhado, as leituras e gravações em lote Kafka agora têm as mesmas limitações impostas que as documentadas para o Structured Streaming. Consulte Limitações e requisitos de streaming para o modo de acesso compartilhado do Unity Catalog.
- A saída de uma
SHOW CREATE TABLE
instrução agora inclui quaisquer filtros de linha ou máscaras de coluna definidos em uma exibição materializada ou tabela de streaming. Consulte SHOW CREATE TABLE. Para saber mais sobre filtros de linha e máscaras de coluna, consulte Filtrar dados de tabela confidenciais usando filtros de linha e máscaras de coluna. - [FAÍSCA-48544][SQL] Reduza a pressão de memória de BitSets TreeNode vazios
- [FAÍSCA-46957][CORE] Descomissionar arquivos shuffle migrados deve ser capaz de limpar do executor
- [FAÍSCA-47202][PYTHON] Corrigir erros de digitação quebrando datetimes com tzinfo
- [FAÍSCA-48713][SQL] Adicionar verificação de intervalo de índice para UnsafeRow.pointTo quando baseObject é matriz de bytes
- [FAÍSCA-48896][FAÍSCA-48909][FAÍSCA-48883] Correções do gravador de ML de faísca de backport
- [FAÍSCA-48810][CONECTAR] A API Session stop() deve ser idempotente e não falhar se a sessão já estiver fechada pelo servidor
- [FAÍSCA-48873][SQL] Use UnsafeRow no analisador JSON.
- [FAÍSCA-48934][SS] Tipos de datetime Python convertidos incorretamente para definir o tempo limite em applyInPandasWithState
- [FAÍSCA-48705][PYTHON] Use explicitamente worker_main quando ele começa com pyspark
- [FAÍSCA-48889][SS] testStream para descarregar armazenamentos de estado antes de terminar
- [FAÍSCA-48047][SQL] Reduza a pressão de memória de tags TreeNode vazias
- [FAÍSCA-48463] Tornar o StringIndexer compatível com colunas de entrada aninhadas
- Atualizações de segurança do sistema operacional.
- Julho 11, 2024
- (Alteração de comportamento) DataFrames armazenados em cache em fontes de tabela Delta agora são invalidados se a tabela de origem for substituída. Essa alteração significa que todas as alterações de estado nas tabelas Delta agora invalidam os resultados armazenados em cache. Use
.checkpoint()
para persistir um estado de tabela durante todo o tempo de vida de um DataFrame. - O Snowflake JDBC Driver é atualizado para a versão 3.16.1.
- Esta versão inclui uma correção para um problema que impedia que a guia Ambiente da Interface do Usuário do Spark fosse exibida corretamente ao ser executada nos Serviços de Contêiner do Databricks.
- Na computação sem servidor para blocos de anotações e trabalhos, o modo ANSI SQL é habilitado por padrão. Consulte Parâmetros de configuração do Spark suportados.
- Para ignorar partições inválidas ao ler dados, as fontes de dados baseadas em arquivo, como Parquet, ORC, CSV ou JSON, podem definir a opção de fonte de dados ignoreInvalidPartitionPaths como true. Por exemplo: spark.read.format("parquet").option("ignoreInvalidPartitionPaths", "true").load(...)`. Você também pode usar a configuração SQL spark.sql.files.ignoreInvalidPartitionPaths. No entanto, a opção de fonte de dados tem precedência sobre a configuração SQL. Essa configuração é falsa por padrão.
- [FAÍSCA-48383][SS] Lançar melhor erro para partições incompatíveis na opção startOffset em Kafka
- [FAÍSCA-48481][SQL][SS] Não aplique OptimizeOneRowPlan contra streaming Dataset
- [FAÍSCA-48100][SQL] Corrigir problemas ao ignorar campos de estrutura aninhada não selecionados no esquema
- [FAÍSCA-47463][SQL] Use V2Predicate para envolver a expressão com o tipo de retorno de booleano
- [FAÍSCA-48445][SQL] Não inline UDFs com crianças caras
- [FAÍSCA-48292][CORE] Revert [SPARK-39195][SQL] Spark OutputCommitCoordinator deve abortar o estágio quando o arquivo confirmado não é consistente com o status da tarefa
- [FAÍSCA-48566][PYTHON] Corrija o bug em que os índices de partição estão incorretos quando UDTF analyze() usa select e partitionColumns
- [FAÍSCA-48648][PYTHON][CONECTAR] Tornar SparkConnectClient.tags corretamente threadlocal
- [FAÍSCA-48503][SQL] Corrigir subconsultas escalares inválidas com group-by em colunas não equivalentes que foram permitidas incorretamente
- [FAÍSCA-48252][SQL] Atualize o CommonExpressionRef quando necessário
- [FAÍSCA-48475][PYTHON] Otimize _get_jvm_function no PySpark.
- [FAÍSCA-48294][SQL] Manipular minúsculas em nestedTypeMissingElementTypeError
- [FAÍSCA-48286] Corrigir análise de coluna com expressão padrão existente - Adicionar erro voltado para o usuário
- [FAÍSCA-47309][SQL] XML: Adicionar testes de inferência de esquema para marcas de valor
- [FAÍSCA-47309][SQL][XML] Adicionar testes de unidade de inferência de esquema
- [FAÍSCA-48273][SQL] Corrigir a reescrita tardia de PlanWithUnresolvedIdentifier
- Atualizações de segurança do sistema operacional.
- (Alteração de comportamento) DataFrames armazenados em cache em fontes de tabela Delta agora são invalidados se a tabela de origem for substituída. Essa alteração significa que todas as alterações de estado nas tabelas Delta agora invalidam os resultados armazenados em cache. Use
- 17 de junho de 2024
-
applyInPandasWithState()
está disponível em clusters compartilhados. - Corrige um bug em que a otimização da janela de classificação usando Photon TopK manipulava incorretamente partições com structs.
- [FAÍSCA-48310][PYTHON][CONECTAR] As propriedades armazenadas em cache devem retornar cópias
-
[FAÍSCA-48276][PYTHON][CONECTAR] Adicione o método ausente
__repr__
paraSQLExpression
- [FAÍSCA-48277] Melhorar a mensagem de erro para ErrorClassesJsonReader.getErrorMessage
- [FAÍSCA-47764][CORE][SQL] Limpeza de dependências aleatórias com base em ShuffleCleanupMode
- Atualizações de segurança do sistema operacional.
-
- 21 de maio de 2024
- Corrigido um bug na função try_divide() em que entradas contendo decimais resultavam em exceções inesperadas.
- [FAÍSCA-48173][SQL] CheckAnalysis deve ver todo o plano de consulta
- [FAÍSCA-48016][SQL] Corrigir um bug na função try_divide quando com decimais
- [FAÍSCA-48105][SS] Corrigir a condição de corrida entre o descarregamento do armazenamento de estado e o snapshot
- [FAÍSCA-48197][SQL] Evitar erro de declaração para função lambda inválida
- [FAÍSCA-48180][SQL] Melhorar o erro quando a chamada UDTF com TABLE arg esquece parênteses em torno de várias PARTIÇÃO/ORDEM POR exprs
- [FAÍSCA-48014][SQL] Altere o erro makeFromJava no EvaluatePython para um erro voltado para o usuário
- [FAÍSCA-48056][CONECTAR][PYTHON] Execute novamente o plano se um erro de SESSION_NOT_FOUND for gerado e nenhuma resposta parcial for recebida
- [FAÍSCA-48146][SQL] Corrigir função agregada em Com expressão asserção filho
- [FAÍSCA-47994][SQL] Corrigir bug com o filtro de coluna CASE WHEN push down no SQLServer
- Atualizações de segurança do sistema operacional.
- 9 de maio de 2024
- [FAÍSCA-47543][CONECTAR][PYTHON] Inferindo dict como MapType do Pandas DataFrame para permitir a criação de DataFrame
- [FAÍSCA-47739][SQL] Registrar tipo avro lógico
-
[FAÍSCA-48044][PYTHON][CONECTAR] Cache
DataFrame.isStreaming
-
[FAÍSCA-47855][CONECTAR] Adicionar
spark.sql.execution.arrow.pyspark.fallback.enabled
na lista não suportada - [FAÍSCA-48010][SQL] Evite chamadas repetidas para conf.resolver em resolveExpression
- [FAÍSCA-47941] [SS] [Conectar] Propagar erros de inicialização do trabalhador ForeachBatch aos usuários para o PySpark
- [FAÍSCA-47819][CONECTAR][Cherry-pick-15.0] Usar retorno de chamada assíncrono para limpeza de execução
- [FAÍSCA-47956][SQL] Verificação de sanidade para referência de ACV não resolvida
- [FAÍSCA-47839][SQL] Corrigir bug agregado em RewriteWithExpression
- [FAÍSCA-48018][SS] Corrigir groupId nulo causando erro de param ausente ao lançar KafkaException.couldNotReadOffsetRange
- [FAÍSCA-47371] [SQL] XML: Ignorar marcas de linha encontradas no CDATA
- [FAÍSCA-47907][SQL] Coloque bang sob uma configuração
- [FAÍSCA-47895][SQL] grupo por todos deve ser idempotente
- [FAÍSCA-47973][CORE] Site de chamada de log em SparkContext.stop() e posterior em SparkContext.assertNotStopped()
- [FAÍSCA-47986][CONECTAR][PYTHON] Não é possível criar uma nova sessão quando a sessão padrão é fechada pelo servidor
- Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 15.0
Consulte Databricks Runtime 15.0 (EoS).
- 30 de maio de 2024
- 25 de abril de 2024
- [FAÍSCA-47786] SELECT DISTINCT () não deve se tornar SELECT DISTINCT struct() (reverter para o comportamento anterior)
- [FAÍSCA-47802][SQL] Reverter () do significado struct() de volta para o significado *
- [FAÍSCA-47509][SQL] Bloquear expressões de subconsulta em funções lambda e de ordem superior
- [FAÍSCA-47722] Aguarde até que o trabalho em segundo plano do RocksDB termine antes de fechar
- [FAÍSCA-47081][CONECTAR][SEGUIR] Melhorando a usabilidade do manipulador de progresso
- [FAÍSCA-47694][CONECTAR] Torne o tamanho máximo da mensagem configurável no lado do cliente
-
[FAÍSCA-47669][SQL][CONECTAR][PYTHON] Adicionar
Column.try_cast
- [FAÍSCA-47664][PYTHON][CONECTAR][Cherry-pick-15.0] Valide o nome da coluna com o esquema armazenado em cache
- [FAÍSCA-47818][CONECTAR][Cherry-pick-15.0] Introduza o cache de planos no SparkConnectPlanner para melhorar o desempenho de solicitações de análise
- [FAÍSCA-47704][SQL] A análise JSON falha com "java.lang.ClassCastException" quando spark.sql.json.enablePartialResults está ativado
- [FAÍSCA-47755][CONECTAR] O pivô deve falhar quando o número de valores distintos é muito grande
- [FAÍSCA-47713][SQL][CONECTAR] Corrigir uma falha de auto-junção
- [FAÍSCA-47812][CONECTAR] Suporte à serialização de SparkSession para o trabalhador ForEachBatch
-
[FAÍSCA-47828][CONECTAR][PYTHON]
DataFrameWriterV2.overwrite
falha com plano inválido - [FAÍSCA-47862][PYTHON][CONECTAR]Corrigir a geração de arquivos proto
- [FAÍSCA-47800][SQL] Criar novo método para conversão de identificador para tableIdentifier
- Atualizações de segurança do sistema operacional.
- 3 de abril de 2024
- (Mudança de comportamento) Para garantir um comportamento consistente entre os tipos de computação, as UDFs do PySpark em clusters compartilhados agora correspondem ao comportamento das UDFs em clusters sem isolamento e atribuídos. Esta atualização inclui as seguintes alterações que podem quebrar o código existente:
- UDFs com um tipo de
string
retorno não convertem mais implicitamente não-valoresstring
emstring
valores. Anteriormente, UDFs com um tipo de retorno de encapsulavam o valor de retorno com umastr
função, independentemente do tipo de dados real do valor retornadostr()
. - UDFs com
timestamp
tipos de retorno não aplicam mais implicitamente uma conversão paratimestamp
comtimezone
. - As configurações de
spark.databricks.sql.externalUDF.*
cluster do Spark não se aplicam mais às UDFs do PySpark em clusters compartilhados. - A configuração
spark.databricks.safespark.externalUDF.plan.limit
do cluster Spark não afeta mais UDFs do PySpark, removendo a limitação de visualização pública de 5 UDFs por consulta para UDFs do PySpark. - A configuração
spark.databricks.safespark.sandbox.size.default.mib
de cluster do Spark não se aplica mais a UDFs do PySpark em clusters compartilhados. Em vez disso, a memória disponível no sistema é usada. Para limitar a memória de UDFs do PySpark, usespark.databricks.pyspark.udf.isolation.memoryLimit
com um valor mínimo de100m
.
- UDFs com um tipo de
- O
TimestampNTZ
tipo de dados agora é suportado como uma coluna de clustering com clustering líquido. Veja Utilizar clustering líquido para tabelas Delta. - [FAÍSCA-47218][SQL] XML: Ignorar marcas de linha comentadas no tokenizador XML
- [FAÍSCA-46990][SQL] Corrigir o carregamento de arquivos Avro vazios emitidos por hubs de eventos
- [FAÍSCA-47033][SQL] Corrigir EXECUTE IMMEDIATE USING não reconhece nomes de variáveis de sessão
- [FAÍSCA-47368][SQL] Remover inferTimestampNTZ config check in ParquetRowConverter
- [FAÍSCA-47561][SQL] Corrigir problemas de ordem de regra do analisador sobre Alias
- [FAÍSCA-47638][PS][CONECTAR] Ignorar validação de nome de coluna no PS
- [FAÍSCA-46906][BACKPORT][SS] Adicionar uma verificação de alteração de operador com monitoração de estado para streaming
- [FAÍSCA-47569][SQL] Não permitir a comparação de variantes.
- [FAÍSCA-47241][SQL] Corrigir problemas de ordem de regra para ExtractGenerator
- [FAÍSCA-47218] [SQL] XML: SchemaOfXml alterado para falhar no modo DROPMALFORMED
-
[FAÍSCA-47300][SQL]
quoteIfNeeded
se o identificador da cotação começar com dígitos - [FAÍSCA-47009][SQL][Colação] Habilitar a criação de suporte de tabela para agrupamento
-
[FAÍSCA-47322][PYTHON][CONECTAR] Tornar
withColumnsRenamed
o tratamento de duplicação de nomes de colunas consistente comwithColumnRenamed
- [FAÍSCA-47544][PYTHON] O método SparkSession builder é incompatível com o visual studio code intellisense
- [FAÍSCA-47511][SQL] Canonicalize com expressões reatribuindo IDs
- [FAÍSCA-47385] Corrija codificadores de tupla com entradas Option.
- [FAÍSCA-47200][SS] Classe de erro para erro de função de usuário do coletor de lote Foreach
- [FAÍSCA-47135][SS] Implementar classes de erro para exceções de perda de dados Kafka
- [FAÍSCA-38708][SQL] Atualize o Hive Metastore Client para a versão 3.1.3 do Hive 3.1
- [FAÍSCA-47305][SQL] Corrija PruneFilters para marcar o sinalizador isStreaming de LocalRelation corretamente quando o plano tiver lote e streaming
- [FAÍSCA-47380][CONECTAR] Certifique-se no lado do servidor de que o SparkSession é o mesmo
- Atualizações de segurança do sistema operacional.
- (Mudança de comportamento) Para garantir um comportamento consistente entre os tipos de computação, as UDFs do PySpark em clusters compartilhados agora correspondem ao comportamento das UDFs em clusters sem isolamento e atribuídos. Esta atualização inclui as seguintes alterações que podem quebrar o código existente:
Tempo de execução do Databricks 14.2
Consulte Databricks Runtime 14.2 (EoS).
- Outubro 22, 2024
- [FAÍSCA-49782][SQL] A regra ResolveDataFrameDropColumns resolve UnresolvedAttribute com saída filho
- [FAÍSCA-49905] Use ShuffleOrigin dedicado para operador stateful para evitar que o shuffle seja modificado a partir do AQE
- Atualizações de segurança do sistema operacional.
- 10 de outubro de 2024
- [FAÍSCA-49743][SQL] OptimizeCsvJsonExpr não deve alterar campos de esquema ao remover GetArrayStructFields
- [BACKPORT][[FAÍSCA-49474]]https://issues.apache.org/jira/browse/SPARK-49474)[SS] Classify Error class for FlatMapGroupsWithState user function error
- 25 de setembro de 2024
- [FAÍSCA-48719][SQL] Corrigir o bug de cálculo de 'RegrS...
- [FAÍSCA-49628][SQL] ConstantFolding deve copiar a expressão com estado antes de avaliar
- [FAÍSCA-49000][SQL] Corrija "select count(distinct 1) from t" onde t é uma tabela vazia expandindo RewriteDistinctAggregates
- [FAÍSCA-43242][CORE] Corrigir lançamento 'Tipo inesperado de BlockId' no diagnóstico de corrupção aleatória
- [FAÍSCA-46601] [CORE] Corrigir erro de log em handleStatusMessage
- Atualizações de segurança do sistema operacional.
- 17 de setembro de 2024
- [FAÍSCA-49526][CONECTAR] Suporte a caminhos no estilo do Windows no ArtifactManager
- 29 de agosto de 2024
- [FAÍSCA-49263][CONECTAR] Cliente python do Spark Connect: manipule consistentemente as opções do leitor de Dataframe booleano
- [FAÍSCA-49146][SS] Mover erros de asserção relacionados à marca d'água ausente nas consultas de streaming do modo de acréscimo para a estrutura de erros
- [FAÍSCA-49056][SQL] ErrorClassesJsonReader não pode manipular null corretamente
- 14 de agosto de 2024
- [FAÍSCA-48050][SS] Registrar o plano lógico no início da consulta
- [FAÍSCA-48597][SQL] Introduzir um marcador para a propriedade isStreaming na representação de texto do plano lógico
- [FAÍSCA-49065][SQL] A rebase em formatters/analisadores herdados deve suportar fusos horários não padrão da JVM
- [FAÍSCA-48706][PYTHON] Python UDF em funções de ordem superior não deve lançar erro interno
- 1 de agosto de 2024
- Esta versão inclui uma correção de bug para as
ColumnVector
classes eColumnarArray
na interface Java do Spark. Antes dessa correção, umArrayIndexOutOfBoundsException
pode ser lançado ou dados incorretos retornados quando uma instância de uma dessas classes continhanull
valores. - A saída de uma
SHOW CREATE TABLE
instrução agora inclui quaisquer filtros de linha ou máscaras de coluna definidos em uma exibição materializada ou tabela de streaming. Consulte SHOW CREATE TABLE. Para saber mais sobre filtros de linha e máscaras de coluna, consulte Filtrar dados de tabela confidenciais usando filtros de linha e máscaras de coluna. - [FAÍSCA-47202][PYTHON] Corrigir erros de digitação quebrando datetimes com tzinfo
- [FAÍSCA-48705][PYTHON] Use explicitamente worker_main quando ele começa com pyspark
- Atualizações de segurança do sistema operacional.
- Esta versão inclui uma correção de bug para as
- Julho 11, 2024
- (Alteração de comportamento) DataFrames armazenados em cache em fontes de tabela Delta agora são invalidados se a tabela de origem for substituída. Essa alteração significa que todas as alterações de estado nas tabelas Delta agora invalidam os resultados armazenados em cache. Use
.checkpoint()
para persistir um estado de tabela durante todo o tempo de vida de um DataFrame. - O Snowflake JDBC Driver é atualizado para a versão 3.16.1
- Esta versão inclui uma correção para um problema que impedia que a guia Ambiente da Interface do Usuário do Spark fosse exibida corretamente ao ser executada nos Serviços de Contêiner do Databricks.
- [FAÍSCA-48292][CORE] Revert [SPARK-39195][SQL] Spark OutputCommitCoordinator deve abortar o estágio quando o arquivo confirmado não é consistente com o status da tarefa
- [FAÍSCA-48273][SQL] Corrigir a reescrita tardia de PlanWithUnresolvedIdentifier
- [FAÍSCA-48503][SQL] Corrigir subconsultas escalares inválidas com group-by em colunas não equivalentes que foram permitidas incorretamente
- [FAÍSCA-48481][SQL][SS] Não aplique OptimizeOneRowPlan contra streaming Dataset
- [FAÍSCA-48475][PYTHON] Otimize _get_jvm_function no PySpark.
- [FAÍSCA-48100][SQL] Corrigir problemas ao ignorar campos de estrutura aninhada não selecionados no esquema
- [FAÍSCA-48445][SQL] Não inline UDFs com crianças caras
- [FAÍSCA-48383][SS] Lançar melhor erro para partições incompatíveis na opção startOffset em Kafka
- Atualizações de segurança do sistema operacional.
- (Alteração de comportamento) DataFrames armazenados em cache em fontes de tabela Delta agora são invalidados se a tabela de origem for substituída. Essa alteração significa que todas as alterações de estado nas tabelas Delta agora invalidam os resultados armazenados em cache. Use
- 17 de junho de 2024
- Corrige um bug em que a otimização da janela de classificação usando Photon TopK manipulava incorretamente partições com structs.
-
[FAÍSCA-48276][PYTHON][CONECTAR] Adicione o método ausente
__repr__
paraSQLExpression
- [FAÍSCA-48277] Melhorar a mensagem de erro para ErrorClassesJsonReader.getErrorMessage
- Atualizações de segurança do sistema operacional.
- 21 de maio de 2024
- (Mudança de comportamento) agora é suportado para
dbutils.widgets.getAll()
. - [FAÍSCA-48173][SQL] CheckAnalysis deve ver todo o plano de consulta
- [FAÍSCA-48197][SQL] Evitar erro de declaração para função lambda inválida
- [FAÍSCA-47994][SQL] Corrigir bug com o filtro de coluna CASE WHEN push down no SQLServer
- [FAÍSCA-48105][SS] Corrigir a condição de corrida entre o descarregamento do armazenamento de estado e o snapshot
- Atualizações de segurança do sistema operacional.
- (Mudança de comportamento) agora é suportado para
- 9 de maio de 2024
-
[FAÍSCA-48044][PYTHON][CONECTAR] Cache
DataFrame.isStreaming
- [FAÍSCA-47956][SQL] Verificação de sanidade para referência de ACV não resolvida
- [FAÍSCA-47371] [SQL] XML: Ignorar marcas de linha encontradas no CDATA
- [FAÍSCA-47812][CONECTAR] Suporte à serialização de SparkSession para o trabalhador ForEachBatch
- [FAÍSCA-47895][SQL] grupo por todos deve ser idempotente
- [FAÍSCA-47973][CORE] Site de chamada de log em SparkContext.stop() e posterior em SparkContext.assertNotStopped()
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-48044][PYTHON][CONECTAR] Cache
- 25 de abril de 2024
- [FAÍSCA-47704][SQL] A análise JSON falha com "java.lang.ClassCastException" quando spark.sql.json.enablePartialResults está ativado
-
[FAÍSCA-47828][CONECTAR][PYTHON]
DataFrameWriterV2.overwrite
falha com plano inválido - Atualizações de segurança do sistema operacional.
- 11 de abril de 2024
- [FAÍSCA-47309][SQL][XML] Adicionar testes de unidade de inferência de esquema
- [FAÍSCA-46990][SQL] Corrigir o carregamento de arquivos Avro vazios emitidos por hubs de eventos
- [FAÍSCA-47638][PS][CONECTAR] Ignorar validação de nome de coluna no PS
- [FAÍSCA-47509][SQL] Bloquear expressões de subconsulta em funções lambda e de ordem superior
- [FAÍSCA-38708][SQL] Atualize o Hive Metastore Client para a versão 3.1.3 do Hive 3.1
- Atualizações de segurança do sistema operacional.
- 1 de abril de 2024
-
[FAÍSCA-47322][PYTHON][CONECTAR] Tornar
withColumnsRenamed
o tratamento de duplicação de nomes de colunas consistente comwithColumnRenamed
- [FAÍSCA-47385] Corrija codificadores de tupla com entradas Option.
- [FAÍSCA-47070] Corrigir agregação inválida após a reescrita da subconsulta
- [FAÍSCA-47218] [SQL] XML: SchemaOfXml alterado para falhar no modo DROPMALFORMED
- [FAÍSCA-47305][SQL] Corrija PruneFilters para marcar o sinalizador isStreaming de LocalRelation corretamente quando o plano tiver lote e streaming
- [FAÍSCA-47218][SQL] XML: Ignorar marcas de linha comentadas no tokenizador XML
- Reverter "[SPARK-46861][CORE] Evitar impasse no DAGScheduler"
-
[FAÍSCA-47300][SQL]
quoteIfNeeded
se o identificador da cotação começar com dígitos - [FAÍSCA-47368][SQL] Remover inferTimestampNTZ config check in ParquetRowConverter
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-47322][PYTHON][CONECTAR] Tornar
- Março 14, 2024
- [FAÍSCA-47035][SS][CONECTAR] Protocolo para ouvinte do lado do cliente
- [FAÍSCA-47121][CORE] Evite RejectedExecutionExceptions durante o desligamento StandaloneSchedulerBackend
- [FAÍSCA-47145][SQL] Passe o identificador da tabela para o exec de verificação da fonte de dados de linha para a estratégia V2.
- [FAÍSCA-47176][SQL] Ter uma função auxiliar ResolveAllExpressionsUpWithPruning
- [FAÍSCA-47167][SQL] Adicionar classe concreta para relação anônima JDBC
-
[FAÍSCA-47129][CONECTAR][SQL] Fazer
ResolveRelations
o plano de conexão de cache corretamente - [FAÍSCA-47044][SQL] Adicionar consulta executada para fontes de dados externas JDBC para explicar a saída
- Atualizações de segurança do sistema operacional.
- 29 de fevereiro de 2024
- Corrigido um problema em que o uso de uma coleção local como origem em um comando MERGE poderia resultar na métrica de operação numSourceRows relatando o dobro do número correto de linhas.
- Criar um esquema com um local definido agora requer que o usuário tenha privilégios SELECT e MODIFY em QUALQUER ARQUIVO.
- Agora você pode ingerir arquivos XML usando Autoloader, read_files, COPY INTO, DLT e DBSQL. O suporte a arquivos XML pode inferir e evoluir automaticamente o esquema, resgatar dados com incompatibilidades de tipo, validar XML usando XSD, suportar expressões SQL como from_xml, schema_of_xml e to_xml. Consulte Suporte a arquivos XML para obter mais detalhes. Se você já estava usando o pacote spark-xml externo, consulte aqui para obter orientações sobre migração.
- [FAÍSCA-46954][SQL] XML: Wrap InputStreamReader com BufferedReader
- [FAÍSCA-46630][SQL] XML: Validar o nome do elemento XML na gravação
- [FAÍSCA-46248][SQL] XML: Suporte para as opções ignoreCorruptFiles e ignoreMissingFiles
- [FAÍSCA-46954][SQL] XML: Otimizar a pesquisa de índice de esquema
- [FAÍSCA-47059][SQL] Anexar contexto de erro para o comando ALTER COLUMN v1
- [FAÍSCA-46993][SQL] Corrigir dobragem constante para variáveis de sessão
- 8 de fevereiro de 2024
- Não há suporte para consultas de feed de dados (CDF) de alteração em exibições materializadas do Catálogo Unity, e a tentativa de executar uma consulta CDF com uma exibição materializada do Catálogo Unity retorna um erro. As tabelas do Unity Catalog Streaming suportam consultas CDF em não-tabelas
APPLY CHANGES
no Databricks Runtime 14.1 e posterior. As consultas CDF não são suportadas com tabelas do Unity Catalog Streaming no Databricks Runtime 14.0 e anteriores. - [FAÍSCA-46930] Adicione suporte para um prefixo personalizado para campos de tipo União no Avro.
- [FAÍSCA-46822] Respeite spark.sql.legacy.charVarcharAsString ao transmitir o tipo jdbc para o tipo catalyst no jdbc.
- [FAÍSCA-46952] XML: Limite o tamanho do registro corrompido.
- [FAÍSCA-46644] Altere adicionar e mesclar no SQLMetric para usar isZero.
- [FAÍSCA-46861] Evite o impasse no DAGScheduler.
- [FAÍSCA-46794] Remova subconsultas de restrições LogicalRDD.
- [FAÍSCA-46941] Não é possível inserir o nó de limite do grupo de janelas para computação top-k se contiver SizeBasedWindowFunction.
- [FAÍSCA-46933] Adicione a métrica de tempo de execução da consulta aos conectores que usam JDBCRDD.
- Atualizações de segurança do sistema operacional.
- Não há suporte para consultas de feed de dados (CDF) de alteração em exibições materializadas do Catálogo Unity, e a tentativa de executar uma consulta CDF com uma exibição materializada do Catálogo Unity retorna um erro. As tabelas do Unity Catalog Streaming suportam consultas CDF em não-tabelas
- 31 de janeiro de 2024
-
[FAÍSCA-46382] XML: Documento de atualização para
ignoreSurroundingSpaces
. - [FAÍSCA-46382] XML: Captura valores intercalados entre elementos.
- [FAÍSCA-46763] Corrija a falha de asserção em ReplaceDeduplicateWithAggregate para atributos duplicados.
- Reverter [SPARK-46769] Refine a inferência de esquema relacionada ao carimbo de data/hora.
-
[FAÍSCA-46677] Corrija
dataframe["*"]
a resolução. - [FAÍSCA-46382] XML: Default ignoreSurroundingSpaces como true.
- [FAÍSCA-46633] Corrija o leitor Avro para lidar com blocos de comprimento zero.
- [FAÍSCA-45964] Remova o acessador sql privado no pacote XML e JSON no pacote catalyst.
- [FAÍSCA-46581] Comentário de atualização sobre isZero em AccumulatorV2.
- [FAÍSCA-45912] Aprimoramento da API XSDToSchema: Mude para a API HDFS para acessibilidade de armazenamento em nuvem.
- [FAÍSCA-45182] Ignore a conclusão da tarefa do estágio antigo depois de tentar novamente o estágio indeterminado pai, conforme determinado pela soma de verificação.
- [FAÍSCA-46660] ReattachExecute solicita atualizações de vitalidade de SessionHolder.
- [FAÍSCA-46610] Criar tabela deve lançar exceção quando nenhum valor para uma chave em opções.
-
[FAÍSCA-46383] Reduza o uso de pilha de driver reduzindo a vida útil do
TaskInfo.accumulables()
. - [FAÍSCA-46769] Refine a inferência de esquema relacionada ao carimbo de data/hora.
- [FAÍSCA-46684] Corrija CoGroup.applyInPandas/Arrow para passar argumentos corretamente.
- [FAÍSCA-46676] dropDuplicatesWithinWatermark não deve falhar na canonicalização do plano.
-
[FAÍSCA-45962] Remova
treatEmptyValuesAsNulls
e usenullValue
a opção em vez disso em XML. - [FAÍSCA-46541] Corrija a referência de coluna ambígua na associação automática.
- [FAÍSCA-46599] XML: Use TypeCoercion.findTightestCommonType para verificação de compatibilidade.
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-46382] XML: Documento de atualização para
- 17 de janeiro de 2024
- O
shuffle
nó do plano explicativo retornado por uma consulta Photon é atualizado para adicionar ocausedBroadcastJoinBuildOOM=true
sinalizador quando ocorre um erro de falta de memória durante um shuffle que faz parte de uma associação de transmissão. - Para evitar o aumento da latência ao se comunicar por TLSv1.3, esta versão de manutenção inclui um patch para a instalação do JDK 8 para corrigir o bug JDK-8293562 do JDK.
-
[FAÍSCA-46261]
DataFrame.withColumnsRenamed
deve manter a ordem do ditado/mapa. -
[FAÍSCA-46538] Corrija o problema de referência de coluna ambígua no
ALSModel.transform
. - [FAÍSCA-46145] spark.catalog.listTables não lança exceção quando a tabela ou exibição não é encontrada.
-
[FAÍSCA-46484] Faça
resolveOperators
com que as funções auxiliares mantenham a ID do plano. -
[FAÍSCA-46394] Corrija problemas spark.catalog.listDatabases() em esquemas com caracteres especiais quando
spark.sql.legacy.keepCommandOutputSchema
definido como true. - [FAÍSCA-46609] Evite explosões exponenciais em PartitioningPreservingUnaryExecNode.
- [FAÍSCA-46446] Desative subconsultas com OFFSET correlacionado para corrigir bugs de correção.
- [FAÍSCA-46152] XML: Adicione suporte a DecimalType na inferência de esquema XML.
-
[FAÍSCA-46602] Propagar
allowExisting
na criação de modo de exibição quando o modo de exibição/tabela não existir. - [FAÍSCA-45814] Faça ArrowConverters.createEmptyArrowBatch call close() para evitar vazamento de memória.
- [FAÍSCA-46058] Adicione sinalizador separado para privateKeyPassword.
- [FAÍSCA-46132] Senha de chave de suporte para chaves JKS para RPC SSL.
- [FAÍSCA-46600] Mova o código compartilhado entre SqlConf e SqlApiConf para SqlApiConfHelper.
- [FAÍSCA-46478] Reverta SPARK-43049 para usar oracle varchar(255) para string.
- [FAÍSCA-46417] Não falhe ao chamar hive.getTable e throwException for false.
- [FAÍSCA-46153] XML: Adicionar suporte a TimestampNTZType.
- [FAÍSCA-46056][BACKPORT] Corrija o NPE de leitura vetorizado do Parquet com o valor padrão byteArrayDecimalType.
- [FAÍSCA-46466] O leitor de parquet vetorizado nunca deve fazer rebase para ntz de carimbo de data/hora.
-
[FAÍSCA-46260]
DataFrame.withColumnsRenamed
deve respeitar a ordem do ditado. - [FAÍSCA-46036] Removendo a classe de erro de raise_error função.
- [FAÍSCA-46294] Limpe a semântica do valor init vs zero.
- [FAÍSCA-46173] Pular corteTodas as chamadas durante a análise de data.
- [FAÍSCA-46250] Deflake test_parity_listener.
- [FAÍSCA-46587] XML: Corrija a conversão de inteiros grandes XSD.
- [FAÍSCA-46396] A inferência de carimbo de data/hora não deve lançar exceção.
- [FAÍSCA-46241] Corrija a rotina de tratamento de erros para que não caia em recursão infinita.
- [FAÍSCA-46355] XML: Feche InputStreamReader na conclusão da leitura.
- [FAÍSCA-46370] Corrija o bug ao consultar a partir da tabela depois de alterar os padrões da coluna.
- [FAÍSCA-46265] As asserções em AddArtifact RPC tornam o cliente de conexão incompatível com clusters mais antigos.
- [FAÍSCA-46308] Proibir o tratamento de erros recursivos.
-
[FAÍSCA-46337] Faça
CTESubstitution
reter oPLAN_ID_TAG
.
- O
- 14 de dezembro de 2023
- [FAÍSCA-46141] Altere o padrão de spark.sql.legacy.ctePrecedencePolicy para CORRIGIDO.
- [FAÍSCA-45730] Torne o ReloadingX509TrustManagerSuite menos descamativo.
- [FAÍSCA-45852] Lide graciosamente com o erro de recursão durante o registro.
- [FAÍSCA-45808] Melhor tratamento de erros para exceções SQL.
- [FAÍSCA-45920] grupo por ordinal deve ser idempotente.
- Reverter "[SPARK-45649] Unifique a estrutura de preparação para
OffsetWindowFunctionFrame
". - [FAÍSCA-45733] Ofereça suporte a várias políticas de repetição.
- [FAÍSCA-45509] Corrija o comportamento de referência da coluna df para o Spark Connect.
- [FAÍSCA-45655] Permita expressões não determinísticas dentro de AggregateFunctions em CollectMetrics.
- [FAÍSCA-45905] O tipo menos comum entre os tipos decimais deve manter os dígitos integrais primeiro.
- [FAÍSCA-45136] Melhore o ClosureCleaner com suporte de amonite.
- [FAÍSCA-46255] Suporte tipo complexo -> conversão de string.
- [FAÍSCA-45859] Torne os objetos UDF em ml.functions preguiçosos.
-
[FAÍSCA-46028] Fazer
Column.__getitem__
aceitar coluna de entrada. - [FAÍSCA-45798] Declare a ID da sessão do lado do servidor.
-
[FAÍSCA-45892] Validação do plano do otimizador de refatoração para desacoplar
validateSchemaOutput
evalidateExprIdUniqueness
. - [FAÍSCA-45844] Implemente a indiferenciação de maiúsculas e minúsculas para XML.
-
[FAÍSCA-45770] Introduza o plano
DataFrameDropColumns
paraDataframe.drop
. - [FAÍSCA-44790] XML: to_xml implementação e ligações para python, connect e SQL.
- [FAÍSCA-45851] Suporte a várias políticas no cliente scala.
- Atualizações de segurança do sistema operacional.
- 29 de novembro de 2023
- Instalado um novo pacote
pyarrow-hotfix
para corrigir uma vulnerabilidade do PyArrow RCE. - Corrigido um problema em que sublinhados escapados em
getColumns
operações originadas de clientes JDBC ou ODBC eram erroneamente interpretados como curingas. -
[FAÍSCA-45730] Restrições de tempo melhoradas para
ReloadingX509TrustManagerSuite
o . - [FAÍSCA-45852] O cliente Python para Spark Connect agora deteta erros de recursão durante a conversão de texto.
- [FAÍSCA-45808] Tratamento de erros melhorado para exceções SQL.
-
[FAÍSCA-45920]
GROUP BY
ordinal is não substitui o ordinal. - Reverter [SPARK-45649].
- [FAÍSCA-45733] Adicionado suporte para várias políticas de repetição.
-
[FAÍSCA-45509] Comportamento de referência de coluna fixo
df
para o Spark Connect. -
[FAÍSCA-45655] Permitir expressões não determinísticas dentro
AggregateFunctions
doCollectMetrics
. - [FAÍSCA-45905] O tipo menos comum entre os tipos decimais agora retém dígitos integrais primeiro.
-
[FAÍSCA-45136] Melhore
ClosureCleaner
com o suporte de amonite. -
[FAÍSCA-45859] Fez objetos UDF em
ml.functions
preguiçoso. -
[FAÍSCA-46028]
Column.__getitem__
aceita colunas de entrada. - [FAÍSCA-45798] Declare a ID da sessão do lado do servidor.
-
[FAÍSCA-45892] Validação do plano do otimizador de refatoração para desacoplar
validateSchemaOutput
evalidateExprIdUniqueness
. - [FAÍSCA-45844] Implemente a indiferenciação de maiúsculas e minúsculas para XML.
-
[FAÍSCA-45770] Resolução de coluna fixa com
DataFrameDropColumns
forDataframe.drop
. -
[FAÍSCA-44790] Adicionada
to_xml
implementação e ligações para Python, Spark Connect e SQL. - [FAÍSCA-45851] Adicionado suporte para várias políticas no cliente Scala.
- Atualizações de segurança do sistema operacional.
- Instalado um novo pacote
Tempo de execução do Databricks 14.0
Consulte Databricks Runtime 14.0 (EoS).
- 8 de fevereiro de 2024
- [FAÍSCA-46396] A inferência de carimbo de data/hora não deve lançar exceção.
- [FAÍSCA-46794] Remova subconsultas de restrições LogicalRDD.
- [FAÍSCA-45182] Ignore a conclusão da tarefa do estágio antigo depois de tentar novamente o estágio indeterminado pai, conforme determinado pela soma de verificação.
- [FAÍSCA-46933] Adicione a métrica de tempo de execução da consulta aos conectores que usam JDBCRDD.
- [FAÍSCA-45957] Evite gerar plano de execução para comandos não executáveis.
- [FAÍSCA-46861] Evite o impasse no DAGScheduler.
- [FAÍSCA-46930] Adicione suporte para um prefixo personalizado para campos de tipo União no Avro.
- [FAÍSCA-46941] Não é possível inserir o nó de limite do grupo de janelas para computação top-k se contiver SizeBasedWindowFunction.
- [FAÍSCA-45582] Certifique-se de que a instância de armazenamento não seja usada depois de chamar a confirmação na agregação de streaming no modo de saída.
- Atualizações de segurança do sistema operacional.
- 31 de janeiro de 2024
- [FAÍSCA-46541] Corrija a referência de coluna ambígua na associação automática.
- [FAÍSCA-46676] dropDuplicatesWithinWatermark não deve falhar na canonicalização do plano.
- [FAÍSCA-46769] Refine a inferência de esquema relacionada ao carimbo de data/hora.
- [FAÍSCA-45498] Acompanhamento: Ignore a conclusão de tarefas de tentativas de estágio antigas.
- Reverter [SPARK-46769] Refine a inferência de esquema relacionada ao carimbo de data/hora.
-
[FAÍSCA-46383] Reduza o uso de pilha de driver reduzindo a vida útil do
TaskInfo.accumulables()
. - [FAÍSCA-46633] Corrija o leitor Avro para lidar com blocos de comprimento zero.
-
[FAÍSCA-46677] Corrija
dataframe["*"]
a resolução. - [FAÍSCA-46684] Corrija CoGroup.applyInPandas/Arrow para passar argumentos corretamente.
- [FAÍSCA-46763] Corrija a falha de asserção em ReplaceDeduplicateWithAggregate para atributos duplicados.
- [FAÍSCA-46610] Criar tabela deve lançar exceção quando nenhum valor para uma chave em opções.
- Atualizações de segurança do sistema operacional.
- 17 de janeiro de 2024
- O
shuffle
nó do plano explicativo retornado por uma consulta Photon é atualizado para adicionar ocausedBroadcastJoinBuildOOM=true
sinalizador quando ocorre um erro de falta de memória durante um shuffle que faz parte de uma associação de transmissão. - Para evitar o aumento da latência ao se comunicar por TLSv1.3, esta versão de manutenção inclui um patch para a instalação do JDK 8 para corrigir o bug JDK-8293562 do JDK.
-
[FAÍSCA-46394] Corrija problemas spark.catalog.listDatabases() em esquemas com caracteres especiais quando
spark.sql.legacy.keepCommandOutputSchema
definido como true. - [FAÍSCA-46250] Deflake test_parity_listener.
- [FAÍSCA-45814] Faça ArrowConverters.createEmptyArrowBatch call close() para evitar vazamento de memória.
- [FAÍSCA-46173] Pular corteTodas as chamadas durante a análise de data.
-
[FAÍSCA-46484] Faça
resolveOperators
com que as funções auxiliares mantenham a ID do plano. - [FAÍSCA-46466] O leitor de parquet vetorizado nunca deve fazer rebase para ntz de carimbo de data/hora.
- [FAÍSCA-46056] Corrija o NPE de leitura vetorizado do Parquet com o valor padrão byteArrayDecimalType.
- [FAÍSCA-46058] Adicione sinalizador separado para privateKeyPassword.
- [FAÍSCA-46478] Reverta SPARK-43049 para usar oracle varchar(255) para string.
- [FAÍSCA-46132] Senha de chave de suporte para chaves JKS para RPC SSL.
- [FAÍSCA-46417] Não falhe ao chamar hive.getTable e throwException for false.
-
[FAÍSCA-46261]
DataFrame.withColumnsRenamed
deve manter a ordem do ditado/mapa. - [FAÍSCA-46370] Corrija o bug ao consultar a partir da tabela depois de alterar os padrões da coluna.
- [FAÍSCA-46609] Evite explosões exponenciais em PartitioningPreservingUnaryExecNode.
- [FAÍSCA-46600] Mova o código compartilhado entre SqlConf e SqlApiConf para SqlApiConfHelper.
-
[FAÍSCA-46538] Corrija o problema de referência de coluna ambígua no
ALSModel.transform
. -
[FAÍSCA-46337] Faça
CTESubstitution
reter oPLAN_ID_TAG
. -
[FAÍSCA-46602] Propagar
allowExisting
na criação de modo de exibição quando o modo de exibição/tabela não existir. -
[FAÍSCA-46260]
DataFrame.withColumnsRenamed
deve respeitar a ordem do ditado. - [FAÍSCA-46145] spark.catalog.listTables não lança exceção quando a tabela ou exibição não é encontrada.
- O
- 14 de dezembro de 2023
- Corrigido um problema em que sublinhados escapados em operações getColumns originadas de clientes JDBC ou ODBC eram manipulados incorretamente e interpretados como curingas.
- [FAÍSCA-46255] Suporte tipo complexo -> conversão de string.
-
[FAÍSCA-46028] Fazer
Column.__getitem__
aceitar coluna de entrada. - [FAÍSCA-45920] grupo por ordinal deve ser idempotente.
- [FAÍSCA-45433] Corrija a inferência do esquema CSV/JSON quando os carimbos de data/hora não corresponderem ao timestampFormat especificado.
- [FAÍSCA-45509] Corrija o comportamento de referência da coluna df para o Spark Connect.
- Atualizações de segurança do sistema operacional.
- 29 de novembro de 2023
- Instalado um novo pacote
pyarrow-hotfix
para corrigir uma vulnerabilidade do PyArrow RCE. - Corrigido um problema em que sublinhados escapados em
getColumns
operações originadas de clientes JDBC ou ODBC eram erroneamente interpretados como curingas. - Ao ingerir dados CSV usando o Auto Loader ou tabelas de streaming, arquivos CSV grandes agora são dividiveis e podem ser processados em paralelo durante a inferência de esquema e o processamento de dados.
- O conector faísca-floco de neve é atualizado para 2.12.0.
-
[FAÍSCA-45859] Fez objetos UDF em
ml.functions
preguiçoso. - Reverter [SPARK-45592].
-
[FAÍSCA-45892] Validação do plano do otimizador de refatoração para desacoplar
validateSchemaOutput
evalidateExprIdUniqueness
. -
[FAÍSCA-45592] Corrigido o problema de correção no AQE com
InMemoryTableScanExec
o . - [FAÍSCA-45620] APIs relacionadas ao Python UDF agora usam camelCase.
- [FAÍSCA-44784] Fez testes do SBT herméticos.
-
[FAÍSCA-45770] Resolução de coluna fixa com
DataFrameDropColumns
forDataframe.drop
. -
[FAÍSCA-45544] Suporte SSL integrado no
TransportContext
. -
[FAÍSCA-45730] Restrições de tempo melhoradas para
ReloadingX509TrustManagerSuite
o . - Atualizações de segurança do sistema operacional.
- Instalado um novo pacote
- 10 de novembro de 2023
- Consultas de feed de dados alteradas em tabelas de streaming do Catálogo Unity e exibições materializadas para exibir mensagens de erro.
-
[FAÍSCA-45545]
SparkTransportConf
herda após aSSLOptions
criação. -
[FAÍSCA-45584] Corrigida a falha de execução da subconsulta com
TakeOrderedAndProjectExec
o . -
[FAÍSCA-45427] Adicionadas configurações de SSL RPC para
SSLOptions
eSparkTransportConf
. -
[FAÍSCA-45541] Adicionado
SSLFactory
. -
[FAÍSCA-45430]
FramelessOffsetWindowFunction
já não falha quandoIGNORE NULLS
eoffset > rowCount
. - [FAÍSCA-45429] Adicionadas classes auxiliares para comunicação RPC SSL.
- [FAÍSCA-44219] Adicionadas validações extras por regra para regravações de otimização.
-
[FAÍSCA-45543] Corrigido um problema em que
InferWindowGroupLimit
se gerava um erro se as outras funções da janela não tivessem a mesma moldura de janela que as funções de classificação. - Atualizações de segurança do sistema operacional.
- 23 de outubro de 2023
-
[FAÍSCA-45426] Adicionado suporte para
ReloadingX509TrustManager
. -
[FAÍSCA-45396] Adicionada entrada doc para
PySpark.ml.connect
módulo e adicionadaEvaluator
a__all__
emml.connect
. -
[FAÍSCA-45256] Corrigido um problema em que
DurationWriter
falhava ao escrever mais valores do que a capacidade inicial. -
[FAÍSCA-45279] Anexado
plan_id
a todos os planos lógicos. - [FAÍSCA-45250] Adicionado suporte para perfil de recurso de tarefa em nível de estágio para clusters de fios quando a alocação dinâmica está desativada.
- [FAÍSCA-45182] Adicionado suporte para reverter o estágio do mapa aleatório para que todas as tarefas do estágio possam ser repetidas quando a saída do palco for indeterminada.
-
[FAÍSCA-45419] Evite reutilizar
rocksdb sst
arquivos em uma instância diferenterocksdb
removendo entradas de mapa de versão de arquivo de versões maiores. -
[FAÍSCA-45386] Corrigido um problema em que
StorageLevel.NONE
retornava incorretamente 0. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45426] Adicionado suporte para
- 13 de outubro de 2023
- Dependência de flocos de neve-jdbc atualizada de 3.13.29 para 3.13.33.
- A
array_insert
função é baseada em 1 para índices positivos e negativos, enquanto antes, era baseada em 0 para índices negativos. Ele agora insere um novo elemento no final das matrizes de entrada para o índice -1. Para restaurar o comportamento anterior, definaspark.sql.legacy.negativeIndexInArrayInsert
comotrue
. - O Azure Databricks não ignora mais arquivos corrompidos quando uma inferência de esquema CSV com o Auto Loader habilita
ignoreCorruptFiles
o . -
[FAÍSCA-45227] Corrigido um problema sutil de segurança de threads com
CoarseGrainedExecutorBackend
o . -
[FAÍSCA-44658]
ShuffleStatus.getMapStatus
deve retornarNone
em vez deSome(null)
. -
[FAÍSCA-44910]
Encoders.bean
não suporta superclasses com argumentos de tipo genéricos. - [FAÍSCA-45346] A inferência do esquema Parquet respeita sinalizadores que diferenciam maiúsculas de minúsculas ao mesclar o esquema.
- Reverter [SPARK-42946].
- [FAÍSCA-42205] Atualizado o protocolo JSON para remover o registro de acumulaveis em uma tarefa ou eventos de início de estágio.
-
[FAÍSCA-45360] O construtor de sessões do Spark suporta a inicialização a partir do
SPARK_REMOTE
. -
[FAÍSCA-45316] Adicione novos parâmetros
ignoreCorruptFiles
/ignoreMissingFiles
aHadoopRDD
eNewHadoopRDD
. - [FAÍSCA-44909] Ignore a execução do servidor de streaming de log do distribuidor da tocha quando ele não estiver disponível.
-
[FAÍSCA-45084]
StateOperatorProgress
agora usa um número de partição aleatório preciso. - [FAÍSCA-45371] Corrigidos problemas de sombreamento no Spark Connect Scala Client.
-
[FAÍSCA-45178] Fallback para executar um único lote para
Trigger.AvailableNow
com fontes não suportadas em vez de usar o wrapper. -
[FAÍSCA-44840] Faça
array_insert()
1 base para índices negativos. - [FAÍSCA-44551] Comentários editados para sincronizar com o OSS.
-
[FAÍSCA-45078] A
ArrayInsert
função agora torna a transmissão explícita quando o tipo de elemento não é igual ao tipo de componente derivado. - [FAÍSCA-45339] O PySpark agora registra erros de repetição.
-
[FAÍSCA-45057] Evite adquirir bloqueio de leitura quando
keepReadLock
for falso. -
[FAÍSCA-44908] Corrigida a funcionalidade de param do validador
foldCol
cruzado. - Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 13.1
Consulte Databricks Runtime 13.1 (EoS).
- 29 de novembro de 2023
- Corrigido um problema em que sublinhados escapados em
getColumns
operações originadas de clientes JDBC ou ODBC eram erroneamente interpretados como curingas. -
[FAÍSCA-44846] Removidas expressões de agrupamento complexo após
RemoveRedundantAggregates
. - [FAÍSCA-43802] Corrigido um problema em que o codegen para expressões unhex e unbase64 falhava.
-
[FAÍSCA-43718] Corrigida a anulabilidade para chaves em
USING
junções. - Atualizações de segurança do sistema operacional.
- Corrigido um problema em que sublinhados escapados em
- 14 de novembro de 2023
- Os filtros de partição nas consultas de streaming Delta Lake são empurrados para baixo antes do limite de taxa para obter uma melhor utilização.
- Consultas de feed de dados alteradas em tabelas do Unity Catalog Streaming e exibições materializadas para exibir mensagens de erro.
-
[FAÍSCA-45584] Corrigida a falha de execução da subconsulta com
TakeOrderedAndProjectExec
o . -
[FAÍSCA-45430]
FramelessOffsetWindowFunction
já não falha quandoIGNORE NULLS
eoffset > rowCount
. -
[FAÍSCA-45543] Corrigido um problema que
InferWindowGroupLimit
causava um problema se as outras funções da janela não tivessem a mesma moldura da janela que as funções de classificação. - Atualizações de segurança do sistema operacional.
- 24 de outubro de 2023
-
[FAÍSCA-43799] Adicionada opção binária do descritor à API do PySpark
Protobuf
. - Reverter [SPARK-42946].
- [FAÍSCA-45346] A inferência do esquema Parquet agora respeita o sinalizador que diferencia maiúsculas de minúsculas ao mesclar um esquema.
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-43799] Adicionada opção binária do descritor à API do PySpark
- 13 de outubro de 2023
- Dependência de flocos de neve-jdbc atualizada de 3.13.29 para 3.13.33.
- Não ignora mais arquivos corrompidos quando
ignoreCorruptFiles
é ativado durante a inferência de esquema CSV com o Auto Loader. -
[FAÍSCA-44658]
ShuffleStatus.getMapStatus
retornaNone
em vez deSome(null)
. -
[FAÍSCA-45178] Fallback para executar um único lote para
Trigger.AvailableNow
com fontes não suportadas em vez de usar o wrapper. - [FAÍSCA-42205] Atualizado o protocolo JSON para remover o registro de acumulaveis em uma tarefa ou eventos de início de estágio.
- Atualizações de segurança do sistema operacional.
- 12 de setembro de 2023
-
[FAÍSCA-44718] Corresponder
ColumnVector
o padrão de configuração do modo de memória aoOffHeapMemoryMode
valor de configuração. -
SPARK-44878 Desativado o limite estrito para
RocksDB
o gerenciador de gravação para evitar a exceção de inserção no cache concluído. - Correções diversas.
-
[FAÍSCA-44718] Corresponder
- 30 de agosto de 2023
- [FAÍSCA-44871] Corrigido 'percentile_disc comportamento.
- [FAÍSCA-44714] Facilite a restrição da resolução de LCA em relação a consultas.
-
[FAÍSCA-44245]
PySpark.sql.dataframe sample()
Os testes DOC são agora apenas ilustrativos. -
[FAÍSCA-44818] Corrida fixa para interrupção de tarefa pendente emitida antes
taskThread
de ser inicializada. - Atualizações de segurança do sistema operacional.
- 15 de agosto de 2023
-
[FAÍSCA-44485] Otimizado
TreeNode.generateTreeString
. -
[FAÍSCA-44643] Corrigido
Row.__repr__
quando a linha está vazia. - [FAÍSCA-44504] A tarefa de manutenção agora limpa os provedores carregados em caso de erro de parada.
-
[FAÍSCA-44479] Conversão fixa
protobuf
de um tipo struct vazio. -
[FAÍSCA-44464] Corrigido
applyInPandasWithStatePythonRunner
para linhas de saída que têmNull
como o valor da primeira coluna. - Correções diversas.
-
[FAÍSCA-44485] Otimizado
- 27 de julho de 2023
- Corrigido um problema que
dbutils.fs.ls()
era retornadoINVALID_PARAMETER_VALUE.LOCATION_OVERLAP
quando chamado para um caminho de local de armazenamento que colidia com outro local de armazenamento externo ou gerenciado. -
[FAÍSCA-44199]
CacheManager
já não refresca ofileIndex
desnecessariamente. -
[FAÍSCA-44448] Corrigido bug de resultados errados de
DenseRankLimitIterator
eInferWindowGroupLimit
. - Atualizações de segurança do sistema operacional.
- Corrigido um problema que
- 24 de julho de 2023
- Reverter [SPARK-42323].
-
[FAÍSCA-41848] Corrigido o problema de excesso de agendamento de tarefas com
TaskResourceProfile
o . -
[FAÍSCA-44136] Corrigido um problema em que
StateManager
seria materializado em um executor em vez do driver emFlatMapGroupsWithStateExec
. -
[FAÍSCA-44337] Corrigido um problema em que qualquer campo definido como
Any.getDefaultInstance
causava erros de análise. - Atualizações de segurança do sistema operacional.
- 27 de junho de 2023
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2023
- Fotonizado
approx_count_distinct
. - O analisador JSON no
failOnUnknownFields
modo agora descarta o registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
- O
PubSubRecord
campo de atributos é armazenado como JSON em vez da cadeia de caracteres de um mapa Scala para serialização e desserialização mais diretas. - O
EXPLAIN EXTENDED
comando agora retorna a elegibilidade do cache de resultados da consulta. - Melhore o desempenho de atualizações incrementais com
SHALLOW CLONE
o Iceberg e o Parquet. - [FAÍSCA-43032] Correção de bugs do Python SQM.
- [FAÍSCA-43404]Ignore a reutilização do arquivo sst para a mesma versão do armazenamento de estado RocksDB para evitar o erro de incompatibilidade de ID.
- [FAÍSCA-43340] Manipule o campo de rastreamento de pilha ausente em logs de eventos.
-
[FAÍSCA-43527] Corrigido
catalog.listCatalogs
no PySpark. -
[FAÍSCA-43541] Propagar todas as
Project
tags na resolução de expressões e colunas ausentes. -
[FAÍSCA-43300]
NonFateSharingCache
wrapper para Guava Cache. -
[FAÍSCA-43378] Feche corretamente os objetos de fluxo no
deserializeFromChunkedBuffer
. -
[FAÍSCA-42852] Reverter
NamedLambdaVariable
alterações relacionadas deEquivalentExpressions
. -
[FAÍSCA-43779]
ParseToDate
agora carregaEvalMode
no thread principal. -
[FAÍSCA-43413] Corrija a
IN
anulabilidade da subconsultaListQuery
. -
[FAÍSCA-43889] Adicione a verificação do nome da coluna para
__dir__()
filtrar nomes de coluna propensos a erros. -
[FAÍSCA-43043] Melhorou o desempenho de
MapOutputTracker
.updateMapOutput - [FAÍSCA-43522] Corrigido criando nome de coluna struct com índice de matriz.
- [FAÍSCA-43457] Augument user agent com versões OS, Python e Spark.
-
[FAÍSCA-43286] Modo CBC atualizado
aes_encrypt
para gerar IVs aleatórios. -
[FAÍSCA-42851] Guarda
EquivalentExpressions.addExpr()
comsupportedExpression()
. - Reverter [SPARK-43183].
- Atualizações de segurança do sistema operacional.
- Fotonizado
Tempo de execução do Databricks 12.2 LTS
Consulte Databricks Runtime 12.2 LTS.
- 29 de novembro de 2023
- Corrigido um problema em que sublinhados escapados em
getColumns
operações originadas de clientes JDBC ou ODBC eram erroneamente interpretados como curingas. -
[FAÍSCA-42205] Removidos os acumuláveis de registro e
Stage
Task
iniciar eventos. -
[FAÍSCA-44846] Removidas expressões de agrupamento complexo após
RemoveRedundantAggregates
. -
[FAÍSCA-43718] Corrigida a anulabilidade para chaves em
USING
junções. -
[FAÍSCA-45544] Suporte SSL integrado no
TransportContext
. - [FAÍSCA-43973] A interface do usuário de streaming estruturada agora exibe consultas com falha corretamente.
-
[FAÍSCA-45730] Restrições de tempo melhoradas para
ReloadingX509TrustManagerSuite
o . -
[FAÍSCA-45859] Fez objetos UDF em
ml.functions
preguiçoso. - Atualizações de segurança do sistema operacional.
- Corrigido um problema em que sublinhados escapados em
- 14 de novembro de 2023
- Os filtros de partição nas consultas de streaming Delta Lake são empurrados para baixo antes do limite de taxa para obter uma melhor utilização.
-
[FAÍSCA-45545]
SparkTransportConf
herda após aSSLOptions
criação. -
[FAÍSCA-45427] Adicionadas configurações de SSL RPC para
SSLOptions
eSparkTransportConf
. -
[FAÍSCA-45584] Corrigida a falha de execução da subconsulta com
TakeOrderedAndProjectExec
o . -
[FAÍSCA-45541] Adicionado
SSLFactory
. -
[FAÍSCA-45430]
FramelessOffsetWindowFunction
já não falha quandoIGNORE NULLS
eoffset > rowCount
. - [FAÍSCA-45429] Adicionadas classes auxiliares para comunicação RPC SSL.
- Atualizações de segurança do sistema operacional.
- 24 de outubro de 2023
-
[FAÍSCA-45426] Adicionado suporte para
ReloadingX509TrustManager
. - Correções diversas.
-
[FAÍSCA-45426] Adicionado suporte para
- 13 de outubro de 2023
- Dependência de flocos de neve-jdbc atualizada de 3.13.29 para 3.13.33.
- [FAÍSCA-42553] Certifique-se de pelo menos uma unidade de tempo após o intervalo.
- [FAÍSCA-45346] A inferência do esquema Parquet respeita o sinalizador sensível a maiúsculas e minúsculas ao mesclar o esquema.
-
[FAÍSCA-45178] Fallback para executar um único lote para
Trigger.AvailableNow
com fontes não suportadas em vez de usar o wrapper. -
[FAÍSCA-45084]
StateOperatorProgress
para usar um número de partição aleatório preciso e adequado.
- 12 de setembro de 2023
-
[FAÍSCA-44873] Adicionado suporte para
alter view
colunas aninhadas no cliente Hive. -
[FAÍSCA-44718] Corresponder
ColumnVector
o padrão de configuração do modo de memória aoOffHeapMemoryMode
valor de configuração. -
[FAÍSCA-43799] Adicionada opção binária do descritor à API do PySpark
Protobuf
. - Correções diversas.
-
[FAÍSCA-44873] Adicionado suporte para
- 30 de agosto de 2023
-
[FAÍSCA-44485] Otimizado
TreeNode.generateTreeString
. -
[FAÍSCA-44818] Corrida fixa para interrupção de tarefa pendente emitida antes
taskThread
de ser inicializada. -
[FAÍSCA-44871][11.3-13.0] Comportamento fixo
percentile_disc
. - [FAÍSCA-44714] Flexibilização da restrição da resolução de ACV em relação a consultas.
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-44485] Otimizado
- 15 de agosto de 2023
- [FAÍSCA-44504] A tarefa de manutenção limpa os fornecedores carregados em caso de erro de paragem.
-
[FAÍSCA-44464] Corrigido
applyInPandasWithStatePythonRunner
para linhas de saída que têmNull
como o valor da primeira coluna. - Atualizações de segurança do sistema operacional.
- 29 de julho de 2023
- Corrigido um problema que
dbutils.fs.ls()
era retornadoINVALID_PARAMETER_VALUE.LOCATION_OVERLAP
quando chamado para um caminho de local de armazenamento que colidia com outro local de armazenamento externo ou gerenciado. -
[FAÍSCA-44199]
CacheManager
já não refresca ofileIndex
desnecessariamente. - Atualizações de segurança do sistema operacional.
- Corrigido um problema que
- 24 de julho de 2023
-
[FAÍSCA-44337] Corrigido um problema em que qualquer campo definido como
Any.getDefaultInstance
causava erros de análise. -
[FAÍSCA-44136] Corrigido um problema em que
StateManager
seria materializado em um executor em vez do driver emFlatMapGroupsWithStateExec
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-44337] Corrigido um problema em que qualquer campo definido como
- 23 de junho de 2023
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2023
- Fotonizado
approx_count_distinct
. - A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
-
[FAÍSCA-43779]
ParseToDate
agora carregaEvalMode
no thread principal. -
[FAÍSCA-43156][FAÍSCA-43098] Teste de erro de contagem de subconsulta escalar estendida com
decorrelateInnerQuery
desativado. - Atualizações de segurança do sistema operacional.
- Fotonizado
- 2 de junho de 2023
- O analisador JSON no
failOnUnknownFields
modo descarta um registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - Melhore o desempenho de atualizações incrementais com
SHALLOW CLONE
o Iceberg e o Parquet. - Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
- [FAÍSCA-43404] Ignore a reutilização do arquivo sst para a mesma versão do armazenamento de estado RocksDB para evitar o erro de incompatibilidade de ID.
-
[FAÍSCA-43413][11.3-13.0] Corrigida
IN
a anulabilidade da subconsultaListQuery
. - [FAÍSCA-43522] Corrigido criando nome de coluna struct com índice de matriz.
-
[FAÍSCA-43541] Propagar todas as
Project
tags na resolução de expressões e colunas ausentes. -
[FAÍSCA-43527] Corrigido
catalog.listCatalogs
no PySpark. - [FAÍSCA-43123] Os metadados de campo interno não vazam mais para catálogos.
- [FAÍSCA-43340] Corrigido o campo de rastreamento de pilha ausente nos logs de eventos.
-
[FAÍSCA-42444]
DataFrame.drop
agora lida com colunas duplicadas corretamente. -
[FAÍSCA-42937]
PlanSubqueries
agora defineInSubqueryExec#shouldBroadcast
como true. -
[FAÍSCA-43286] Modo CBC atualizado
aes_encrypt
para gerar IVs aleatórios. -
[FAÍSCA-43378] Feche corretamente os objetos de fluxo no
deserializeFromChunkedBuffer
.
- O analisador JSON no
- 17 de maio de 2023
- As varreduras de parquet agora são robustas contra OOMs ao examinar arquivos excepcionalmente estruturados, ajustando dinamicamente o tamanho do lote. Os metadados do arquivo são analisados para reduzir preventivamente o tamanho do lote e são reduzidos novamente em novas tentativas de tarefas como uma rede de segurança final.
- Se um arquivo Avro fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que têm tipos de dados diferentes seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - Auto Loader agora faz o seguinte.
-
- Lê corretamente e não resgata mais ,
Integer
eShort
digitaByte
se um desses tipos de dados for fornecido, mas o arquivo Avro sugere um dos outros dois tipos.
- Lê corretamente e não resgata mais ,
-
- Impede a leitura de tipos de intervalo como tipos de carimbo de data ou hora para evitar datas corrompidas.
-
- Evita a leitura
Decimal
de tipos com menor precisão.
- Evita a leitura
- [FAÍSCA-43172] Expõe host e token do cliente Spark connect.
-
[FAÍSCA-43293]
__qualified_access_only
é ignorado em colunas normais. -
[FAÍSCA-43098] Corrigido o erro de correção
COUNT
quando a subconsulta escalar é agrupada por cláusula. -
[FAÍSCA-43085] Suporte para atribuição de colunas
DEFAULT
para nomes de tabelas com várias partes. -
[FAÍSCA-43190]
ListQuery.childOutput
é agora consistente com a produção secundária. - [FAÍSCA-43192] Removida a validação do conjunto de caracteres do agente do usuário.
- Atualizações de segurança do sistema operacional.
- 25 de abril de 2023
- Se um arquivo Parquet fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que tivessem diferentes tipos de dados seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - O Auto Loader agora lê corretamente e não resgata mais ,
Integer
eShort
digitaByte
se um desses tipos de dados for fornecido. O arquivo Parquet sugere um dos outros dois tipos. Quando a coluna de dados resgatada estava habilitada anteriormente, a incompatibilidade de tipo de dados fazia com que as colunas fossem salvas mesmo que fossem legíveis. -
[FAÍSCA-43009] Parametrizado
sql()
comAny
constantes - [FAÍSCA-42406] Encerrar campos recursivos do Protobuf soltando o campo
-
[FAÍSCA-43038] Apoie o modo CBC por
aes_encrypt()
/aes_decrypt()
-
[FAÍSCA-42971] Alterar para imprimir
workdir
seappDirs
for nulo quando o trabalhador manipularWorkDirCleanup
evento - [FAÍSCA-43018] Corrigir bug para comandos INSERT com literais de carimbo de data/hora
- Atualizações de segurança do sistema operacional.
- Se um arquivo Parquet fosse lido apenas com a
- 11 de abril de 2023
- Ofereça suporte a formatos de fonte de dados herdados no
SYNC
comando. - Corrige um problema no comportamento %autoreload em blocos de anotações fora de um repositório.
- Corrigido um problema em que a evolução do esquema do Auto Loader podia entrar em um loop de falha infinito quando uma nova coluna é detetada no esquema de um objeto JSON aninhado.
-
[FAÍSCA-42928] Faz
resolvePersistentFunction
sincronizado. - [FAÍSCA-42936] Corrige o problema de LCan quando a cláusula pode ser resolvida diretamente por sua agregação filha.
-
[FAÍSCA-42967] Corrige
SparkListenerTaskStart.stageAttemptId
quando uma tarefa é iniciada após o cancelamento do estágio. - Atualizações de segurança do sistema operacional.
- Ofereça suporte a formatos de fonte de dados herdados no
- 29 de março de 2023
O Databricks SQL agora oferece suporte à especificação de valores padrão para colunas de tabelas Delta Lake, no momento da criação da tabela ou depois. Os comandos subsequentes
INSERT
,UPDATE
,DELETE
eMERGE
podem referir-se ao valor padrão de qualquer coluna usando a palavra-chave explícitaDEFAULT
. Além disso, se qualquerINSERT
atribuição tiver uma lista explícita de menos colunas do que a tabela de destino, os valores padrão da coluna correspondente serão substituídos pelas colunas restantes (ou NULL se nenhum padrão for especificado).Por exemplo:
CREATE TABLE t (first INT, second DATE DEFAULT CURRENT_DATE()); INSERT INTO t VALUES (0, DEFAULT); INSERT INTO t VALUES (1, DEFAULT); SELECT first, second FROM t; \> 0, 2023-03-28 1, 2023-03-28z
O Auto Loader agora inicia pelo menos uma limpeza de log síncrona do RocksDB para
Trigger.AvailableNow
fluxos para verificar se o ponto de verificação pode ser limpo regularmente para fluxos do Auto Loader de execução rápida. Isso pode fazer com que alguns fluxos demorem mais tempo antes de serem desligados, mas economizará custos de armazenamento e melhorará a experiência do Auto Loader em execuções futuras.Agora você pode modificar uma tabela Delta para adicionar suporte aos recursos da tabela usando
DeltaTable.addFeatureSupport(feature_name)
o .[FAÍSCA-42794] Aumente o lockAcquireTimeoutMs para 2 minutos para adquirir o armazenamento de estado RocksDB no Structure Streaming
[FAÍSCA-42521] Adicionar NULLs para INSERTs com listas especificadas pelo usuário de menos colunas do que a tabela de destino
[FAÍSCA-42702][FAÍSCA-42623] Suporte a consulta parametrizada em subconsulta e CTE
[FAÍSCA-42668] Exceção de captura ao tentar fechar o fluxo compactado em HDFSStateStoreProvider stop
[FAÍSCA-42403] JsonProtocol deve manipular cadeias de caracteres JSON nulas
- 8 de março de 2023
- A mensagem de erro "Falha ao inicializar a configuração" foi melhorada para fornecer mais contexto para o cliente.
- Há uma alteração de terminologia para adicionar recursos a uma tabela Delta usando a propriedade table. A sintaxe preferida é agora
'delta.feature.featureName'='supported'
em vez de'delta.feature.featureName'='enabled'
. Para compatibilidade com versões anteriores, o uso'delta.feature.featureName'='enabled'
ainda funciona e continuará a funcionar. - A partir desta versão, é possível criar/substituir uma tabela por uma propriedade
delta.ignoreProtocolDefaults
de tabela adicional para ignorar as configurações do Spark relacionadas ao protocolo, que incluem versões padrão de leitor e gravador e recursos de tabela suportados por padrão. - [FAÍSCA-42070] Altere o valor padrão do argumento da função Mask de -1 para NULL
- [FAÍSCA-41793] Resultado incorreto para quadros de janela definidos por uma cláusula de intervalo em decimais significativos
- [FAÍSCA-42484] UnsafeRowUtils melhor mensagem de erro
- [FAÍSCA-42516] Sempre capture a configuração de fuso horário da sessão ao criar exibições
- [FAÍSCA-42635] Corrija a expressão TimestampAdd.
- [FAÍSCA-42622] Substituição desativada em valores
- [FAÍSCA-42534] Corrigir cláusula DB2Dialect Limit
- [FAÍSCA-42121] Adicione funções internas com valor de tabela posexplode, posexplode_outer, json_tuple e stack
- [FAÍSCA-42045] Modo ANSI SQL: Round/Bround deve retornar um erro em estouro inteiro minúsculo/pequeno/significativo
- Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 11.3 LTS
Consulte Databricks Runtime 11.3 LTS.
- 29 de novembro de 2023
- Corrigido um problema em que sublinhados escapados em
getColumns
operações originadas de clientes JDBC ou ODBC eram erroneamente interpretados como curingas. - [FAÍSCA-43973] A interface do usuário de streaming estruturada agora exibe consultas com falha corretamente.
-
[FAÍSCA-45730] Restrições de tempo melhoradas para
ReloadingX509TrustManagerSuite
o . -
[FAÍSCA-45544] Suporte SSL integrado no
TransportContext
. -
[FAÍSCA-45859] Fez objetos UDF em
ml.functions
preguiçoso. -
[FAÍSCA-43718] Corrigida a anulabilidade para chaves em
USING
junções. -
[FAÍSCA-44846] Removidas expressões de agrupamento complexo após
RemoveRedundantAggregates
. - Atualizações de segurança do sistema operacional.
- Corrigido um problema em que sublinhados escapados em
- 14 de novembro de 2023
- Os filtros de partição nas consultas de streaming Delta Lake são empurrados para baixo antes do limite de taxa para obter uma melhor utilização.
- [FAÍSCA-42205] Removidos os acumuláveis de log nos eventos de início de Estágio e Tarefa.
-
[FAÍSCA-45545]
SparkTransportConf
herda após aSSLOptions
criação. - Reverter [SPARK-33861].
-
[FAÍSCA-45541] Adicionado
SSLFactory
. - [FAÍSCA-45429] Adicionadas classes auxiliares para comunicação RPC SSL.
-
[FAÍSCA-45584] Corrigida a falha de execução da subconsulta com
TakeOrderedAndProjectExec
o . -
[FAÍSCA-45430]
FramelessOffsetWindowFunction
já não falha quandoIGNORE NULLS
eoffset > rowCount
. -
[FAÍSCA-45427] Adicionadas configurações de SSL RPC para
SSLOptions
eSparkTransportConf
. - Atualizações de segurança do sistema operacional.
- 24 de outubro de 2023
-
[FAÍSCA-45426] Adicionado suporte para
ReloadingX509TrustManager
. - Correções diversas.
-
[FAÍSCA-45426] Adicionado suporte para
- 13 de outubro de 2023
- Dependência de flocos de neve-jdbc atualizada de 3.13.29 para 3.13.33.
-
[FAÍSCA-45178] Fallback para executar um único lote para
Trigger.AvailableNow
com fontes não suportadas em vez de usar o wrapper. -
[FAÍSCA-45084]
StateOperatorProgress
para usar um número de partição aleatório preciso e adequado. - [FAÍSCA-45346] A inferência do esquema Parquet agora respeita o sinalizador que diferencia maiúsculas de minúsculas ao mesclar um esquema.
- Atualizações de segurança do sistema operacional.
- 10 de setembro de 2023
- Correções diversas.
- 30 de agosto de 2023
-
[FAÍSCA-44818] Corrida fixa para interrupção de tarefa pendente emitida antes
taskThread
de ser inicializada. -
[FAÍSCA-44871][11.3-13.0] Comportamento fixo
percentile_disc
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-44818] Corrida fixa para interrupção de tarefa pendente emitida antes
- 15 de agosto de 2023
-
[FAÍSCA-44485] Otimizado
TreeNode.generateTreeString
. - [FAÍSCA-44504] A tarefa de manutenção limpa os fornecedores carregados em caso de erro de paragem.
-
[FAÍSCA-44464] Corrigido
applyInPandasWithStatePythonRunner
para linhas de saída que têmNull
como o valor da primeira coluna. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-44485] Otimizado
- 27 de julho de 2023
- Corrigido um problema que
dbutils.fs.ls()
era retornadoINVALID_PARAMETER_VALUE.LOCATION_OVERLAP
quando chamado para um caminho de local de armazenamento que colidia com outro local de armazenamento externo ou gerenciado. -
[FAÍSCA-44199]
CacheManager
já não refresca ofileIndex
desnecessariamente. - Atualizações de segurança do sistema operacional.
- Corrigido um problema que
- 24 de julho de 2023
- [FAÍSCA-44136] Corrigido um problema que o StateManager pode obter materializado no executor em vez do driver em FlatMapGroupsWithStateExec.
- Atualizações de segurança do sistema operacional.
- 23 de junho de 2023
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2023
- Fotonizado
approx_count_distinct
. - A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
-
[FAÍSCA-43779]
ParseToDate
agora carregaEvalMode
no thread principal. - [FAÍSCA-40862] Suporte a subconsultas não agregadas em RewriteCorrelatedScalarSubquery
-
[FAÍSCA-43156][FAÍSCA-43098] Teste de bug de contagem de subconsulta escalar estendida com
decorrelateInnerQuery
desativado. - [FAÍSCA-43098] Corrigir o bug COUNT de correção quando a subconsulta escalar tem um grupo por cláusula
- Atualizações de segurança do sistema operacional.
- Fotonizado
- 2 de junho de 2023
- O analisador JSON no
failOnUnknownFields
modo descarta um registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - Melhore o desempenho de atualizações incrementais com
SHALLOW CLONE
o Iceberg e o Parquet. - Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
- [FAÍSCA-43404]Ignore a reutilização do arquivo sst para a mesma versão do armazenamento de estado RocksDB para evitar o erro de incompatibilidade de ID.
-
[FAÍSCA-43527] Corrigido
catalog.listCatalogs
no PySpark. -
[FAÍSCA-43413][11.3-13.0] Corrigida
IN
a anulabilidade da subconsultaListQuery
. - [FAÍSCA-43340] Corrigido o campo de rastreamento de pilha ausente nos logs de eventos.
- O analisador JSON no
Tempo de execução do Databricks 10.4 LTS
Consulte Databricks Runtime 10.4 LTS.
- 29 de novembro de 2023
-
[FAÍSCA-45544] Suporte SSL integrado no
TransportContext
. -
[FAÍSCA-45859] Fez objetos UDF em
ml.functions
preguiçoso. -
[FAÍSCA-43718] Corrigida a anulabilidade para chaves em
USING
junções. -
[FAÍSCA-45730] Restrições de tempo melhoradas para
ReloadingX509TrustManagerSuite
o . - [FAÍSCA-42205] Removidos os acumuláveis de log nos eventos de início de Estágio e Tarefa.
-
[FAÍSCA-44846] Removidas expressões de agrupamento complexo após
RemoveRedundantAggregates
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45544] Suporte SSL integrado no
- 14 de novembro de 2023
-
[FAÍSCA-45541] Adicionado
SSLFactory
. -
[FAÍSCA-45545]
SparkTransportConf
herda após aSSLOptions
criação. -
[FAÍSCA-45427] Adicionadas configurações de SSL RPC para
SSLOptions
eSparkTransportConf
. - [FAÍSCA-45429] Adicionadas classes auxiliares para comunicação RPC SSL.
-
[FAÍSCA-45584] Corrigida a falha de execução da subconsulta com
TakeOrderedAndProjectExec
o . - Reverter [SPARK-33861].
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45541] Adicionado
- 24 de outubro de 2023
-
[FAÍSCA-45426] Adicionado suporte para
ReloadingX509TrustManager
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45426] Adicionado suporte para
- 13 de outubro de 2023
-
[FAÍSCA-45084]
StateOperatorProgress
para usar um número de partição aleatório preciso e adequado. -
[FAÍSCA-45178] Fallback para executar um único lote para
Trigger.AvailableNow
com fontes não suportadas em vez de usar o wrapper. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45084]
- 10 de setembro de 2023
- Correções diversas.
- 30 de agosto de 2023
-
[FAÍSCA-44818] Corrida fixa para interrupção de tarefa pendente emitida antes
taskThread
de ser inicializada. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-44818] Corrida fixa para interrupção de tarefa pendente emitida antes
- 15 de agosto de 2023
- [FAÍSCA-44504] A tarefa de manutenção limpa os fornecedores carregados em caso de erro de paragem.
- [FAÍSCA-43973] A interface do usuário de streaming estruturada agora aparece com falhas nas consultas corretamente.
- Atualizações de segurança do sistema operacional.
- 23 de junho de 2023
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2023
- A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
- [FAÍSCA-43098] Corrigir o bug COUNT de correção quando a subconsulta escalar tem um grupo por cláusula
- [FAÍSCA-40862] Suporte a subconsultas não agregadas em RewriteCorrelatedScalarSubquery
-
[FAÍSCA-43156][FAÍSCA-43098] Teste de contagem de subconsulta escalar estendida com
decorrelateInnerQuery
desativado. - Atualizações de segurança do sistema operacional.
- 2 de junho de 2023
- O analisador JSON no
failOnUnknownFields
modo descarta um registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - Corrigido um problema na análise de dados resgatados pelo JSON para evitar
UnknownFieldException
o . - Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
- [FAÍSCA-43404] Ignore a reutilização do arquivo sst para a mesma versão do armazenamento de estado RocksDB para evitar o erro de incompatibilidade de ID.
-
[FAÍSCA-43413] Corrigida
IN
a anulabilidade da subconsultaListQuery
. - Atualizações de segurança do sistema operacional.
- O analisador JSON no
- 17 de maio de 2023
- As varreduras de parquet agora são robustas contra OOMs ao examinar arquivos excepcionalmente estruturados, ajustando dinamicamente o tamanho do lote. Os metadados do arquivo são analisados para reduzir preventivamente o tamanho do lote e são reduzidos novamente em novas tentativas de tarefas como uma rede de segurança final.
-
[FAÍSCA-41520] Dividir
AND_OR
padrão de árvore para separarAND
eOR
. -
[FAÍSCA-43190]
ListQuery.childOutput
é agora consistente com a produção secundária. - Atualizações de segurança do sistema operacional.
- 25 de abril de 2023
-
[FAÍSCA-42928] Faça
resolvePersistentFunction
sincronizado. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-42928] Faça
- 11 de abril de 2023
- Corrigido um problema em que a evolução do esquema do Auto Loader podia entrar em um loop de falha infinito quando uma nova coluna é detetada no esquema de um objeto JSON aninhado.
-
[FAÍSCA-42937]
PlanSubqueries
agora defineInSubqueryExec#shouldBroadcast
como true. - [FAÍSCA-42967] Corrija SparkListenerTaskStart.stageAttemptId quando uma tarefa é iniciada depois que o estágio é cancelado.
- 29 de março de 2023
- [FAÍSCA-42668] Exceção de captura ao tentar fechar o fluxo compactado em HDFSStateStoreProvider stop
- [FAÍSCA-42635] Corrigir o ...
- Atualizações de segurança do sistema operacional.
- 14 de março de 2023
- [FAÍSCA-41162] Corrigir anti e semi-join para auto-junção com agregações
- [FAÍSCA-33206] Corrigir cálculo de peso de cache de índice aleatório para arquivos de índice pequenos
-
[FAÍSCA-42484] Melhorada a mensagem de
UnsafeRowUtils
erro - Correções diversas.
- 28 de fevereiro de 2023
- Suporte gerado coluna para aaaa-MM-dd date_format. Essa alteração oferece suporte à remoção de partição para aaaa-MM-dd como um date_format nas colunas geradas.
- Os usuários agora podem ler e escrever tabelas Delta específicas que exigem o Reader versão 3 e o Writer versão 7, usando o Databricks Runtime 9.1 LTS ou posterior. Para serem bem-sucedidos, os recursos de tabela listados no protocolo das tabelas devem ser suportados pela versão atual do Databricks Runtime.
- Suporte gerado coluna para aaaa-MM-dd date_format. Essa alteração oferece suporte à remoção de partição para aaaa-MM-dd como um date_format nas colunas geradas.
- Atualizações de segurança do sistema operacional.
- 16 de fevereiro de 2023
- [FAÍSCA-30220] Habilitar o uso de subconsultas Exists/In fora do nó Filtro
- Atualizações de segurança do sistema operacional.
- 31 de janeiro de 2023
- Os tipos de tabela de tabelas JDBC agora são EXTERNOS por padrão.
- 18 de janeiro de 2023
- O conector Sinapse do Azure retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres não válidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
Azure Synapse Analytics failed to run the JDBC query produced by the connector. Check column names do not include not valid characters such as ';' or white space
. - [FAÍSCA-38277] Limpar lote de gravação após a confirmação do armazenamento de estado do RocksDB
- [FAÍSCA-41199] Corrigir problema de métricas quando a fonte de streaming DSv1 e a fonte de streaming DSv2 são cousadas
- [FAÍSCA-41198] Corrigir métricas em consultas de streaming com origem de streaming CTE e DSv1
- [FAÍSCA-41339] Feche e recrie o lote de gravação do RocksDB em vez de apenas limpar
- [FAÍSCA-41732] Aplicar poda baseada em padrão de árvore para a regra SessionWindowing
- Atualizações de segurança do sistema operacional.
- O conector Sinapse do Azure retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres não válidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
- 29 de novembro de 2022
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
-
csvignoreleadingwhitespace
, quando definido comotrue
, remove o espaço em branco à esquerda dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
. -
csvignoretrailingwhitespace
, quando definido comotrue
, remove o espaço em branco à direita dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
.
-
- Corrigido um problema com a análise JSON no Auto Loader quando todas as colunas eram deixadas como strings (
cloudFiles.inferColumnTypes
não estava definido ou definido comofalse
) e o JSON continha objetos aninhados. - Atualizações de segurança do sistema operacional.
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
- 15 de novembro de 2022
- Apache commons-text atualizado para 1.10.0.
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhorado, defina
spark.sql.json.enablePartialResults
comotrue
. O sinalizador é desativado por padrão para preservar o comportamento original. -
[FAÍSCA-40292] Corrigir nomes de colunas em
arrays_zip
função quando matrizes são referenciadas a partir de estruturas aninhadas - Atualizações de segurança do sistema operacional.
- 1 de novembro de 2022
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
_change_type
, mas o feed de dados Change estivesse desativado nessa tabela, os dados nessa coluna seriam preenchidos incorretamente com valores NULL durante a execuçãoMERGE
. - Corrigido um problema com o Auto Loader em que um ficheiro podia ser duplicado no mesmo microlote quando
allowOverwrites
estava ativado - [FAÍSCA-40697] Adicionar preenchimento de caracteres do lado de leitura para cobrir arquivos de dados externos
- [FAÍSCA-40596] Preencher ExecutorDecommission com mensagens em ExecutorDecommissionInfo
- Atualizações de segurança do sistema operacional.
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
- 18 de outubro de 2022
- Atualizações de segurança do sistema operacional.
- 5 de outubro de 2022
-
[FAÍSCA-40468] Corrija a remoção de coluna no CSV quando
_corrupt_record
estiver selecionado. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-40468] Corrija a remoção de coluna no CSV quando
- 22 de setembro de 2022
- Os usuários podem definir spark.conf.set(
spark.databricks.io.listKeysWithPrefix.azure.enabled
,true
) para reativar a listagem interna do Auto Loader no ADLS Gen2. A listagem integrada foi desativada anteriormente devido a problemas de desempenho, mas pode ter levado ao aumento dos custos de armazenamento para os clientes. - [FAÍSCA-40315] Adicionar hashCode() para Literal de ArrayBasedMapData
- [FAÍSCA-40213] Suporta conversão de valor ASCII para caracteres latino-1
- [FAÍSCA-40380] Corrija a dobragem constante de InvokeLike para evitar literais não serializáveis incorporados no plano
- [FAÍSCA-38404] Melhorar a resolução de CTE quando uma CTE aninhada faz referência a uma CTE externa
- [FAÍSCA-40089] Corrigir a classificação para alguns tipos decimais
- [FAÍSCA-39887] RemoveRedundantAliases deve manter aliases que tornam a saída dos nós de projeção exclusiva
- Os usuários podem definir spark.conf.set(
- 6 de setembro de 2022
- [FAÍSCA-40235] Use o bloqueio interruptível em vez de sincronizado em Executor.updateDependencies()
- [FAÍSCA-40218] OS CONJUNTOS DE AGRUPAMENTO devem preservar as colunas de agrupamento
- [FAÍSCA-39976] ArrayIntersect deve manipular null na expressão esquerda corretamente
-
[FAÍSCA-40053] Adicionar
assume
a casos de cancelamento dinâmico que exigem ambiente de tempo de execução Python - [FAÍSCA-35542] Correção: Bucketizer criado para várias colunas com parâmetros splitsArray, inputCols e outputCols não podem ser carregados depois de salvá-lo
- [FAÍSCA-40079] Adicionar validação de inputCols do Imputer para caso de entrada vazio
- 24 de agosto de 2022
- [FAÍSCA-39983] Não armazenar em cache relações de difusão não serializadas no driver
- [FAÍSCA-39775] Desabilitar a validação de valores padrão ao analisar esquemas Avro
- [FAÍSCA-39962] Aplicar projeção quando os atributos de grupo estiverem vazios
- [FAÍSCA-37643] quando charVarcharAsString é true, para consulta de predicado de tipo de dados char deve ignorar a regra rpadding
- Atualizações de segurança do sistema operacional.
- 9 de agosto de 2022
- [FAÍSCA-39847] Corrija a condição de corrida em RocksDBLoader.loadLibrary() se o thread do chamador for interrompido
- [FAÍSCA-39731] Corrigir problema em fontes de dados CSV e JSON ao analisar datas no formato "yyyyMMdd" com a política do analisador de tempo CORRIGIDO
- Atualizações de segurança do sistema operacional.
- 27 de julho de 2022
- [FAÍSCA-39625] Adicionar Dataset.as(StructType)
-
[FAÍSCA-39689]Suporte a 2 caracteres na fonte de
lineSep
dados CSV - [FAÍSCA-39104] InMemoryRelation#isCachedColumnBuffersLoaded deve ser thread-safe
- [FAÍSCA-39570] A tabela embutida deve permitir expressões com alias
- [FAÍSCA-39702] Reduza a sobrecarga de memória de TransportCipher$EncryptedMessage usando um byteRawChannel compartilhado
- [FAÍSCA-39575] add ByteBuffer#rewind after ByteBuffer#get in AvroDeserializer
- [FAÍSCA-39476] Desative a otimização do Unwrap cast ao transmitir de Long para Float/Double ou de Integer para Float
- [FAÍSCA-38868] Não propague exceções do predicado do filtro ao otimizar junções externas
- Atualizações de segurança do sistema operacional.
- 20 de julho de 2022
- Torne os resultados da operação Delta MERGE consistentes quando a origem não for determinística.
- [FAÍSCA-39355] Uma única coluna usa aspas para construir UnresolvedAttribute
- [FAÍSCA-39548] Comando CreateView com uma consulta de cláusula de janela pressione uma definição de janela errada não encontrado problema
- [FAÍSCA-39419] Corrija ArraySort para lançar uma exceção quando o comparador retornar null
- Desativou o uso de APIs de nuvem internas do Auto Loader para listagem de diretórios no Azure.
- Atualizações de segurança do sistema operacional.
- 5 de julho de 2022
- [FAÍSCA-39376] Ocultar colunas duplicadas na expansão em estrela do alias de subconsulta de NATURAL/USING JOIN
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2022
- [FAÍSCA-39283] Corrigir impasse entre TaskMemoryManager e UnsafeExternalSorter.SpillableIterator
- [FAÍSCA-39285] O Spark não deve verificar nomes de campos ao ler arquivos
- [FAÍSCA-34096] Melhorar o desempenho para nth_value ignorar nulos na janela de deslocamento
-
[FAÍSCA-36718] Corrigir o
isExtractOnly
check-in CollapseProject
- 2 de junho de 2022
- [FAÍSCA-39093] Evite erros de compilação de codegen ao dividir intervalos de ano e mês ou intervalos de tempo de dia por uma integral
- [FAÍSCA-38990] Evite NullPointerException ao avaliar o formato date_trunc/trunc como uma referência acoplada
- Atualizações de segurança do sistema operacional.
- 18 de maio de 2022
- Corrige uma possível fuga de memória incorporada no Auto Loader.
- [FAÍSCA-38918] A remoção de coluna aninhada deve filtrar atributos que não pertencem à relação atual
- [FAÍSCA-37593] Reduza o tamanho da página padrão em LONG_ARRAY_OFFSET se G1GC e ON_HEAP forem usados
- [FAÍSCA-39084] Corrija df.rdd.isEmpty() usando TaskContext para parar o iterador na conclusão da tarefa
- [FAÍSCA-32268] Adicionar ColumnPruning em injectBloomFilter
- [FAÍSCA-38974] Filtrar funções registradas com um determinado nome de banco de dados em funções de lista
- [FAÍSCA-38931] Crie o diretório dfs raiz para RocksDBFileManager com um número desconhecido de chaves no 1º ponto de verificação
- Atualizações de segurança do sistema operacional.
- 19 de abril de 2022
- Java AWS SDK atualizado da versão 1.11.655 para 1.12.1899.
- Corrigido um problema com bibliotecas com escopo de bloco de anotações que não funcionavam em trabalhos de streaming em lote.
- [FAÍSCA-38616] Acompanhe o texto da consulta SQL no Catalyst TreeNode
- Atualizações de segurança do sistema operacional.
- 6 de abril de 2022
- As seguintes funções do Spark SQL estão agora disponíveis com esta versão:
-
timestampadd()
edateadd()
: Adicione uma duração de tempo em uma unidade especificada a uma expressão de carimbo de data/hora. -
timestampdiff()
e : Calculedatediff()
a diferença de tempo entre expressões de carimbo de data/hora em uma unidade especificada.
-
- Parquet-MR foi atualizado para 1.12.2
- Suporte melhorado para esquemas abrangentes em arquivos parquet
- [FAÍSCA-38631] Usa implementação baseada em Java para un-tarring em Utils.unpack
-
[FAÍSCA-38509][FAÍSCA-38481] Escolha a dedo três
timestmapadd/diff
mudanças. - [FAÍSCA-38523] Correção referente à coluna de registro corrompido do CSV
-
[FAÍSCA-38237] Permitir
ClusteredDistribution
exigir chaves de cluster completas - [FAÍSCA-38437] Serialização leniente de datetime a partir da fonte de dados
- [FAÍSCA-38180] Permitir expressões upcast seguras em predicados de igualdade correlacionados
- [FAÍSCA-38155] Não permitir agregados distintos em subconsultas laterais com predicados sem suporte
- Atualizações de segurança do sistema operacional.
- As seguintes funções do Spark SQL estão agora disponíveis com esta versão:
Tempo de execução do Databricks 9.1 LTS
Consulte Databricks Runtime 9.1 LTS.
- 29 de novembro de 2023
-
[FAÍSCA-45859] Fez objetos UDF em
ml.functions
preguiçoso. -
[FAÍSCA-45544] Suporte SSL integrado no
TransportContext
. -
[FAÍSCA-45730] Restrições de tempo melhoradas para
ReloadingX509TrustManagerSuite
o . - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45859] Fez objetos UDF em
- 14 de novembro de 2023
-
[FAÍSCA-45545]
SparkTransportConf
herda após aSSLOptions
criação. - [FAÍSCA-45429] Adicionadas classes auxiliares para comunicação RPC SSL.
-
[FAÍSCA-45427] Adicionadas configurações de SSL RPC para
SSLOptions
eSparkTransportConf
. -
[FAÍSCA-45584] Corrigida a falha de execução da subconsulta com
TakeOrderedAndProjectExec
o . -
[FAÍSCA-45541] Adicionado
SSLFactory
. - [FAÍSCA-42205] Removidos os acumuláveis de log nos eventos de início de Estágio e Tarefa.
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45545]
- 24 de outubro de 2023
-
[FAÍSCA-45426] Adicionado suporte para
ReloadingX509TrustManager
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-45426] Adicionado suporte para
- 13 de outubro de 2023
- Atualizações de segurança do sistema operacional.
- 10 de setembro de 2023
- Correções diversas.
- 30 de agosto de 2023
- Atualizações de segurança do sistema operacional.
- 15 de agosto de 2023
- Atualizações de segurança do sistema operacional.
- 23 de junho de 2023
- A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2023
- [FAÍSCA-43098] Corrigir o bug COUNT de correção quando a subconsulta escalar tem um grupo por cláusula
-
[FAÍSCA-43156][FAÍSCA-43098] Estenda o teste de bug da contagem de subconsultas escalares com
decorrelateInnerQuery
desativado. - [FAÍSCA-40862] Suporte a subconsultas não agregadas em RewriteCorrelatedScalarSubquery
- Atualizações de segurança do sistema operacional.
- 2 de junho de 2023
- O analisador JSON no
failOnUnknownFields
modo descarta um registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - Corrigido um problema na análise de dados resgatados pelo JSON para evitar
UnknownFieldException
o . - Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
-
[FAÍSCA-37520] Adicionar as
startswith()
funções eendswith()
string -
[FAÍSCA-43413] Corrigida
IN
a anulabilidade da subconsultaListQuery
. - Atualizações de segurança do sistema operacional.
- O analisador JSON no
- 17 de maio de 2023
- Atualizações de segurança do sistema operacional.
- 25 de abril de 2023
- Atualizações de segurança do sistema operacional.
- 11 de abril de 2023
- Corrigido um problema em que a evolução do esquema do Auto Loader podia entrar em um loop de falha infinito quando uma nova coluna é detetada no esquema de um objeto JSON aninhado.
- [FAÍSCA-42967] Corrija SparkListenerTaskStart.stageAttemptId quando uma tarefa é iniciada depois que o estágio é cancelado.
- 29 de março de 2023
- Atualizações de segurança do sistema operacional.
- 14 de março de 2023
-
[FAÍSCA-42484] Mensagem de erro melhorada para
UnsafeRowUtils
. - Correções diversas.
-
[FAÍSCA-42484] Mensagem de erro melhorada para
- 28 de fevereiro de 2023
- Os usuários agora podem ler e escrever tabelas Delta específicas que exigem o Reader versão 3 e o Writer versão 7, usando o Databricks Runtime 9.1 LTS ou posterior. Para serem bem-sucedidos, os recursos de tabela listados no protocolo das tabelas devem ser suportados pela versão atual do Databricks Runtime.
- Atualizações de segurança do sistema operacional.
- 16 de fevereiro de 2023
- Atualizações de segurança do sistema operacional.
- 31 de janeiro de 2023
- Os tipos de tabela de tabelas JDBC agora são EXTERNOS por padrão.
- 18 de janeiro de 2023
- Atualizações de segurança do sistema operacional.
- 29 de novembro de 2022
- Corrigido um problema com a análise JSON no Auto Loader quando todas as colunas eram deixadas como strings (
cloudFiles.inferColumnTypes
não estava definido ou definido comofalse
) e o JSON continha objetos aninhados. - Atualizações de segurança do sistema operacional.
- Corrigido um problema com a análise JSON no Auto Loader quando todas as colunas eram deixadas como strings (
- 15 de novembro de 2022
- Apache commons-text atualizado para 1.10.0.
- Atualizações de segurança do sistema operacional.
- Correções diversas.
- 1 de novembro de 2022
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
_change_type
, mas o feed de dados Change estivesse desativado nessa tabela, os dados nessa coluna seriam preenchidos incorretamente com valores NULL durante a execuçãoMERGE
. - Corrigido um problema com o Auto Loader em que um ficheiro podia ser duplicado no mesmo microlote quando
allowOverwrites
estava ativado - [FAÍSCA-40596] Preencher ExecutorDecommission com mensagens em ExecutorDecommissionInfo
- Atualizações de segurança do sistema operacional.
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
- 18 de outubro de 2022
- Atualizações de segurança do sistema operacional.
- 5 de outubro de 2022
- Correções diversas.
- Atualizações de segurança do sistema operacional.
- 22 de setembro de 2022
- Os usuários podem definir spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") para reativar a listagem interna do Auto Loader no ADLS Gen2. A listagem integrada foi desativada anteriormente devido a problemas de desempenho, mas pode ter levado ao aumento dos custos de armazenamento para os clientes.
- [FAÍSCA-40315] Adicionar hashCode() para Literal de ArrayBasedMapData
- [FAÍSCA-40089] Corrigir a classificação para alguns tipos decimais
- [FAÍSCA-39887] RemoveRedundantAliases deve manter aliases que tornam a saída dos nós de projeção exclusiva
- 6 de setembro de 2022
- [FAÍSCA-40235] Use o bloqueio interruptível em vez de sincronizado em Executor.updateDependencies()
- [FAÍSCA-35542] Correção: Bucketizer criado para várias colunas com parâmetros splitsArray, inputCols e outputCols não podem ser carregados depois de salvá-lo
- [FAÍSCA-40079] Adicionar validação de inputCols do Imputer para caso de entrada vazio
- 24 de agosto de 2022
-
[FAÍSCA-39666] Use UnsafeProjection.create para respeitar
spark.sql.codegen.factoryMode
em ExpressionEncoder - [FAÍSCA-39962] Aplicar projeção quando os atributos de grupo estiverem vazios
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-39666] Use UnsafeProjection.create para respeitar
- 9 de agosto de 2022
- Atualizações de segurança do sistema operacional.
- 27 de julho de 2022
- Torne os resultados da operação Delta MERGE consistentes quando a origem não for determinística.
-
[FAÍSCA-39689] Suporte para 2 caracteres na fonte de
lineSep
dados CSV -
[FAÍSCA-39575] Adicionado
ByteBuffer#rewind
depoisByteBuffer#get
emAvroDeserializer
. - [FAÍSCA-37392] Corrigido o erro de desempenho do otimizador de catalisador.
- Atualizações de segurança do sistema operacional.
- 13 de julho de 2022
-
[FAÍSCA-39419]
ArraySort
lança uma exceção quando o comparador retorna null. - Desativou o uso de APIs de nuvem internas do Auto Loader para listagem de diretórios no Azure.
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-39419]
- 5 de julho de 2022
- Atualizações de segurança do sistema operacional.
- Correções diversas.
- 15 de junho de 2022
-
[FAÍSCA-39283] Corrigir o impasse entre
TaskMemoryManager
eUnsafeExternalSorter.SpillableIterator
.
-
[FAÍSCA-39283] Corrigir o impasse entre
- 2 de junho de 2022
-
[FAÍSCA-34554] Implemente o
copy()
método emColumnarMap
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-34554] Implemente o
- 18 de maio de 2022
- Corrigido um potencial vazamento de memória embutido no Auto Loader.
- Atualize a versão do AWS SDK de 1.11.655 para 1.11.678.
- [FAÍSCA-38918] A remoção de coluna aninhada deve filtrar atributos que não pertencem à relação atual
-
[FAÍSCA-39084] Corrigir
df.rdd.isEmpty()
usandoTaskContext
para parar o iterador na conclusão da tarefa - Atualizações de segurança do sistema operacional.
- 19 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções diversas.
- 6 de abril de 2022
- [FAÍSCA-38631] Usa implementação baseada em Java para un-tarring em Utils.unpack
- Atualizações de segurança do sistema operacional.
- 22 de março de 2022
- Alterado o diretório de trabalho atual de blocos de anotações em clusters de alta simultaneidade com controle de acesso à tabela ou passagem de credenciais habilitado para o diretório base do usuário. Anteriormente, o diretório ativo era
/databricks/driver
. - [FAÍSCA-38437] Serialização leniente de datetime a partir da fonte de dados
- [FAÍSCA-38180] Permitir expressões upcast seguras em predicados de igualdade correlacionados
- [FAÍSCA-38155] Não permitir agregados distintos em subconsultas laterais com predicados sem suporte
- [FAÍSCA-27442] Removido um campo de verificação ao ler ou gravar dados em um parquet.
- Alterado o diretório de trabalho atual de blocos de anotações em clusters de alta simultaneidade com controle de acesso à tabela ou passagem de credenciais habilitado para o diretório base do usuário. Anteriormente, o diretório ativo era
- 14 de março de 2022
- [FAÍSCA-38236] Os caminhos de arquivo absolutos especificados na tabela create/alter são tratados como relativos
-
[FAÍSCA-34069] Interrompa o thread de tarefas se a propriedade
SPARK_JOB_INTERRUPT_ON_CANCEL
local estiver definida como true.
- 23 de fevereiro de 2022
- [FAÍSCA-37859] As tabelas SQL criadas com JDBC com Spark 3.1 não são legíveis com o Spark 3.2.
- 8 de fevereiro de 2022
- [FAÍSCA-27442] Removido um campo de verificação ao ler ou gravar dados em um parquet.
- Atualizações de segurança do sistema operacional.
- 1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
- 26 de janeiro de 2022
- Corrigido um problema em que transações simultâneas em tabelas Delta podiam ser confirmadas em uma ordem não serializável sob certas condições raras.
- Corrigido um problema em que o
OPTIMIZE
comando podia falhar quando o dialeto ANSI SQL estava habilitado.
- 19 de janeiro de 2022
- Pequenas correções e melhorias de segurança.
- Atualizações de segurança do sistema operacional.
- 4 de novembro de 2021
- Corrigido um problema que podia fazer com que os fluxos de Streaming Estruturado falhassem com um
ArrayIndexOutOfBoundsException
arquivo . - Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: No FileSystem for scheme
ou que poderia fazer com que as modificaçõessparkContext.hadoopConfiguration
não tivessem efeito nas consultas. - O Apache Spark Connector for Delta Sharing foi atualizado para 0.2.0.
- Corrigido um problema que podia fazer com que os fluxos de Streaming Estruturado falhassem com um
- 20 de outubro de 2021
- Conector BigQuery atualizado de 0.18.1 para 0.22.2. Isso adiciona suporte para o tipo BigNumeric.
Tempo de execução do Databricks 13.0 (EoS)
Consulte Databricks Runtime 13.0 (EoS).
13 de outubro de 2023
- Dependência de flocos de neve-jdbc atualizada de 3.13.29 para 3.13.33.
- [FAÍSCA-42553][SQL] Certifique-se de pelo menos uma unidade de tempo após o intervalo.
-
[FAÍSCA-45178] Fallback para executar um único lote para
Trigger.AvailableNow
com fontes não suportadas em vez de usar wrapper. -
[FAÍSCA-44658][CORE]
ShuffleStatus.getMapStatus
retornaNone
em vez deSome(null)
. -
[FAÍSCA-42205][CORE] Remova o registro de Acumuláveis nos eventos de início de Tarefa/Estágio em
JsonProtocol
. - Atualizações de segurança do sistema operacional.
12 de setembro de 2023
-
[FAÍSCA-44485][SQL] Otimize
TreeNode.generateTreeString
. -
[FAÍSCA-44718][SQL] Corresponder
ColumnVector
o padrão de configuração do modo de memória aoOffHeapMemoryMode
valor de configuração. - Correções de bugs diversos.
-
[FAÍSCA-44485][SQL] Otimize
30 de agosto de 2023
-
[FAÍSCA-44818][Backport] Corrida fixa para interrupção de tarefa pendente emitida antes
taskThread
de ser inicializada. - [FAÍSCA-44714] Facilite a restrição da resolução de LCA em relação a consultas.
-
[FAÍSCA-44245][PYTHON]
pyspark.sql.dataframe sample()
doctests agora é apenas ilustrativo. -
[FAÍSCA-44871][11.3-13.0][SQL] Comportamento fixo
percentile_disc
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-44818][Backport] Corrida fixa para interrupção de tarefa pendente emitida antes
15 de agosto de 2023
-
[FAÍSCA-44643][SQL][PYTHON] Corrija
Row.__repr__
quando a linha estiver vazia. - [FAÍSCA-44504][Backport] A tarefa de manutenção limpa os fornecedores carregados em caso de erro de paragem.
-
[FAÍSCA-44479][CONECTAR][PYTHON] Conversão fixa
protobuf
de um tipo struct vazio. -
[FAÍSCA-44464][SS] Corrigido
applyInPandasWithStatePythonRunner
para linhas de saída que têmNull
como valor de primeira coluna. - Correções de bugs diversos.
-
[FAÍSCA-44643][SQL][PYTHON] Corrija
29 de julho de 2023
- Corrigido um bug que era
dbutils.fs.ls()
retornadoINVALID_PARAMETER_VALUE.LOCATION_OVERLAP
quando chamado para um caminho de local de armazenamento que colidia com outro local de armazenamento externo ou gerenciado. -
[FAÍSCA-44199]
CacheManager
já não refresca ofileIndex
desnecessariamente. - Atualizações de segurança do sistema operacional.
- Corrigido um bug que era
24 de julho de 2023
-
[FAÍSCA-44337][PROTOBUF] Corrigido um problema em que qualquer campo definido como
Any.getDefaultInstance
causava erros de análise. -
[FAÍSCA-44136] [SS] Corrigido um problema em que
StateManager
seria materializado em um executor em vez de driver emFlatMapGroupsWithStateExec
. - Reverter [SPARK-42323][SQL] Atribua nome a
_LEGACY_ERROR_TEMP_2332
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-44337][PROTOBUF] Corrigido um problema em que qualquer campo definido como
23 de junho de 2023
- Atualizações de segurança do sistema operacional.
15 de junho de 2023
- Fotonizado
approx_count_distinct
. - A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
- [FAÍSCA-43156][FAÍSCA-43098][SQL] Estender o teste de bug da contagem de subconsultas escalares com decorrelateInnerQuery desativado
-
[FAÍSCA-43779][SQL]
ParseToDate
agora carregaEvalMode
no thread principal. -
[FAÍSCA-42937][SQL]
PlanSubqueries
deve ser definidoInSubqueryExec#shouldBroadcast
como true - Atualizações de segurança do sistema operacional.
- Fotonizado
2 de junho de 2023
- O analisador JSON no
failOnUnknownFields
modo descarta um registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - Melhore o desempenho da atualização incremental com
SHALLOW CLONE
o Iceberg e o Parquet. - Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
- [FAÍSCA-43404][Backport] Ignore a reutilização do arquivo sst para a mesma versão do armazenamento de estado RocksDB para evitar erro de incompatibilidade de ID.
- [FAÍSCA-43340][CORE] Corrigido o campo de rastreamento de pilha ausente nos logs de eventos.
-
[FAÍSCA-43300][CORE]
NonFateSharingCache
wrapper para Guava Cache. -
[FAÍSCA-43378][CORE] Feche corretamente os objetos de fluxo no
deserializeFromChunkedBuffer
. - [FAÍSCA-16484][SQL] Use registradores de 8 bits para representar DataSketches.
- [FAÍSCA-43522][SQL] Corrigido criando nome de coluna struct com índice de matriz.
-
[FAÍSCA-43413][11.3-13.0][SQL] Corrigida
IN
a anulabilidade da subconsultaListQuery
. -
[FAÍSCA-43043][CORE] Desempenho melhorado
MapOutputTracker.updateMapOutput
. - [FAÍSCA-16484][SQL] Adicionado suporte para DataSketches HllSketch.
- [FAÍSCA-43123][SQL] Os metadados de campo interno não vazam mais para catálogos.
-
[FAÍSCA-42851][SQL] Guarda
EquivalentExpressions.addExpr()
comsupportedExpression()
. -
[FAÍSCA-43336][SQL] A transmissão entre
Timestamp
eTimestampNTZ
requer fuso horário. -
[FAÍSCA-43286][SQL] Modo CBC atualizado
aes_encrypt
para gerar IVs aleatórios. -
[FAÍSCA-42852][SQL] Alterações relacionadas revertidas
NamedLambdaVariable
deEquivalentExpressions
. -
[FAÍSCA-43541][SQL] Propagar todas as
Project
tags na resolução de expressões e colunas ausentes.. -
[FAÍSCA-43527][PYTHON] Corrigido
catalog.listCatalogs
no PySpark. - Atualizações de segurança do sistema operacional.
- O analisador JSON no
31 de maio de 2023
- O suporte de gravação otimizado padrão para tabelas Delta registradas no Unity Catalog foi expandido para incluir
CTAS
instruções eINSERT
operações para tabelas particionadas. Esse comportamento se alinha aos padrões em armazéns SQL. Consulte Gravações otimizadas para Delta Lake no Azure Databricks.
- O suporte de gravação otimizado padrão para tabelas Delta registradas no Unity Catalog foi expandido para incluir
17 de maio de 2023
- Corrigida uma regressão onde
_metadata.file_path
e_metadata.file_name
retornaria cadeias de caracteres formatadas incorretamente. Por exemplo, agora um caminho com espaços é representado comos3://test-bucket/some%20directory/some%20data.csv
em vez des3://test-bucket/some directory/some data.csv
. - As varreduras de parquet agora são robustas contra OOMs ao examinar arquivos excepcionalmente estruturados, ajustando dinamicamente o tamanho do lote. Os metadados do arquivo são analisados para reduzir preventivamente o tamanho do lote e são reduzidos novamente em novas tentativas de tarefas como uma rede de segurança final.
-
- Se um arquivo Avro fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que têm tipos de dados diferentes seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção.
- Se um arquivo Avro fosse lido apenas com a
- Auto Loader agora faz o seguinte.
-
- Lê corretamente e não resgata mais
Integer
,Short
,Byte
tipos se um desses tipos de dados for fornecido, mas o arquivo Avro sugere um dos outros dois tipos.
- Lê corretamente e não resgata mais
-
- Impede a leitura de tipos de intervalo como tipos de carimbo de data ou hora para evitar a obtenção de datas corrompidas.
-
- Evita a leitura
Decimal
de tipos com menor precisão.
- Evita a leitura
- [FAÍSCA-43172] [CONECTAR] Expõe host e token do cliente Spark connect.
-
[FAÍSCA-43293][SQL]
__qualified_access_only
é ignorado em colunas normais. -
[FAÍSCA-43098][SQL] Corrigido o erro de correção
COUNT
quando a subconsulta escalar é agrupada por cláusula. -
[FAÍSCA-43085][SQL] Suporte para atribuição de colunas
DEFAULT
para nomes de tabelas com várias partes. -
[FAÍSCA-43190][SQL]
ListQuery.childOutput
é agora consistente com a produção secundária. - [FAÍSCA-43192] [CONECTAR] Removida a validação do conjunto de caracteres do agente do usuário.
- Corrigida uma regressão onde
25 de abril de 2023
- Você pode modificar uma tabela Delta para adicionar suporte a um recurso de tabela Delta usando
DeltaTable.addFeatureSupport(feature_name)
o . - O
SYNC
comando agora suporta formatos de fonte de dados herdados. - Corrigido um bug em que usar o formatador Python antes de executar quaisquer outros comandos em um bloco de anotações Python poderia fazer com que o caminho do bloco de anotações estivesse ausente
sys.path.
- O Azure Databricks agora dá suporte à especificação de valores padrão para colunas de tabelas Delta.
INSERT
,UPDATE
,DELETE
, eMERGE
os comandos podem se referir ao valor padrão de uma coluna usando a palavra-chave explícitaDEFAULT
. ParaINSERT
comandos com uma lista explícita de menos colunas do que a tabela de destino, os valores padrão de coluna correspondentes são substituídos pelas colunas restantes (ouNULL
se nenhum padrão for especificado).
- Você pode modificar uma tabela Delta para adicionar suporte a um recurso de tabela Delta usando
Corrige um bug em que o terminal web não podia ser usado para acessar arquivos para
/Workspace
alguns usuários.- Se um arquivo Parquet fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que tivessem diferentes tipos de dados seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - Auto Loader agora lê corretamente e não resgata mais
Integer
,Short
,Byte
tipos se um desses tipos de dados são fornecidos. O arquivo Parquet sugere um dos outros dois tipos. Quando a coluna de dados resgatados estava habilitada anteriormente, a incompatibilidade de tipo de dados fazia com que as colunas fossem resgatadas mesmo que fossem legíveis. - Corrigido um bug em que a evolução do esquema do Auto Loader pode entrar em um loop de falha infinito, quando uma nova coluna é detetada no esquema de um objeto JSON aninhado.
- [FAÍSCA-42794][SS] Aumente o lockAcquireTimeoutMs para 2 minutos para adquirir o armazenamento de estado RocksDB no Structure Streaming.
- [FAÍSCA-39221][SQL] Faça com que as informações confidenciais sejam editadas corretamente para a guia trabalho/estágio do servidor de poupança.
-
[FAÍSCA-42971][CORE] Altere para imprimir
workdir
seappDirs
for null quando o trabalhador manipularWorkDirCleanup
o evento. - [FAÍSCA-42936][SQL] Corrija o bug da LCA quando a cláusula having puder ser resolvida diretamente por sua agregação filha.
-
[FAÍSCA-43018][SQL] Corrija bugs para
INSERT
comandos com literais de carimbo de data/hora. - Revert [SPARK-42754][SQL][UI] Corrija o problema de compatibilidade com versões anteriores na execução do SQL aninhado.
- Reverter [SPARK-41498] Propagar metadados através da União.
-
[FAÍSCA-43038][SQL] Apoie o modo CBC por
aes_encrypt()
/aes_decrypt()
. -
[FAÍSCA-42928][SQL] Faça
resolvePersistentFunction
sincronizado. -
[FAÍSCA-42521][SQL] Adicione
NULL
valores paraINSERT
com listas especificadas pelo usuário de menos colunas do que a tabela de destino. -
[FAÍSCA-41391][SQL] O nome da coluna de saída de
groupBy.agg(count_distinct)
estava incorreto. -
[FAÍSCA-42548][SQL] Adicionar
ReferenceAllColumns
para ignorar atributos de reescrita. - [FAÍSCA-42423][SQL] Adicione o início e o comprimento do bloco de arquivo de coluna de metadados.
-
[FAÍSCA-42796][SQL] Suporte ao acesso a
TimestampNTZ
colunas noCachedBatch
. - [FAÍSCA-42266][PYTHON] Remova o diretório pai em shell.py executar quando IPython é usado.
-
[FAÍSCA-43011][SQL]
array_insert
deve falhar com o índice 0. -
[FAÍSCA-41874][CONECTAR][PYTHON] Suporte
SameSemantics
no Spark Connect. - [FAÍSCA-42702][FAÍSCA-42623][SQL] Suporte a consulta parametrizada em subconsulta e CTE.
-
[FAÍSCA-42967][CORE] Corrija
SparkListenerTaskStart.stageAttemptId
quando uma tarefa é iniciada depois que o estágio é cancelado. - Atualizações de segurança do sistema operacional.
- Se um arquivo Parquet fosse lido apenas com a
Tempo de execução do Databricks 12.1 (EoS)
Consulte Databricks Runtime 12.1 (EoS).
23 de junho de 2023
- Atualizações de segurança do sistema operacional.
15 de junho de 2023
- Fotonizado
approx_count_distinct
. - A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
-
[FAÍSCA-43779][SQL]
ParseToDate
agora carregaEvalMode
no thread principal. - [FAÍSCA-43156][FAÍSCA-43098][SQL] Estender o teste de bug da contagem de subconsultas escalares com decorrelateInnerQuery desativado
- Atualizações de segurança do sistema operacional.
- Fotonizado
2 de junho de 2023
- O analisador JSON no
failOnUnknownFields
modo descarta um registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - Melhore o desempenho da atualização incremental com
SHALLOW CLONE
o Iceberg e o Parquet. - Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
- [FAÍSCA-43404][Backport] Ignore a reutilização do arquivo sst para a mesma versão do armazenamento de estado RocksDB para evitar erro de incompatibilidade de ID.
-
[FAÍSCA-43413][11.3-13.0][SQL] Corrigida
IN
a anulabilidade da subconsultaListQuery
. - [FAÍSCA-43522][SQL] Corrigido criando nome de coluna struct com índice de matriz.
-
[FAÍSCA-42444][PYTHON]
DataFrame.drop
agora lida com colunas duplicadas corretamente. -
[FAÍSCA-43541][SQL] Propagar todas as
Project
tags na resolução de expressões e colunas ausentes.. - [FAÍSCA-43340][CORE] Corrigido o campo de rastreamento de pilha ausente nos logs de eventos.
-
[FAÍSCA-42937][SQL]
PlanSubqueries
agora defineInSubqueryExec#shouldBroadcast
como true. -
[FAÍSCA-43527][PYTHON] Corrigido
catalog.listCatalogs
no PySpark. -
[FAÍSCA-43378][CORE] Feche corretamente os objetos de fluxo no
deserializeFromChunkedBuffer
.
- O analisador JSON no
17 de maio de 2023
- As varreduras de parquet agora são robustas contra OOMs ao examinar arquivos excepcionalmente estruturados, ajustando dinamicamente o tamanho do lote. Os metadados do arquivo são analisados para reduzir preventivamente o tamanho do lote e são reduzidos novamente em novas tentativas de tarefas como uma rede de segurança final.
- Se um arquivo Avro fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que têm tipos de dados diferentes seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - Auto Loader agora faz o seguinte.
-
- Lê corretamente e não resgata mais
Integer
,Short
,Byte
tipos se um desses tipos de dados for fornecido, mas o arquivo Avro sugere um dos outros dois tipos.
- Lê corretamente e não resgata mais
-
- Impede a leitura de tipos de intervalo como tipos de carimbo de data ou hora para evitar a obtenção de datas corrompidas.
-
- Evita a leitura
Decimal
de tipos com menor precisão.
- Evita a leitura
-
[FAÍSCA-43098][SQL] Corrigido o erro de correção
COUNT
quando a subconsulta escalar é agrupada por cláusula. -
[FAÍSCA-43190][SQL]
ListQuery.childOutput
é agora consistente com a produção secundária. - Atualizações de segurança do sistema operacional.
25 de abril de 2023
- Se um arquivo Parquet fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que tivessem diferentes tipos de dados seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - Auto Loader agora lê corretamente e não resgata mais
Integer
,Short
,Byte
tipos se um desses tipos de dados são fornecidos. O arquivo Parquet sugere um dos outros dois tipos. Quando a coluna de dados resgatados estava habilitada anteriormente, a incompatibilidade de tipo de dados fazia com que as colunas fossem resgatadas mesmo que fossem legíveis. -
[FAÍSCA-43009][SQL] Parametrizado
sql()
comAny
constantes. -
[FAÍSCA-42971][CORE] Altere para imprimir
workdir
seappDirs
for null quando o trabalhador manipularWorkDirCleanup
o evento. - Atualizações de segurança do sistema operacional.
- Se um arquivo Parquet fosse lido apenas com a
11 de abril de 2023
- Ofereça suporte a formatos de fonte de dados herdados no comando SYNC.
- Corrige um bug no comportamento %autoreload em blocos de anotações que estão fora de um repositório.
- Corrigido um bug em que a evolução do esquema do Auto Loader pode entrar em um loop de falha infinito, quando uma nova coluna é detetada no esquema de um objeto JSON aninhado.
-
[FAÍSCA-42928][SQL] Faz
resolvePersistentFunction
sincronizado. -
[FAÍSCA-42967][CORE] Corrige
SparkListenerTaskStart.stageAttemptId
quando uma tarefa é iniciada após o cancelamento do estágio. - Atualizações de segurança do sistema operacional.
29 de março de 2023
- O Auto Loader agora aciona pelo menos uma limpeza síncrona de log RocksDB para
Trigger.AvailableNow
fluxos para garantir que o ponto de verificação possa ser limpo regularmente para fluxos do Auto Loader de execução rápida. Isso pode fazer com que alguns fluxos demorem mais tempo antes de serem desligados, mas economizará custos de armazenamento e melhorará a experiência do Auto Loader em execuções futuras. - Agora você pode modificar uma tabela Delta para adicionar suporte aos recursos da tabela usando
DeltaTable.addFeatureSupport(feature_name)
o . - [FAÍSCA-42702][FAÍSCA-42623][SQL] Suporte a consulta parametrizada em subconsulta e CTE
- [FAÍSCA-41162][SQL] Corrigir anti e semi-join para auto-junção com agregações
- [FAÍSCA-42403][CORE] JsonProtocol deve manipular cadeias de caracteres JSON nulas
- [FAÍSCA-42668][SS] Exceção de captura ao tentar fechar o fluxo compactado no HDFSStateStoreProvider abortar
- [FAÍSCA-42794][SS] Aumente o lockAcquireTimeoutMs para 2 minutos para adquirir o armazenamento de estado RocksDB no Structure Streaming
- O Auto Loader agora aciona pelo menos uma limpeza síncrona de log RocksDB para
14 de Março de 2023
- Há uma alteração de terminologia para adicionar recursos a uma tabela Delta usando a propriedade table. A sintaxe preferida é agora
'delta.feature.featureName'='supported'
em vez de'delta.feature.featureName'='enabled'
. Para compatibilidade com versões anteriores, o uso'delta.feature.featureName'='enabled'
ainda funciona e continuará a funcionar. - [FAÍSCA-42622][CORE] Desativar substituição em valores
- [FAÍSCA-42534][SQL] Corrigir cláusula DB2Dialect Limit
- [FAÍSCA-42635][SQL] Corrija a expressão TimestampAdd.
- [FAÍSCA-42516][SQL] Sempre capture a configuração de fuso horário da sessão ao criar exibições
- [FAÍSCA-42484] [SQL] UnsafeRowUtils melhor mensagem de erro
- [FAÍSCA-41793][SQL] Resultado incorreto para quadros de janela definidos por uma cláusula de intervalo em decimais grandes
- Atualizações de segurança do sistema operacional.
- Há uma alteração de terminologia para adicionar recursos a uma tabela Delta usando a propriedade table. A sintaxe preferida é agora
24 de fevereiro de 2023
- Agora você pode usar um conjunto unificado de opções (
host
,port
,database
,user
,password
) para se conectar às fontes de dados suportadas na Federação de Consultas (PostgreSQL, MySQL, Synapse, Snowflake, Redshift, SQL Server). Observe queport
é opcional e usa o número de porta padrão para cada fonte de dados, se não for fornecido.
Exemplo de configuração de conexão PostgreSQL
CREATE TABLE postgresql_table USING postgresql OPTIONS ( dbtable '<table-name>', host '<host-name>', database '<database-name>', user '<user>', password secret('scope', 'key') );
Exemplo de configuração de conexão Snowflake
CREATE TABLE snowflake_table USING snowflake OPTIONS ( dbtable '<table-name>', host '<host-name>', port '<port-number>', database '<database-name>', user secret('snowflake_creds', 'my_username'), password secret('snowflake_creds', 'my_password'), schema '<schema-name>', sfWarehouse '<warehouse-name>' );
- [FAÍSCA-41989][PYTHON] Evite quebrar a configuração de registro de pyspark.pandas
- [FAÍSCA-42346][SQL] Reescrever agregações distintas após a mesclagem de subconsulta
-
[FAÍSCA-41990][SQL] Use
FieldReference.column
em vez de na conversão de filtro V1apply
para V2 - Reverter [SPARK-41848][CORE] Corrigindo tarefa agendada em excesso com TaskResourceProfile
- [FAÍSCA-42162] Introduza a expressão MultiCommutativeOp como uma otimização de memória para canonicalizar grandes árvores de expressões comutativas
- Atualizações de segurança do sistema operacional.
- Agora você pode usar um conjunto unificado de opções (
16 de fevereiro de 2023
- O comando SYNC suporta a sincronização de tabelas recriadas do Hive Metastore. Se uma tabela HMS tiver sido SINCRONIZADA anteriormente com o Unity Catalog, mas depois descartada e recriada, uma ressincronização subsequente funcionará em vez de lançar TABLE_ALREADY_EXISTS código de status.
- [FAÍSCA-41219][SQL] IntegralDivide usa decimal(1, 0) para representar 0
- [FAÍSCA-36173][CORE] Suporte para obter o número da CPU no TaskContext
- [FAÍSCA-41848][CORE] Corrigindo tarefas agendadas em excesso com TaskResourceProfile
- [FAÍSCA-42286][SQL] Fallback para o caminho de código codegen anterior para expr complexo com CAST
31 de janeiro de 2023
- Criar um esquema com um local definido agora requer que o usuário tenha privilégios SELECT e MODIFY em QUALQUER ARQUIVO.
- [FAÍSCA-41581][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_1230
- [FAÍSCA-41996][SQL][SS] Corrigir teste de kafka para verificar partições perdidas para contabilizar operações Kafka lentas
- [FAÍSCA-41580][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_2137
-
[FAÍSCA-41666][PYTHON] Suporte parametrizado SQL por
sql()
- [FAÍSCA-41579][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_1249
- [FAÍSCA-41573][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_2136
- [FAÍSCA-41574][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_2009
- [FAÍSCA-41049][Seguimento] Corrigir uma regressão de sincronização de código para ConvertToLocalRelation
- [FAÍSCA-41576][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_2051
- [FAÍSCA-41572][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_2149
- [FAÍSCA-41575][SQL] Atribuir nome a _LEGACY_ERROR_TEMP_2054
- Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 12.0 (EoS)
Consulte Databricks Runtime 12.0 (EoS).
15 de junho de 2023
- Fotonizado
approx_count_distinct
. - A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
- [FAÍSCA-43156][FAÍSCA-43098][SQL] Estender o teste de bug da contagem de subconsultas escalares com decorrelateInnerQuery desativado
-
[FAÍSCA-43779][SQL]
ParseToDate
agora carregaEvalMode
no thread principal. - Atualizações de segurança do sistema operacional.
- Fotonizado
2 de junho de 2023
- O analisador JSON no
failOnUnknownFields
modo descarta um registro noDROPMALFORMED
modo e falha diretamente noFAILFAST
modo. - Melhore o desempenho da atualização incremental com
SHALLOW CLONE
o Iceberg e o Parquet. - Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
-
[FAÍSCA-42444][PYTHON]
DataFrame.drop
agora lida com colunas duplicadas corretamente. - [FAÍSCA-43404][Backport] Ignore a reutilização do arquivo sst para a mesma versão do armazenamento de estado RocksDB para evitar erro de incompatibilidade de ID.
-
[FAÍSCA-43413][11.3-13.0][SQL] Corrigida
IN
a anulabilidade da subconsultaListQuery
. -
[FAÍSCA-43527][PYTHON] Corrigido
catalog.listCatalogs
no PySpark. - [FAÍSCA-43522][SQL] Corrigido criando nome de coluna struct com índice de matriz.
-
[FAÍSCA-43541][SQL] Propagar todas as
Project
tags na resolução de expressões e colunas ausentes.. - [FAÍSCA-43340][CORE] Corrigido o campo de rastreamento de pilha ausente nos logs de eventos.
-
[FAÍSCA-42937][SQL]
PlanSubqueries
definidoInSubqueryExec#shouldBroadcast
como true.
- O analisador JSON no
17 de maio de 2023
- As varreduras de parquet agora são robustas contra OOMs ao examinar arquivos excepcionalmente estruturados, ajustando dinamicamente o tamanho do lote. Os metadados do arquivo são analisados para reduzir preventivamente o tamanho do lote e são reduzidos novamente em novas tentativas de tarefas como uma rede de segurança final.
- Se um arquivo Avro fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que têm tipos de dados diferentes seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - Auto Loader agora faz o seguinte.
-
- Lê corretamente e não resgata mais
Integer
,Short
,Byte
tipos se um desses tipos de dados for fornecido, mas o arquivo Avro sugere um dos outros dois tipos.
- Lê corretamente e não resgata mais
-
- Impede a leitura de tipos de intervalo como tipos de carimbo de data ou hora para evitar a obtenção de datas corrompidas.
-
- Evita a leitura
Decimal
de tipos com menor precisão.
- Evita a leitura
- [FAÍSCA-43172] [CONECTAR] Expõe host e token do cliente Spark connect.
-
[FAÍSCA-41520][SQL] Dividir
AND_OR
padrão de árvore para separarAND
eOR
. -
[FAÍSCA-43098][SQL] Corrigido o erro de correção
COUNT
quando a subconsulta escalar é agrupada por cláusula. -
[FAÍSCA-43190][SQL]
ListQuery.childOutput
é agora consistente com a produção secundária. - Atualizações de segurança do sistema operacional.
25 de abril de 2023
- Se um arquivo Parquet fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que tivessem diferentes tipos de dados seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - Auto Loader agora lê corretamente e não resgata mais
Integer
,Short
,Byte
tipos se um desses tipos de dados são fornecidos. O arquivo Parquet sugere um dos outros dois tipos. Quando a coluna de dados resgatados estava habilitada anteriormente, a incompatibilidade de tipo de dados fazia com que as colunas fossem resgatadas mesmo que fossem legíveis. -
[FAÍSCA-42971][CORE] Alterar para imprimir
workdir
seappDirs
for nulo quando o trabalhador manipularWorkDirCleanup
evento - Atualizações de segurança do sistema operacional.
- Se um arquivo Parquet fosse lido apenas com a
11 de abril de 2023
- Suporte a formatos de fonte de dados herdados no
SYNC
comando. - Corrige um bug no comportamento %autoreload em blocos de anotações que estão fora de um repositório.
- Corrigido um bug em que a evolução do esquema do Auto Loader pode entrar em um loop de falha infinito, quando uma nova coluna é detetada no esquema de um objeto JSON aninhado.
-
[FAÍSCA-42928][SQL] Faz
resolvePersistentFunction
sincronizado. -
[FAÍSCA-42967][CORE] Corrige
SparkListenerTaskStart.stageAttemptId
quando uma tarefa é iniciada após o cancelamento do estágio. - Atualizações de segurança do sistema operacional.
- Suporte a formatos de fonte de dados herdados no
29 de março de 2023
- [FAÍSCA-42794][SS] Aumente o lockAcquireTimeoutMs para 2 minutos para adquirir o armazenamento de estado RocksDB no Structure Streaming
- [FAÍSCA-41162][SQL] Corrigir anti e semi-join para auto-junção com agregações
- [FAÍSCA-42403][CORE] JsonProtocol deve manipular cadeias de caracteres JSON nulas
- [FAÍSCA-42668][SS] Exceção de captura ao tentar fechar o fluxo compactado no HDFSStateStoreProvider abortar
- Correções de bugs diversos.
14 de Março de 2023
- [FAÍSCA-42534][SQL] Corrigir cláusula DB2Dialect Limit
- [FAÍSCA-42622][CORE] Desativar substituição em valores
- [FAÍSCA-41793][SQL] Resultado incorreto para quadros de janela definidos por uma cláusula de intervalo em decimais grandes
- [FAÍSCA-42484] [SQL] UnsafeRowUtils melhor mensagem de erro
- [FAÍSCA-42635][SQL] Corrija a expressão TimestampAdd.
- [FAÍSCA-42516][SQL] Sempre capture a configuração de fuso horário da sessão ao criar exibições
- Atualizações de segurança do sistema operacional.
24 de fevereiro de 2023
Opções de conexão padronizadas para federação de consultas
Agora você pode usar um conjunto unificado de opções (
host
,port
,database
,user
,password
) para se conectar às fontes de dados suportadas na Federação de Consultas (PostgreSQL, MySQL, Synapse, Snowflake, Redshift, SQL Server). Observe queport
é opcional e usará o número de porta padrão para cada fonte de dados, se não for fornecido.Exemplo de configuração de conexão PostgreSQL
CREATE TABLE postgresql_table USING postgresql OPTIONS ( dbtable '<table-name>', host '<host-name>', database '<database-name>', user '<user>', password secret('scope', 'key') );
Exemplo de configuração de conexão Snowflake
CREATE TABLE snowflake_table USING snowflake OPTIONS ( dbtable '<table-name>', host '<host-name>', port '<port-number>', database '<database-name>', user secret('snowflake_creds', 'my_username'), password secret('snowflake_creds', 'my_password'), schema '<schema-name>', sfWarehouse '<warehouse-name>' );
Reverter [SPARK-41848][CORE] Corrigindo tarefa agendada em excesso com TaskResourceProfile
[FAÍSCA-42162] Introduza a expressão MultiCommutativeOp como uma otimização de memória para canonicalizar grandes árvores de expressões comutativas
[FAÍSCA-41990][SQL] Use
FieldReference.column
em vez de na conversão de filtro V1apply
para V2[FAÍSCA-42346][SQL] Reescrever agregações distintas após a mesclagem de subconsulta
Atualizações de segurança do sistema operacional.
16 de fevereiro de 2023
- Os usuários agora podem ler e gravar determinadas tabelas Delta que exigem o Reader versão 3 e o Writer versão 7, usando o Databricks Runtime 9.1 ou posterior. Para serem bem-sucedidos, os recursos de tabela listados no protocolo das tabelas devem ser suportados pela versão atual do Databricks Runtime.
- O comando SYNC suporta a sincronização de tabelas recriadas do Hive Metastore. Se uma tabela HMS tiver sido SINCRONIZADA anteriormente com o Unity Catalog, mas depois descartada e recriada, uma ressincronização subsequente funcionará em vez de lançar TABLE_ALREADY_EXISTS código de status.
- [FAÍSCA-36173][CORE] Suporte para obter o número da CPU no TaskContext
- [FAÍSCA-42286][SQL] Fallback para o caminho de código codegen anterior para expr complexo com CAST
- [FAÍSCA-41848][CORE] Corrigindo tarefas agendadas em excesso com TaskResourceProfile
- [FAÍSCA-41219][SQL] IntegralDivide usa decimal(1, 0) para representar 0
25 de janeiro de 2023
- [FAÍSCA-41660][SQL] Propagar colunas de metadados somente se elas forem usadas
- [FAÍSCA-41379][SS][PYTHON] Fornecer sessão de faísca clonada no DataFrame na função de usuário para o coletor foreachBatch no PySpark
- [FAÍSCA-41669][SQL] Poda antecipada em canCollapseExpressions
- Atualizações de segurança do sistema operacional.
18 de janeiro de 2023
-
REFRESH FUNCTION
O comando SQL agora suporta funções SQL e funções de tabela SQL. Por exemplo, o comando pode ser usado para atualizar uma função SQL persistente que foi atualizada em outra sessão SQL. - A fonte de dados Java Database Connectivity (JDBC) v1 agora suporta pushdown de cláusula LIMIT para melhorar o desempenho em consultas. Este recurso é ativado por padrão e pode ser desativado com
spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled
definido comofalse
. - Em clusters de ACLs de tabela herdada, a criação de funções que fazem referência a classes JVM agora requer o
MODIFY_CLASSPATH
privilégio. - A fonte de dados Java Database Connectivity (JDBC) v1 agora suporta pushdown de cláusula LIMIT para melhorar o desempenho em consultas. Esse recurso é habilitado por padrão e pode ser desativado com spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled definido como false.
- O conector Sinapse do Azure agora retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres inválidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace
. - O streaming estruturado do Spark agora funciona com format("deltasharing") em uma tabela de compartilhamento delta como fonte.
- [FAÍSCA-38277][SS] Limpar lote de gravação após a confirmação do armazenamento de estado do RocksDB
- [FAÍSCA-41733][SQL][SS] Aplicar poda baseada em padrão de árvore para a regra ResolveWindowTime
- [FAÍSCA-39591][SS] Acompanhamento assíncrono do progresso
- [FAÍSCA-41339][SQL] Feche e recrie o lote de gravação do RocksDB em vez de apenas limpar
- [FAÍSCA-41198][SS] Corrigir métricas em consultas de streaming com origem de streaming CTE e DSv1
- [FAÍSCA-41539][SQL] Remapear estatísticas e restrições em relação à saída no plano lógico para LogicalRDD
- [FAÍSCA-41732][SQL][SS] Aplicar poda baseada em padrão de árvore para a regra SessionWindowing
- [FAÍSCA-41862][SQL] Corrigir bug de correção relacionado aos valores DEFAULT no leitor Orc
- [FAÍSCA-41199][SS] Corrigir problema de métricas quando a fonte de streaming DSv1 e a fonte de streaming DSv2 são cousadas
- [FAÍSCA-41261][PYTHON][SS] Corrija o problema de applyInPandasWithState quando as colunas de chaves de agrupamento não são colocadas em ordem desde o início
- Atualizações de segurança do sistema operacional.
-
17 de maio de 2023
- As varreduras de parquet agora são robustas contra OOMs ao examinar arquivos excepcionalmente estruturados, ajustando dinamicamente o tamanho do lote. Os metadados do arquivo são analisados para reduzir preventivamente o tamanho do lote e são reduzidos novamente em novas tentativas de tarefas como uma rede de segurança final.
- Corrigida uma regressão que fazia com que os trabalhos do Azure Databricks persistissem depois de não conseguirem se conectar ao metastore durante a inicialização do cluster.
-
[FAÍSCA-41520][SQL] Dividir
AND_OR
padrão de árvore para separarAND
eOR
. -
[FAÍSCA-43190][SQL]
ListQuery.childOutput
é agora consistente com a produção secundária. - Atualizações de segurança do sistema operacional.
25 de abril de 2023
- Se um arquivo Parquet fosse lido apenas com a
failOnUnknownFields
opção ou com o Auto Loader no modo de evolução do esquema, asfailOnNewColumns
colunas que tivessem diferentes tipos de dados seriam lidas comonull
em vez de lançar um erro informando que o arquivo não pode ser lido. Essas leituras agora falham e recomendam que os usuários usem arescuedDataColumn
opção. - Auto Loader agora lê corretamente e não resgata mais
Integer
,Short
,Byte
tipos se um desses tipos de dados são fornecidos. O arquivo Parquet sugere um dos outros dois tipos. Quando a coluna de dados resgatados estava habilitada anteriormente, a incompatibilidade de tipo de dados fazia com que as colunas fossem resgatadas mesmo que fossem legíveis. -
[FAÍSCA-42937][SQL]
PlanSubqueries
agora defineInSubqueryExec#shouldBroadcast
como true. - Atualizações de segurança do sistema operacional.
- Se um arquivo Parquet fosse lido apenas com a
11 de abril de 2023
- Ofereça suporte a formatos de fonte de dados herdados no comando SYNC.
- Corrige um bug no comportamento %autoreload em blocos de anotações que estão fora de um repositório.
- Corrigido um bug em que a evolução do esquema do Auto Loader pode entrar em um loop de falha infinito, quando uma nova coluna é detetada no esquema de um objeto JSON aninhado.
- [FAÍSCA-42928][SQL] Faça resolvePersistentFunction sincronizado.
- [FAÍSCA-42967][CORE] Corrija SparkListenerTaskStart.stageAttemptId quando uma tarefa é iniciada depois que o estágio é cancelado.
29 de março de 2023
- [FAÍSCA-42794][SS] Aumente o lockAcquireTimeoutMs para 2 minutos para adquirir o armazenamento de estado RocksDB no Structure Streaming
- [FAÍSCA-42403][CORE] JsonProtocol deve manipular cadeias de caracteres JSON nulas
- [FAÍSCA-42668][SS] Exceção de captura ao tentar fechar o fluxo compactado no HDFSStateStoreProvider abortar
- Atualizações de segurança do sistema operacional.
14 de Março de 2023
- [FAÍSCA-42635][SQL] Corrija a expressão TimestampAdd.
- [FAÍSCA-41793][SQL] Resultado incorreto para quadros de janela definidos por uma cláusula de intervalo em decimais grandes
- [FAÍSCA-42484] [SQL] UnsafeRowUtils melhor mensagem de erro
- [FAÍSCA-42534][SQL] Corrigir cláusula DB2Dialect Limit
- [FAÍSCA-41162][SQL] Corrigir anti e semi-join para auto-junção com agregações
- [FAÍSCA-42516][SQL] Sempre capture a configuração de fuso horário da sessão ao criar exibições
- Correções de bugs diversos.
28 de fevereiro de 2023
Opções de conexão padronizadas para federação de consultas
Agora você pode usar um conjunto unificado de opções (
host
,port
,database
,user
,password
) para se conectar às fontes de dados suportadas na Federação de Consultas (PostgreSQL, MySQL, Synapse, Snowflake, Redshift, SQL Server). Observe queport
é opcional e usa o número de porta padrão para cada fonte de dados, se não for fornecido.Exemplo de configuração de conexão PostgreSQL
CREATE TABLE postgresql_table USING postgresql OPTIONS ( dbtable '<table-name>', host '<host-name>', database '<database-name>', user '<user>', password secret('scope', 'key') );
Exemplo de configuração de conexão Snowflake
CREATE TABLE snowflake_table USING snowflake OPTIONS ( dbtable '<table-name>', host '<host-name>', port '<port-number>', database '<database-name>', user secret('snowflake_creds', 'my_username'), password secret('snowflake_creds', 'my_password'), schema '<schema-name>', sfWarehouse '<warehouse-name>' );
[FAÍSCA-42286][SQL] Fallback para o caminho de código codegen anterior para expr complexo com CAST
[FAÍSCA-41989][PYTHON] Evite quebrar a configuração de registro de pyspark.pandas
[FAÍSCA-42346][SQL] Reescrever agregações distintas após a mesclagem de subconsulta
[FAÍSCA-41360][CORE] Evite o novo registro do BlockManager se o executor tiver sido perdido
[FAÍSCA-42162] Introduza a expressão MultiCommutativeOp como uma otimização de memória para canonicalizar grandes árvores de expressões comutativas
[FAÍSCA-41990][SQL] Use
FieldReference.column
em vez de na conversão de filtro V1apply
para V2Atualizações de segurança do sistema operacional.
16 de fevereiro de 2023
- Os usuários agora podem ler e gravar determinadas tabelas Delta que exigem o Reader versão 3 e o Writer versão 7, usando o Databricks Runtime 9.1 ou posterior. Para serem bem-sucedidos, os recursos de tabela listados no protocolo das tabelas devem ser suportados pela versão atual do Databricks Runtime.
- O comando SYNC suporta a sincronização de tabelas recriadas do Hive Metastore. Se uma tabela HMS tiver sido SINCRONIZADA anteriormente com o Unity Catalog, mas depois descartada e recriada, uma ressincronização subsequente funcionará em vez de lançar TABLE_ALREADY_EXISTS código de status.
- [FAÍSCA-41219][SQL] IntegralDivide usa decimal(1, 0) para representar 0
-
[FAÍSCA-40382][SQL] Agrupar expressões agregadas distintas por crianças semanticamente equivalentes em
RewriteDistinctAggregates
- Atualizações de segurança do sistema operacional.
25 de janeiro de 2023
- [FAÍSCA-41379][SS][PYTHON] Fornecer sessão de faísca clonada no DataFrame na função de usuário para o coletor foreachBatch no PySpark
- [FAÍSCA-41660][SQL] Propagar colunas de metadados somente se elas forem usadas
- [FAÍSCA-41669][SQL] Poda antecipada em canCollapseExpressions
- Correções de bugs diversos.
18 de janeiro de 2023
-
REFRESH FUNCTION
O comando SQL agora suporta funções SQL e funções de tabela SQL. Por exemplo, o comando pode ser usado para atualizar uma função SQL persistente que foi atualizada em outra sessão SQL. - A fonte de dados Java Database Connectivity (JDBC) v1 agora suporta pushdown de cláusula LIMIT para melhorar o desempenho em consultas. Este recurso é ativado por padrão e pode ser desativado com
spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled
definido comofalse
. - A fonte de dados Java Database Connectivity (JDBC) v1 agora suporta pushdown de cláusula LIMIT para melhorar o desempenho em consultas. Esse recurso é habilitado por padrão e pode ser desativado com spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled definido como false.
- O conector Sinapse do Azure agora retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres inválidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace
. - [FAÍSCA-41198][SS] Corrigir métricas em consultas de streaming com origem de streaming CTE e DSv1
- [FAÍSCA-41862][SQL] Corrigir bug de correção relacionado aos valores DEFAULT no leitor Orc
- [FAÍSCA-41539][SQL] Remapear estatísticas e restrições em relação à saída no plano lógico para LogicalRDD
- [FAÍSCA-39591][SS] Acompanhamento assíncrono do progresso
- [FAÍSCA-41199][SS] Corrigir problema de métricas quando a fonte de streaming DSv1 e a fonte de streaming DSv2 são cousadas
- [FAÍSCA-41261][PYTHON][SS] Corrija o problema de applyInPandasWithState quando as colunas de chaves de agrupamento não são colocadas em ordem desde o início
- [FAÍSCA-41339][SQL] Feche e recrie o lote de gravação do RocksDB em vez de apenas limpar
- [FAÍSCA-41732][SQL][SS] Aplicar poda baseada em padrão de árvore para a regra SessionWindowing
- [FAÍSCA-38277][SS] Limpar lote de gravação após a confirmação do armazenamento de estado do RocksDB
- Atualizações de segurança do sistema operacional.
-
29 de novembro de 2022
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
-
csvignoreleadingwhitespace
, quando definido comotrue
, remove o espaço em branco à esquerda dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
. -
csvignoretrailingwhitespace
, quando definido comotrue
, remove o espaço em branco à direita dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
.
-
- Corrigido um bug com a análise JSON no Auto Loader quando todas as colunas eram deixadas como strings (
cloudFiles.inferColumnTypes
não estava definido ou definido comofalse
) e o JSON continha objetos aninhados. - Atualize
snowflake-jdbc
a dependência para a versão 3.13.22. - Os tipos de tabela de tabelas JDBC agora são EXTERNOS por padrão.
-
[FAÍSCA-40906][SQL]
Mode
deve copiar as teclas antes de inserir no Mapa - Atualizações de segurança do sistema operacional.
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
15 de novembro de 2022
- ACLs de tabela e clusters compartilhados de UC agora permitem o método Dataset.toJSON de python.
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhoradodefinido
spark.sql.json.enablePartialResults
comotrue
. O sinalizador é desativado por padrão para preservar o comportamento original - [FAÍSCA-40903][SQL] Evite reordenar decimal Adicionar para canonicalização se o tipo de dados for alterado
- [FAÍSCA-40618][SQL] Corrigir bug na regra MergeScalarSubqueries com subconsultas aninhadas usando o rastreamento de referência
- [FAÍSCA-40697][SQL] Adicionar preenchimento de caracteres do lado de leitura para cobrir arquivos de dados externos
- Atualizações de segurança do sistema operacional.
1 de novembro de 2022
- O Streaming estruturado no Unity Catalog agora suporta a atualização de tokens de acesso temporários. As cargas de trabalho de streaming executadas com clusters de todos os fins ou trabalhos do Unity Catalog não falham mais após a expiração inicial do token.
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
_change_type
, mas o feed de dados Change estivesse desabilitado nessa tabela, os dados nessa coluna seriam preenchidos incorretamente com valores NULL durante a execuçãoMERGE
. - Corrigido um problema em que a execução
MERGE
e o uso de exatamente 99 colunas da fonte na condição podiam resultar emjava.lang.ClassCastException: org.apache.spark.sql.vectorized.ColumnarBatch cannot be cast to org.apache.spark.sql.catalyst.InternalRow
. - Corrigido um problema com o Auto Loader em que um ficheiro podia ser duplicado no mesmo microlote quando
allowOverwrites
estava ativado. - Apache commons-text atualizado para 1.10.0.
- [FAÍSCA-38881][DSTREAMS][KINESIS][PYSPARK] Adicionado suporte para o CloudWatch MetricsLevel Config
- [FAÍSCA-40596][CORE] Preencher ExecutorDecommission com mensagens em ExecutorDecommissionInfo
- [FAÍSCA-40670][SS][PYTHON] Corrija o NPE em applyInPandasWithState quando o esquema de entrada tiver coluna(s) "não anulável"
- Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 11.2 (EoS)
Consulte Databricks Runtime 11.2 (EoS).
- 28 de fevereiro de 2023
- [FAÍSCA-42286][SQL] Fallback para o caminho de código codegen anterior para expr complexo com CAST
- [FAÍSCA-42346][SQL] Reescrever agregações distintas após a mesclagem de subconsulta
- Atualizações de segurança do sistema operacional.
- 16 de fevereiro de 2023
- Os usuários agora podem ler e gravar determinadas tabelas Delta que exigem o Reader versão 3 e o Writer versão 7, usando o Databricks Runtime 9.1 ou posterior. Para serem bem-sucedidos, os recursos de tabela listados no protocolo das tabelas devem ser suportados pela versão atual do Databricks Runtime.
- O comando SYNC suporta a sincronização de tabelas recriadas do Hive Metastore. Se uma tabela HMS tiver sido SINCRONIZADA anteriormente com o Unity Catalog, mas depois descartada e recriada, uma ressincronização subsequente funcionará em vez de lançar TABLE_ALREADY_EXISTS código de status.
- [FAÍSCA-41219][SQL] IntegralDivide usa decimal(1, 0) para representar 0
- Atualizações de segurança do sistema operacional.
- 31 de janeiro de 2023
- Os tipos de tabela de tabelas JDBC agora são EXTERNOS por padrão.
- [FAÍSCA-41379][SS][PYTHON] Fornecer sessão de faísca clonada no DataFrame na função de usuário para o coletor foreachBatch no PySpark
- 18 de janeiro de 2023
- O conector Sinapse do Azure agora retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres inválidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace
. - [FAÍSCA-41198][SS] Corrigir métricas em consultas de streaming com origem de streaming CTE e DSv1
- [FAÍSCA-41862][SQL] Corrigir bug de correção relacionado aos valores DEFAULT no leitor Orc
- [FAÍSCA-41539][SQL] Remapear estatísticas e restrições em relação à saída no plano lógico para LogicalRDD
- [FAÍSCA-41199][SS] Corrigir problema de métricas quando a fonte de streaming DSv1 e a fonte de streaming DSv2 são cousadas
- [FAÍSCA-41339][SQL] Feche e recrie o lote de gravação do RocksDB em vez de apenas limpar
- [FAÍSCA-41732][SQL][SS] Aplicar poda baseada em padrão de árvore para a regra SessionWindowing
- [FAÍSCA-38277][SS] Limpar lote de gravação após a confirmação do armazenamento de estado do RocksDB
- Atualizações de segurança do sistema operacional.
- O conector Sinapse do Azure agora retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres inválidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
- 29 de novembro de 2022
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
-
csvignoreleadingwhitespace
, quando definido comotrue
, remove o espaço em branco à esquerda dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
. -
csvignoretrailingwhitespace
, quando definido comotrue
, remove o espaço em branco à direita dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
.
-
- Corrigido um bug com a análise JSON no Auto Loader quando todas as colunas eram deixadas como strings (
cloudFiles.inferColumnTypes
não estava definido ou definido comofalse
) e o JSON continha objetos aninhados. -
[FAÍSCA-40906][SQL]
Mode
deve copiar as teclas antes de inserir no Mapa - Atualizações de segurança do sistema operacional.
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
- 15 de novembro de 2022
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhorado, defina
spark.sql.json.enablePartialResults
comotrue
. O sinalizador é desativado por padrão para preservar o comportamento original - [FAÍSCA-40618][SQL] Corrigir bug na regra MergeScalarSubqueries com subconsultas aninhadas usando o rastreamento de referência
- [FAÍSCA-40697][SQL] Adicionar preenchimento de caracteres do lado de leitura para cobrir arquivos de dados externos
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhorado, defina
- 1 de novembro de 2022
- Apache commons-text atualizado para 1.10.0.
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
_change_type
, mas o feed de dados Change estivesse desabilitado nessa tabela, os dados nessa coluna seriam preenchidos incorretamente com valores NULL durante a execuçãoMERGE
. - Corrigido um problema em que a execução
MERGE
e o uso de exatamente 99 colunas da fonte na condição podiam resultar emjava.lang.ClassCastException: org.apache.spark.sql.vectorized.ColumnarBatch cannot be cast to org.apache.spark.sql.catalyst.InternalRow
. - Corrigido um problema com o Auto Loader em que um ficheiro podia ser duplicado no mesmo microlote quando
allowOverwrites
estava ativado - [FAÍSCA-40596][CORE] Preencher ExecutorDecommission com mensagens em ExecutorDecommissionInfo
- Atualizações de segurança do sistema operacional.
- 19 de outubro de 2022
- Corrigido um problema com o uso do COPY INTO com credenciais temporárias em clusters/armazéns habilitados para o Unity Catalog.
- [FAÍSCA-40213][SQL] Suporta conversão de valor ASCII para caracteres latino-1
- Atualizações de segurança do sistema operacional.
- 5 de outubro de 2022
- Os usuários podem definir spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") para reativar a listagem nativa do Auto Loader no ADLS Gen2. A listagem nativa foi desativada anteriormente devido a problemas de desempenho, mas pode ter levado a um aumento nos custos de armazenamento para os clientes. Esta alteração foi implementada para DBR 10.4 e 9.1 na atualização de manutenção anterior.
- [FAÍSCA-40315][SQL]Suporte url encode/decode como função integrada e arrumar funções relacionadas a url
-
[FAÍSCA-40156][SQL]
url_decode()
se o retornar uma classe de erro - [FAÍSCA-40169] Não pressione filtros Parquet sem referência ao esquema de dados
-
[FAÍSCA-40460][SS] Corrigir métricas de streaming ao selecionar
_metadata
- [FAÍSCA-40468][SQL] Corrigir remoção de coluna em CSV quando _corrupt_record é selecionado
- [FAÍSCA-40055][SQL] listCatalogs também deve retornar spark_catalog mesmo quando spark_catalog implementação é defaultSessionCatalog
- Atualizações de segurança do sistema operacional.
- 22 de setembro de 2022
- [FAÍSCA-40315][SQL] Adicionar hashCode() para Literal de ArrayBasedMapData
- [FAÍSCA-40389][SQL] As casas decimais não podem ser convertidas como tipos integrais se a transmissão puder transbordar
- [FAÍSCA-40380][SQL] Corrija a dobragem constante de InvokeLike para evitar literais não serializáveis incorporados no plano
- [FAÍSCA-40066][SQL][ACOMPANHAMENTO] Verifique se o ElementAt está resolvido antes de obter seu dataType
- [FAÍSCA-40109][SQL] Nova função SQL: get()
- [FAÍSCA-40066][SQL] Modo ANSI: sempre retornar null no acesso inválido à coluna do mapa
- [FAÍSCA-40089][SQL] Corrigir a classificação para alguns tipos decimais
- [FAÍSCA-39887][SQL] RemoveRedundantAliases deve manter aliases que tornam a saída dos nós de projeção exclusiva
- [FAÍSCA-40152][SQL] Corrigir split_part problema de compilação de codegen
- [FAÍSCA-40235][CORE] Use o bloqueio interruptível em vez de sincronizado em Executor.updateDependencies()
- [FAÍSCA-40212][SQL] SparkSQL castPartValue não manipula corretamente byte, curto ou float
- [FAÍSCA-40218][SQL] OS CONJUNTOS DE AGRUPAMENTO devem preservar as colunas de agrupamento
- [FAÍSCA-35542][ML] Correção: Bucketizer criado para várias colunas com parâmetros
- [FAÍSCA-40079] Adicionar validação de inputCols do Imputer para caso de entrada vazio
- [FAÍSCA-39912]SPARK-39828[SQL] Refinar CatalogImpl
Tempo de execução do Databricks 11.1 (EoS)
Consulte Databricks Runtime 11.1 (EoS).
31 de janeiro de 2023
- [FAÍSCA-41379][SS][PYTHON] Fornecer sessão de faísca clonada no DataFrame na função de usuário para o coletor foreachBatch no PySpark
- Correções de bugs diversos.
18 de janeiro de 2023
- O conector Sinapse do Azure agora retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres inválidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace
. - [FAÍSCA-41198][SS] Corrigir métricas em consultas de streaming com origem de streaming CTE e DSv1
- [FAÍSCA-41862][SQL] Corrigir bug de correção relacionado aos valores DEFAULT no leitor Orc
- [FAÍSCA-41199][SS] Corrigir problema de métricas quando a fonte de streaming DSv1 e a fonte de streaming DSv2 são cousadas
- [FAÍSCA-41339][SQL] Feche e recrie o lote de gravação do RocksDB em vez de apenas limpar
- [FAÍSCA-41732][SQL][SS] Aplicar poda baseada em padrão de árvore para a regra SessionWindowing
- [FAÍSCA-38277][SS] Limpar lote de gravação após a confirmação do armazenamento de estado do RocksDB
- Atualizações de segurança do sistema operacional.
- O conector Sinapse do Azure agora retorna uma mensagem de erro mais descritiva quando um nome de coluna contém caracteres inválidos, como espaços em branco ou ponto-e-vírgula. Nesses casos, a seguinte mensagem será retornada:
29 de novembro de 2022
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
-
csvignoreleadingwhitespace
, quando definido comotrue
, remove o espaço em branco à esquerda dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
. -
csvignoretrailingwhitespace
, quando definido comotrue
, remove o espaço em branco à direita dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
.
-
- Corrigido um bug com a análise JSON no Auto Loader quando todas as colunas eram deixadas como strings (
cloudFiles.inferColumnTypes
não estava definido ou definido comofalse
) e o JSON continha objetos aninhados. - [FAÍSCA-39650][SS] Corrigir esquema de valor incorreto na desduplicação de streaming com compatibilidade com versões anteriores
- Atualizações de segurança do sistema operacional.
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
15 de novembro de 2022
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhorado, defina
spark.sql.json.enablePartialResults
comotrue
. O sinalizador é desativado por padrão para preservar o comportamento original - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhorado, defina
1 de novembro de 2022
- Apache commons-text atualizado para 1.10.0.
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
_change_type
, mas o feed de dados Change estivesse desabilitado nessa tabela, os dados nessa coluna seriam preenchidos incorretamente com valores NULL durante a execuçãoMERGE
. - Corrigido um problema em que a execução
MERGE
e o uso de exatamente 99 colunas da fonte na condição podiam resultar emjava.lang.ClassCastException: org.apache.spark.sql.vectorized.ColumnarBatch cannot be cast to org.apache.spark.sql.catalyst.InternalRow
. - Corrigido um problema com o Auto Loader em que um ficheiro podia ser duplicado no mesmo microlote quando
allowOverwrites
estava ativado - [FAÍSCA-40697][SQL] Adicionar preenchimento de caracteres do lado de leitura para cobrir arquivos de dados externos
- [FAÍSCA-40596][CORE] Preencher ExecutorDecommission com mensagens em ExecutorDecommissionInfo
- Atualizações de segurança do sistema operacional.
18 de outubro de 2022
- Corrigido um problema com o uso do COPY INTO com credenciais temporárias em clusters/armazéns habilitados para o Unity Catalog.
- [FAÍSCA-40213][SQL] Suporta conversão de valor ASCII para caracteres latino-1
- Atualizações de segurança do sistema operacional.
5 de outubro de 2022
- Os usuários podem definir spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") para reativar a listagem nativa do Auto Loader no ADLS Gen2. A listagem nativa foi desativada anteriormente devido a problemas de desempenho, mas pode ter levado a um aumento nos custos de armazenamento para os clientes. Esta alteração foi implementada para DBR 10.4 e 9.1 na atualização de manutenção anterior.
- [FAÍSCA-40169] Não pressione filtros Parquet sem referência ao esquema de dados
-
[FAÍSCA-40460][SS] Corrigir métricas de streaming ao selecionar
_metadata
- [FAÍSCA-40468][SQL] Corrigir remoção de coluna em CSV quando _corrupt_record é selecionado
- [FAÍSCA-40055][SQL] listCatalogs também deve retornar spark_catalog mesmo quando spark_catalog implementação é defaultSessionCatalog
- Atualizações de segurança do sistema operacional.
22 de setembro de 2022
- [FAÍSCA-40315][SQL] Adicionar hashCode() para Literal de ArrayBasedMapData
- [FAÍSCA-40380][SQL] Corrija a dobragem constante de InvokeLike para evitar literais não serializáveis incorporados no plano
- [FAÍSCA-40089][SQL] Corrigir a classificação para alguns tipos decimais
- [FAÍSCA-39887][SQL] RemoveRedundantAliases deve manter aliases que tornam a saída dos nós de projeção exclusiva
- [FAÍSCA-40152][SQL] Corrigir split_part problema de compilação de codegen
6 de setembro de 2022
- Atualizamos o modelo de permissão em Controles de Acesso à Tabela (ACLs de Tabela) para que apenas as permissões MODIFY sejam necessárias para alterar o esquema ou as propriedades da tabela de uma tabela com ALTER TABLE. Anteriormente, essas operações exigiam que um usuário fosse o proprietário da tabela. A propriedade ainda é necessária para conceder permissões em uma tabela, alterar seu proprietário, alterar seu local ou renomeá-la. Essa alteração torna o modelo de permissão para ACLs de tabela mais consistente com o Catálogo Unity.
- [FAÍSCA-40235][CORE] Use o bloqueio interruptível em vez de sincronizado em Executor.updateDependencies()
- [FAÍSCA-40212][SQL] SparkSQL castPartValue não manipula corretamente byte, curto ou float
- [FAÍSCA-40218][SQL] OS CONJUNTOS DE AGRUPAMENTO devem preservar as colunas de agrupamento
- [FAÍSCA-39976][SQL] ArrayIntersect deve manipular null na expressão esquerda corretamente
-
[FAÍSCA-40053][CORE][SQL][TESTES] Adicionar
assume
a casos de cancelamento dinâmico que exigem ambiente de tempo de execução Python - [FAÍSCA-35542][CORE][ML] Correção: Bucketizer criado para várias colunas com parâmetros splitsArray, inputCols e outputCols não pode ser carregado depois de salvá-lo
- [FAÍSCA-40079][CORE] Adicionar validação de inputCols do Imputer para caso de entrada vazio
24 de agosto de 2022
- Compartilhamentos, provedores e destinatários agora oferecem suporte a comandos SQL para alterar proprietários, comentar, renomear
- [FAÍSCA-39983][CORE][SQL] Não armazenar em cache relações de difusão não serializadas no driver
- [FAÍSCA-39912][FAÍSCA-39828][SQL] Refinar CatalogImpl
- [FAÍSCA-39775][CORE][AVRO] Desabilitar a validação de valores padrão ao analisar esquemas Avro
- [FAÍSCA-39806] Corrigido o problema em consultas que acessam METADATA struct crash em tabelas particionadas
- [FAÍSCA-39867][SQL] O limite global não deve herdar OrderPreservingUnaryNode
- [FAÍSCA-39962][PYTHON][SQL] Aplicar projeção quando os atributos de grupo estiverem vazios
- [FAÍSCA-39839][SQL] Lidar com maiúsculas e minúsculas de comprimento variável nulo Decimal com deslocamento diferente de zeroAndSize na verificação de integridade estrutural UnsafeRow
- [FAÍSCA-39713][SQL] Modo ANSI: adicionar sugestão de uso de try_element_at para erro INVALID_ARRAY_INDEX
- [FAÍSCA-39847][SS] Corrija a condição de corrida em RocksDBLoader.loadLibrary() se o thread do chamador for interrompido
- [FAÍSCA-39731][SQL] Corrigir problema em fontes de dados CSV e JSON ao analisar datas no formato "yyyyMMdd" com a política do analisador de tempo CORRIGIDO
- Atualizações de segurança do sistema operacional.
10 de agosto de 2022
- Para tabelas Delta com controle de acesso a tabelas, a evolução automática do esquema por meio de instruções DML como
INSERT
eMERGE
agora está disponível para todos os usuários que têmMODIFY
permissões nessas tabelas. Além disso, as permissões necessárias para executar a evoluçãoCOPY INTO
do esquema agora são reduzidas deOWNER
para paraMODIFY
consistência com outros comandos. Essas alterações tornam o modelo de segurança da ACL da tabela mais consistente com o modelo de segurança do Unity Catalog, bem como com outras operações, como a substituição de uma tabela. - [FAÍSCA-39889] Melhorar a mensagem de erro de divisão por 0
- [FAÍSCA-39795] [SQL] Nova função SQL: try_to_timestamp
- [FAÍSCA-39749] Sempre use a representação de cadeia de caracteres simples na conversão decimal como cadeia de caracteres no modo ANSI
- [FAÍSCA-39625] Renomear df.as para df.to
- [FAÍSCA-39787] [SQL] Use a classe de erro no erro de análise da função to_timestamp
- [FAÍSCA-39625] [SQL] Adicionar Dataset.as(StructType)
-
[FAÍSCA-39689] Suporte a 2 caracteres na fonte de
lineSep
dados CSV - [FAÍSCA-39579] [SQL][PYTHON][R] Tornar ListFunctions/getFunction/functionExists compatível com namespace de 3 camadas
- [FAÍSCA-39702] [CORE] Reduza a sobrecarga de memória de TransportCipher$EncryptedMessage usando um byteRawChannel compartilhado
- [FAÍSCA-39575] [AVRO] adicionar ByteBuffer#rewind após ByteBuffer#get em AvroDeserializer
- [FAÍSCA-39265] [SQL] Corrigir falha de teste quando SPARK_ANSI_SQL_MODE está ativado
- [FAÍSCA-39441] [SQL] Acelere a Desduplicação de Relações
- [FAÍSCA-39497] [SQL] Melhorar a exceção de análise da coluna de chave de mapa ausente
- [FAÍSCA-39476] [SQL] Desative a otimização do Unwrap cast ao transmitir de Long para Float/Double ou de Integer para Float
- [FAÍSCA-39434] [SQL] Fornecer contexto de consulta de erro de tempo de execução quando o índice de matriz estiver fora dos limites
- Para tabelas Delta com controle de acesso a tabelas, a evolução automática do esquema por meio de instruções DML como
Databricks Runtime 11.0 (EoS)
Consulte Databricks Runtime 11.0 (EoS).
- 29 de novembro de 2022
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
-
csvignoreleadingwhitespace
, quando definido comotrue
, remove o espaço em branco à esquerda dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
. -
csvignoretrailingwhitespace
, quando definido comotrue
, remove o espaço em branco à direita dos valores durante as gravações quandotempformat
está definido comoCSV
ouCSV GZIP
. Os espaços em branco são mantidos quando a configuração é definida comofalse
. Por predefinição, o valor étrue
.
-
- Corrigido um bug com a análise JSON no Auto Loader quando todas as colunas eram deixadas como strings (
cloudFiles.inferColumnTypes
não estava definido ou definido comofalse
) e o JSON continha objetos aninhados. - [FAÍSCA-39650][SS] Corrigir esquema de valor incorreto na desduplicação de streaming com compatibilidade com versões anteriores
- Atualizações de segurança do sistema operacional.
- Os usuários podem configurar o comportamento dos espaços em branco à esquerda e à direita ao gravar dados usando o conector Redshift. As seguintes opções foram adicionadas para controlar o manuseio de espaços em branco:
- 15 de novembro de 2022
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhorado, defina
spark.sql.json.enablePartialResults
comotrue
. O sinalizador é desativado por padrão para preservar o comportamento original.
-
[FAÍSCA-40646] A análise JSON para structs, maps e arrays foi corrigida, portanto, quando uma parte de um registro não corresponde ao esquema, o restante do registro ainda pode ser analisado corretamente em vez de retornar nulos. Para optar pelo comportamento melhorado, defina
- 1 de novembro de 2022
- Apache commons-text atualizado para 1.10.0.
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
_change_type
, mas o feed de dados Change estivesse desabilitado nessa tabela, os dados nessa coluna seriam preenchidos incorretamente com valores NULL durante a execuçãoMERGE
. - Corrigido um problema com o Auto Loader em que um ficheiro podia ser duplicado no mesmo microlote quando
allowOverwrites
estava ativado - [FAÍSCA-40697][SQL] Adicionar preenchimento de caracteres do lado de leitura para cobrir arquivos de dados externos
- [FAÍSCA-40596][CORE] Preencher ExecutorDecommission com mensagens em ExecutorDecommissionInfo
- Atualizações de segurança do sistema operacional.
- 18 de outubro de 2022
- [FAÍSCA-40213][SQL] Suporta conversão de valor ASCII para caracteres latino-1
- Atualizações de segurança do sistema operacional.
- 5 de outubro de 2022
- Os usuários podem definir spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") para reativar a listagem nativa do Auto Loader no ADLS Gen2. A listagem nativa foi desativada anteriormente devido a problemas de desempenho, mas pode ter levado a um aumento nos custos de armazenamento para os clientes. Esta alteração foi implementada para DBR 10.4 e 9.1 na atualização de manutenção anterior.
- [FAÍSCA-40169] Não pressione filtros Parquet sem referência ao esquema de dados
-
[FAÍSCA-40460][SS] Corrigir métricas de streaming ao selecionar
_metadata
- [FAÍSCA-40468][SQL] Corrigir remoção de coluna em CSV quando _corrupt_record é selecionado
- Atualizações de segurança do sistema operacional.
- 22 de setembro de 2022
- [FAÍSCA-40315][SQL] Adicionar hashCode() para Literal de ArrayBasedMapData
- [FAÍSCA-40380][SQL] Corrija a dobragem constante de InvokeLike para evitar literais não serializáveis incorporados no plano
- [FAÍSCA-40089][SQL] Corrigir a classificação para alguns tipos decimais
- [FAÍSCA-39887][SQL] RemoveRedundantAliases deve manter aliases que tornam a saída dos nós de projeção exclusiva
- [FAÍSCA-40152][SQL] Corrigir split_part problema de compilação de codegen
- 6 de setembro de 2022
- [FAÍSCA-40235][CORE] Use o bloqueio interruptível em vez de sincronizado em Executor.updateDependencies()
- [FAÍSCA-40212][SQL] SparkSQL castPartValue não manipula corretamente byte, curto ou float
- [FAÍSCA-40218][SQL] OS CONJUNTOS DE AGRUPAMENTO devem preservar as colunas de agrupamento
- [FAÍSCA-39976][SQL] ArrayIntersect deve manipular null na expressão esquerda corretamente
-
[FAÍSCA-40053][CORE][SQL][TESTES] Adicionar
assume
a casos de cancelamento dinâmico que exigem ambiente de tempo de execução Python - [FAÍSCA-35542][CORE][ML] Correção: Bucketizer criado para várias colunas com parâmetros splitsArray, inputCols e outputCols não pode ser carregado depois de salvá-lo
- [FAÍSCA-40079][CORE] Adicionar validação de inputCols do Imputer para caso de entrada vazio
- 24 de agosto de 2022
- [FAÍSCA-39983][CORE][SQL] Não armazenar em cache relações de difusão não serializadas no driver
- [FAÍSCA-39775][CORE][AVRO] Desabilitar a validação de valores padrão ao analisar esquemas Avro
- [FAÍSCA-39806] Corrigido o problema em consultas que acessam METADATA struct crash em tabelas particionadas
- [FAÍSCA-39867][SQL] O limite global não deve herdar OrderPreservingUnaryNode
- [FAÍSCA-39962][PYTHON][SQL] Aplicar projeção quando os atributos de grupo estiverem vazios
- Atualizações de segurança do sistema operacional.
- 9 de agosto de 2022
- [FAÍSCA-39713][SQL] Modo ANSI: adicionar sugestão de uso de try_element_at para erro INVALID_ARRAY_INDEX
- [FAÍSCA-39847] Corrija a condição de corrida em RocksDBLoader.loadLibrary() se o thread do chamador for interrompido
- [FAÍSCA-39731][SQL] Corrigir problema em fontes de dados CSV e JSON ao analisar datas no formato "yyyyMMdd" com a política do analisador de tempo CORRIGIDO
- [FAÍSCA-39889] Melhorar a mensagem de erro de divisão por 0
- [FAÍSCA-39795][SQL] Nova função SQL: try_to_timestamp
- [FAÍSCA-39749] Sempre use a representação de cadeia de caracteres simples na conversão decimal como cadeia de caracteres no modo ANSI
- [FAÍSCA-39625][SQL] Adicionar Dataset.to(StructType)
- [FAÍSCA-39787][SQL] Use a classe de erro no erro de análise da função to_timestamp
- Atualizações de segurança do sistema operacional.
- 27 de julho de 2022
-
[FAÍSCA-39689]Suporte a 2 caracteres na fonte de
lineSep
dados CSV - [FAÍSCA-39104][SQL] InMemoryRelation#isCachedColumnBuffersLoaded deve ser thread-safe
- [FAÍSCA-39702][CORE] Reduza a sobrecarga de memória de TransportCipher$EncryptedMessage usando um byteRawChannel compartilhado
- [FAÍSCA-39575][AVRO] adicionar ByteBuffer#rewind após ByteBuffer#get em AvroDeserializer
- [FAÍSCA-39497][SQL] Melhorar a exceção de análise da coluna de chave de mapa ausente
- [FAÍSCA-39441][SQL] Acelere a Desduplicação de Relações
- [FAÍSCA-39476][SQL] Desative a otimização do Unwrap cast ao transmitir de Long para Float/Double ou de Integer para Float
- [FAÍSCA-39434][SQL] Fornecer contexto de consulta de erro de tempo de execução quando o índice de matriz estiver fora dos limites
- [FAÍSCA-39570][SQL] A tabela embutida deve permitir expressões com alias
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-39689]Suporte a 2 caracteres na fonte de
- 13 de julho de 2022
- Torne os resultados da operação Delta MERGE consistentes quando a origem não for determinística.
- Corrigido um problema para o TVF cloud_files_state quando executado em caminhos não-DBFS.
- Desabilitado o uso do Auto Loader de APIs de nuvem nativas para listagem de diretórios no Azure.
- [FAÍSCA-38796][SQL] Atualizar to_number e try_to_number funções para permitir RP com números positivos
- [FAÍSCA-39272][SQL] Aumentar a posição inicial do contexto de consulta em 1
- [FAÍSCA-39419][SQL] Corrija ArraySort para lançar uma exceção quando o comparador retornar null
- Atualizações de segurança do sistema operacional.
- 5 de julho de 2022
- Melhoria nas mensagens de erro para uma variedade de classes de erro.
- [FAÍSCA-39451][SQL] Suporte a intervalos de fundição para integrais no modo ANSI
- [FAÍSCA-39361] Não use o padrão de conversão throwable estendido do Log4J2 nas configurações de log padrão
-
[FAÍSCA-39354][SQL] Certifique-se de mostrar
Table or view not found
mesmo que hajadataTypeMismatchError
relacionados aoFilter
mesmo tempo - [FAÍSCA-38675][CORE] Corrigir corrida durante o desbloqueio no BlockInfoManager
- [FAÍSCA-39392][SQL] Refine mensagens de erro ANSI para dicas de função try_*
- [FAÍSCA-39214][SQL][3.3] Melhorar os erros relacionados com o CAST
- [FAÍSCA-37939][SQL] Usar classes de erro na análise de erros de propriedades
-
[FAÍSCA-39085][SQL] Mova a mensagem de erro de
INCONSISTENT_BEHAVIOR_CROSS_VERSION
para error-classes.json - [FAÍSCA-39376][SQL] Ocultar colunas duplicadas na expansão em estrela do alias de subconsulta de NATURAL/USING JOIN
- [FAÍSCA-39283][CORE] Corrigir impasse entre TaskMemoryManager e UnsafeExternalSorter.SpillableIterator
- [FAÍSCA-39285][SQL] O Spark não deve verificar nomes de campos ao ler arquivos
- Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 10.5 (EoS)
Consulte Databricks Runtime 10.5 (EoS).
- 1 de novembro de 2022
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
_change_type
, mas o feed de dados Change estivesse desabilitado nessa tabela, os dados nessa coluna seriam preenchidos incorretamente com valores NULL durante a execuçãoMERGE
. - [FAÍSCA-40697][SQL] Adicionar preenchimento de caracteres do lado de leitura para cobrir arquivos de dados externos
- [FAÍSCA-40596][CORE] Preencher ExecutorDecommission com mensagens em ExecutorDecommissionInfo
- Atualizações de segurança do sistema operacional.
- Corrigido um problema em que, se uma tabela Delta tivesse uma coluna definida pelo usuário chamada
- 18 de outubro de 2022
- Atualizações de segurança do sistema operacional.
- 5 de outubro de 2022
- Os usuários podem definir spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") para reativar a listagem nativa do Auto Loader no ADLS Gen2. A listagem nativa foi desativada anteriormente devido a problemas de desempenho, mas pode ter levado a um aumento nos custos de armazenamento para os clientes. Esta alteração foi implementada para DBR 10.4 e 9.1 na atualização de manutenção anterior.
- reload4j foi atualizado para 1.2.19 para corrigir vulnerabilidades.
-
[FAÍSCA-40460][SS] Corrigir métricas de streaming ao selecionar
_metadata
- [FAÍSCA-40468][SQL] Corrigir remoção de coluna em CSV quando _corrupt_record é selecionado
- Atualizações de segurança do sistema operacional.
- 22 de setembro de 2022
- [FAÍSCA-40315][SQL] Adicionar hashCode() para Literal de ArrayBasedMapData
- [FAÍSCA-40213][SQL] Suporta conversão de valor ASCII para caracteres latino-1
- [FAÍSCA-40380][SQL] Corrija a dobragem constante de InvokeLike para evitar literais não serializáveis incorporados no plano
- [FAÍSCA-38404][SQL] Melhorar a resolução de CTE quando uma CTE aninhada faz referência a uma CTE externa
- [FAÍSCA-40089][SQL] Corrigir a classificação para alguns tipos decimais
- [FAÍSCA-39887][SQL] RemoveRedundantAliases deve manter aliases que tornam a saída dos nós de projeção exclusiva
- Atualizações de segurança do sistema operacional.
- 6 de setembro de 2022
- [FAÍSCA-40235][CORE] Use o bloqueio interruptível em vez de sincronizado em Executor.updateDependencies()
- [FAÍSCA-39976][SQL] ArrayIntersect deve manipular null na expressão esquerda corretamente
-
[FAÍSCA-40053][CORE][SQL][TESTES] Adicionar
assume
a casos de cancelamento dinâmico que exigem ambiente de tempo de execução Python - [FAÍSCA-35542][CORE][ML] Correção: Bucketizer criado para várias colunas com parâmetros splitsArray, inputCols e outputCols não pode ser carregado depois de salvá-lo
- [FAÍSCA-40079][CORE] Adicionar validação de inputCols do Imputer para caso de entrada vazio
- 24 de agosto de 2022
- [FAÍSCA-39983][CORE][SQL] Não armazenar em cache relações de difusão não serializadas no driver
- [FAÍSCA-39775][CORE][AVRO] Desabilitar a validação de valores padrão ao analisar esquemas Avro
- [FAÍSCA-39806] Corrigido o problema em consultas que acessam METADATA struct crash em tabelas particionadas
- [FAÍSCA-39962][PYTHON][SQL] Aplicar projeção quando os atributos de grupo estiverem vazios
- [FAÍSCA-37643][SQL] quando charVarcharAsString é true, para consulta de predicado de tipo de dados char deve ignorar a regra rpadding
- Atualizações de segurança do sistema operacional.
- 9 de agosto de 2022
- [FAÍSCA-39847] Corrija a condição de corrida em RocksDBLoader.loadLibrary() se o thread do chamador for interrompido
- [FAÍSCA-39731][SQL] Corrigir problema em fontes de dados CSV e JSON ao analisar datas no formato "yyyyMMdd" com a política do analisador de tempo CORRIGIDO
- Atualizações de segurança do sistema operacional.
- 27 de julho de 2022
- [FAÍSCA-39625][SQL] Adicionar Dataset.as(StructType)
-
[FAÍSCA-39689]Suporte a 2 caracteres na fonte de
lineSep
dados CSV - [FAÍSCA-39104][SQL] InMemoryRelation#isCachedColumnBuffersLoaded deve ser thread-safe
- [FAÍSCA-39570][SQL] A tabela embutida deve permitir expressões com alias
- [FAÍSCA-39702][CORE] Reduza a sobrecarga de memória de TransportCipher$EncryptedMessage usando um byteRawChannel compartilhado
- [FAÍSCA-39575][AVRO] adicionar ByteBuffer#rewind após ByteBuffer#get em AvroDeserializer
- [FAÍSCA-39476][SQL] Desative a otimização do Unwrap cast ao transmitir de Long para Float/Double ou de Integer para Float
- Atualizações de segurança do sistema operacional.
- 13 de julho de 2022
- Torne os resultados da operação Delta MERGE consistentes quando a origem não for determinística.
- [FAÍSCA-39355][SQL] Uma única coluna usa aspas para construir UnresolvedAttribute
- [FAÍSCA-39548][SQL] Comando CreateView com uma consulta de cláusula de janela atingiu uma definição de janela errada não encontrado problema
- [FAÍSCA-39419][SQL] Corrija ArraySort para lançar uma exceção quando o comparador retornar null
- Desabilitado o uso do Auto Loader de APIs de nuvem nativas para listagem de diretórios no Azure.
- Atualizações de segurança do sistema operacional.
- 5 de julho de 2022
- [FAÍSCA-39376][SQL] Ocultar colunas duplicadas na expansão em estrela do alias de subconsulta de NATURAL/USING JOIN
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2022
- [FAÍSCA-39283][CORE] Corrigir impasse entre TaskMemoryManager e UnsafeExternalSorter.SpillableIterator
- [FAÍSCA-39285][SQL] O Spark não deve verificar nomes de campos ao ler arquivos
- [FAÍSCA-34096][SQL] Melhorar o desempenho para nth_value ignorar nulos na janela de deslocamento
-
[FAÍSCA-36718][SQL][ACOMPANHAMENTO] Corrigir o
isExtractOnly
check-in CollapseProject
- 2 de junho de 2022
- [FAÍSCA-39166][SQL] Fornecer contexto de consulta de erro de tempo de execução para aritmética binária quando o WSCG estiver desativado
- [FAÍSCA-39093][SQL] Evite erros de compilação de codegen ao dividir intervalos de ano e mês ou intervalos de tempo de dia por uma integral
- [FAÍSCA-38990][SQL] Evite NullPointerException ao avaliar o formato date_trunc/trunc como uma referência acoplada
- Atualizações de segurança do sistema operacional.
- 18 de maio de 2022
- Corrige uma possível fuga de memória nativa no Auto Loader.
- [FAÍSCA-38868][SQL]Não propague exceções do predicado do filtro ao otimizar junções externas
- [FAÍSCA-38796][SQL] Implementar as funções to_number e try_to_number SQL de acordo com uma nova especificação
- [FAÍSCA-38918][SQL] A remoção de coluna aninhada deve filtrar atributos que não pertencem à relação atual
- [FAÍSCA-38929][SQL] Melhorar mensagens de erro para falhas de transmissão no ANSI
- [FAÍSCA-38926][SQL] Tipos de saída em mensagens de erro no estilo SQL
- [FAÍSCA-39084][PYSPARK] Corrija df.rdd.isEmpty() usando TaskContext para parar o iterador na conclusão da tarefa
- [FAÍSCA-32268][SQL] Adicionar ColumnPruning em injectBloomFilter
- [FAÍSCA-38908][SQL] Fornecer contexto de consulta no erro de tempo de execução de Transmissão de String para Number/Date/Timestamp/Boolean
- [FAÍSCA-39046][SQL] Retornar uma cadeia de caracteres de contexto vazia se TreeNode.origin estiver definido incorretamente
- [FAÍSCA-38974][SQL] Filtrar funções registradas com um determinado nome de banco de dados em funções de lista
- [FAÍSCA-38762][SQL] Fornecer contexto de consulta em erros de estouro decimal
- [FAÍSCA-38931][SS] Crie diretório dfs raiz para RocksDBFileManager com número desconhecido de chaves no 1º ponto de verificação
- [FAÍSCA-38992][CORE] Evite usar bash -c em ShellBasedGroupsMappingProvider
- [FAÍSCA-38716][SQL] Fornecer contexto de consulta na chave de mapa não existe erro
- [FAÍSCA-38889][SQL] Compilar filtros de coluna booleana para usar o tipo de bit para a fonte de dados MSSQL
- [FAÍSCA-38698][SQL] Fornecer contexto de consulta no erro de tempo de execução de Divide/Div/Reminder/Pmod
-
[FAÍSCA-38823][SQL] Tornar
NewInstance
não dobrável para corrigir o problema de corrupção do buffer de agregação - [FAÍSCA-38809][SS] Implementar opção para ignorar valores nulos na implementação de hash simétrico de junções de fluxo de fluxo
- [FAÍSCA-38676][SQL] Fornecer contexto de consulta SQL na mensagem de erro de tempo de execução de Adicionar/Subtrair/Multiplicar
- [FAÍSCA-38677][PYSPARK] Python MonitorThread deve detetar deadlock devido ao bloqueio de E/S
- Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 10.3 (EoS)
Consulte Databricks Runtime 10.3 (EoS).
- 27 de julho de 2022
-
[FAÍSCA-39689]Suporte a 2 caracteres na fonte de
lineSep
dados CSV - [FAÍSCA-39104][SQL] InMemoryRelation#isCachedColumnBuffersLoaded deve ser thread-safe
- [FAÍSCA-39702][CORE] Reduza a sobrecarga de memória de TransportCipher$EncryptedMessage usando um byteRawChannel compartilhado
- Atualizações de segurança do sistema operacional.
-
[FAÍSCA-39689]Suporte a 2 caracteres na fonte de
- 20 de julho de 2022
- Torne os resultados da operação Delta MERGE consistentes quando a origem não for determinística.
- [FAÍSCA-39476][SQL] Desative a otimização do Unwrap cast ao transmitir de Long para Float/Double ou de Integer para Float
- [FAÍSCA-39548][SQL] Comando CreateView com uma consulta de cláusula de janela atingiu uma definição de janela errada não encontrado problema
- [FAÍSCA-39419][SQL] Corrija ArraySort para lançar uma exceção quando o comparador retornar null
- Atualizações de segurança do sistema operacional.
- 5 de julho de 2022
- [FAÍSCA-39376][SQL] Ocultar colunas duplicadas na expansão em estrela do alias de subconsulta de NATURAL/USING JOIN
- Atualizações de segurança do sistema operacional.
- 15 de junho de 2022
- [FAÍSCA-39283][CORE] Corrigir impasse entre TaskMemoryManager e UnsafeExternalSorter.SpillableIterator
- [FAÍSCA-39285][SQL] O Spark não deve verificar nomes de campos ao ler arquivos
- [FAÍSCA-34096][SQL] Melhorar o desempenho para nth_value ignorar nulos na janela de deslocamento
-
[FAÍSCA-36718][SQL][ACOMPANHAMENTO] Corrigir o
isExtractOnly
check-in CollapseProject
- 2 de junho de 2022
- [FAÍSCA-38990][SQL] Evite NullPointerException ao avaliar o formato date_trunc/trunc como uma referência acoplada
- Atualizações de segurança do sistema operacional.
- 18 de maio de 2022
- Corrige uma possível fuga de memória nativa no Auto Loader.
- [FAÍSCA-38918][SQL] A remoção de coluna aninhada deve filtrar atributos que não pertencem à relação atual
- [FAÍSCA-37593][CORE] Reduza o tamanho da página padrão em LONG_ARRAY_OFFSET se G1GC e ON_HEAP forem usados
- [FAÍSCA-39084][PYSPARK] Corrija df.rdd.isEmpty() usando TaskContext para parar o iterador na conclusão da tarefa
- [FAÍSCA-32268][SQL] Adicionar ColumnPruning em injectBloomFilter
- [FAÍSCA-38974][SQL] Filtrar funções registradas com um determinado nome de banco de dados em funções de lista
- [FAÍSCA-38889][SQL] Compilar filtros de coluna booleana para usar o tipo de bit para a fonte de dados MSSQL
- Atualizações de segurança do sistema operacional.
- 4 de maio de 2022
- Java AWS SDK atualizado da versão 1.11.655 para 1.12.1899.
- 19 de abril de 2022
- [FAÍSCA-38616][SQL] Acompanhe o texto da consulta SQL no Catalyst TreeNode
- Atualizações de segurança do sistema operacional.
- 6 de abril de 2022
- [FAÍSCA-38631][CORE] Usa implementação baseada em Java para un-tarring em Utils.unpack
- Atualizações de segurança do sistema operacional.
- 22 de março de 2022
- Alterado o diretório de trabalho atual de blocos de anotações em clusters de alta simultaneidade com controle de acesso à tabela ou passagem de credenciais habilitado para o diretório base do usuário. Anteriormente, o diretório de trabalho era
/databricks/driver
. - [FAÍSCA-38437][SQL] Serialização leniente de datetime a partir da fonte de dados
- [FAÍSCA-38180][SQL] Permitir expressões upcast seguras em predicados de igualdade correlacionados
- [FAÍSCA-38155][SQL] Não permitir agregados distintos em subconsultas laterais com predicados sem suporte
- [FAÍSCA-38325][SQL] Modo ANSI: evite possíveis erros de tempo de execução em HashJoin.extractKeyExprAt()
- Alterado o diretório de trabalho atual de blocos de anotações em clusters de alta simultaneidade com controle de acesso à tabela ou passagem de credenciais habilitado para o diretório base do usuário. Anteriormente, o diretório de trabalho era
- 14 de março de 2022
- Melhor deteção de conflitos de transações para transações vazias no Delta Lake.
- [FAÍSCA-38185][SQL] Corrigir dados incorretos se a função agregada estiver vazia
- [FAÍSCA-38318]Regressão [SQL] ao substituir uma exibição de conjunto de dados
- [FAÍSCA-38236][SQL] Os caminhos de arquivo absolutos especificados na tabela create/alter são tratados como relativos
- [FAÍSCA-35937][SQL] A extração do campo de data e hora do carimbo de data/hora deve funcionar no modo ANSI
-
[FAÍSCA-34069][SQL] Tarefas de barreira de morte devem respeitar
SPARK_JOB_INTERRUPT_ON_CANCEL
- [FAÍSCA-37707][SQL] Permitir atribuição de armazenamento entre TimestampNTZ e Data/Carimbo de Hora
- 23 de fevereiro de 2022
- [FAÍSCA-27442][SQL] Remover o nome do campo de verificação ao ler/gravar dados no parquet
Tempo de execução do Databricks 10.2 (EoS)
Consulte Databricks Runtime 10.2 (EoS).
- 15 de junho de 2022
- [FAÍSCA-39283][CORE] Corrigir impasse entre TaskMemoryManager e UnsafeExternalSorter.SpillableIterator
- [FAÍSCA-39285][SQL] O Spark não deve verificar nomes de campos ao ler arquivos
- [FAÍSCA-34096][SQL] Melhorar o desempenho para nth_value ignorar nulos na janela de deslocamento
- 2 de junho de 2022
- [FAÍSCA-38918][SQL] A remoção de coluna aninhada deve filtrar atributos que não pertencem à relação atual
- [FAÍSCA-38990][SQL] Evite NullPointerException ao avaliar o formato date_trunc/trunc como uma referência acoplada
- Atualizações de segurança do sistema operacional.
- 18 de maio de 2022
- Corrige uma possível fuga de memória nativa no Auto Loader.
- [FAÍSCA-39084][PYSPARK] Corrija df.rdd.isEmpty() usando TaskContext para parar o iterador na conclusão da tarefa
- [FAÍSCA-38889][SQL] Compilar filtros de coluna booleana para usar o tipo de bit para a fonte de dados MSSQL
- [FAÍSCA-38931][SS] Crie diretório dfs raiz para RocksDBFileManager com número desconhecido de chaves no 1º ponto de verificação
- Atualizações de segurança do sistema operacional.
- 4 de maio de 2022
- Java AWS SDK atualizado da versão 1.11.655 para 1.12.1899.
- 19 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
- 6 de abril de 2022
- [FAÍSCA-38631][CORE] Usa implementação baseada em Java para un-tarring em Utils.unpack
- Atualizações de segurança do sistema operacional.
- 22 de março de 2022
- Alterado o diretório de trabalho atual de blocos de anotações em clusters de alta simultaneidade com controle de acesso à tabela ou passagem de credenciais habilitado para o diretório base do usuário. Anteriormente, o diretório de trabalho era
/databricks/driver
. - [FAÍSCA-38437][SQL] Serialização leniente de datetime a partir da fonte de dados
- [FAÍSCA-38180][SQL] Permitir expressões upcast seguras em predicados de igualdade correlacionados
- [FAÍSCA-38155][SQL] Não permitir agregados distintos em subconsultas laterais com predicados sem suporte
- [FAÍSCA-38325][SQL] Modo ANSI: evite possíveis erros de tempo de execução em HashJoin.extractKeyExprAt()
- Alterado o diretório de trabalho atual de blocos de anotações em clusters de alta simultaneidade com controle de acesso à tabela ou passagem de credenciais habilitado para o diretório base do usuário. Anteriormente, o diretório de trabalho era
- 14 de março de 2022
- Melhor deteção de conflitos de transações para transações vazias no Delta Lake.
- [FAÍSCA-38185][SQL] Corrigir dados incorretos se a função agregada estiver vazia
- [FAÍSCA-38318]Regressão [SQL] ao substituir uma exibição de conjunto de dados
- [FAÍSCA-38236][SQL] Os caminhos de arquivo absolutos especificados na tabela create/alter são tratados como relativos
- [FAÍSCA-35937][SQL] A extração do campo de data e hora do carimbo de data/hora deve funcionar no modo ANSI
-
[FAÍSCA-34069][SQL] Tarefas de barreira de morte devem respeitar
SPARK_JOB_INTERRUPT_ON_CANCEL
- [FAÍSCA-37707][SQL] Permitir atribuição de armazenamento entre TimestampNTZ e Data/Carimbo de Hora
- 23 de fevereiro de 2022
- [FAÍSCA-37577][SQL] Fix ClassCastException: ArrayType não pode ser convertido para StructType para gerar poda
- 8 de fevereiro de 2022
- [FAÍSCA-27442][SQL] Remova o nome do campo de verificação ao ler/gravar dados no parquet.
- Atualizações de segurança do sistema operacional.
- 1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
- 26 de janeiro de 2022
- Corrigido um bug em que transações simultâneas em tabelas Delta podiam ser confirmadas em uma ordem não serializável sob certas condições raras.
- Corrigido um bug em que o comando OTIMIZE podia falhar quando o dialeto ANSI SQL estava habilitado.
- 19 de janeiro de 2022
- Introduzido suporte para inserir credenciais temporárias em COPY INTO para carregar os dados de origem sem exigir permissões de ANY_FILE SQL
- Correções de bugs e melhorias de segurança.
- 20 de dezembro de 2021
- Corrigido um bug raro com a filtragem baseada no índice de coluna Parquet.
Tempo de execução do Databricks 10.1 (EoS)
Consulte Databricks Runtime 10.1 (EoS).
- 15 de junho de 2022
- [FAÍSCA-39283][CORE] Corrigir impasse entre TaskMemoryManager e UnsafeExternalSorter.SpillableIterator
- [FAÍSCA-39285][SQL] O Spark não deve verificar nomes de campos ao ler arquivos
- [FAÍSCA-34096][SQL] Melhorar o desempenho para nth_value ignorar nulos na janela de deslocamento
- 2 de junho de 2022
- Atualizações de segurança do sistema operacional.
- 18 de maio de 2022
- Corrige uma possível fuga de memória nativa no Auto Loader.
- [FAÍSCA-39084][PYSPARK] Corrija df.rdd.isEmpty() usando TaskContext para parar o iterador na conclusão da tarefa
- [FAÍSCA-38889][SQL] Compilar filtros de coluna booleana para usar o tipo de bit para a fonte de dados MSSQL
- Atualizações de segurança do sistema operacional.
- 19 de abril de 2022
- [FAÍSCA-37270][SQL] Corrigir push foldable em CaseWhen ramificações se elseValue estiver vazio
- Atualizações de segurança do sistema operacional.
- 6 de abril de 2022
- [FAÍSCA-38631][CORE] Usa implementação baseada em Java para un-tarring em Utils.unpack
- Atualizações de segurança do sistema operacional.
- 22 de março de 2022
- [FAÍSCA-38437][SQL] Serialização leniente de datetime a partir da fonte de dados
- [FAÍSCA-38180][SQL] Permitir expressões upcast seguras em predicados de igualdade correlacionados
- [FAÍSCA-38155][SQL] Não permitir agregados distintos em subconsultas laterais com predicados sem suporte
- [FAÍSCA-38325][SQL] Modo ANSI: evite possíveis erros de tempo de execução em HashJoin.extractKeyExprAt()
- 14 de março de 2022
- Melhor deteção de conflitos de transações para transações vazias no Delta Lake.
- [FAÍSCA-38185][SQL] Corrigir dados incorretos se a função agregada estiver vazia
- [FAÍSCA-38318]Regressão [SQL] ao substituir uma exibição de conjunto de dados
- [FAÍSCA-38236][SQL] Os caminhos de arquivo absolutos especificados na tabela create/alter são tratados como relativos
- [FAÍSCA-35937][SQL] A extração do campo de data e hora do carimbo de data/hora deve funcionar no modo ANSI
-
[FAÍSCA-34069][SQL] Tarefas de barreira de morte devem respeitar
SPARK_JOB_INTERRUPT_ON_CANCEL
- [FAÍSCA-37707][SQL] Permitir atribuição de armazenamento entre TimestampNTZ e Data/Carimbo de Hora
- 23 de fevereiro de 2022
- [FAÍSCA-37577][SQL] Fix ClassCastException: ArrayType não pode ser convertido para StructType para gerar poda
- 8 de fevereiro de 2022
- [FAÍSCA-27442][SQL] Remova o nome do campo de verificação ao ler/gravar dados no parquet.
- Atualizações de segurança do sistema operacional.
- 1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
- 26 de janeiro de 2022
- Corrigido um bug em que transações simultâneas em tabelas Delta podiam ser confirmadas em uma ordem não serializável sob certas condições raras.
- Corrigido um bug em que o comando OTIMIZE podia falhar quando o dialeto ANSI SQL estava habilitado.
- 19 de janeiro de 2022
- Introduzido suporte para inserir credenciais temporárias em COPY INTO para carregar os dados de origem sem exigir permissões de ANY_FILE SQL
- Corrigido um problema de falta de memória com o cache de resultados da consulta sob determinadas condições.
- Corrigido um problema quando
USE DATABASE
um usuário alterna o catálogo atual para um catálogo não padrão. - Correções de bugs e melhorias de segurança.
- Atualizações de segurança do sistema operacional.
- 20 de dezembro de 2021
- Corrigido um bug raro com a filtragem baseada no índice de coluna Parquet.
Tempo de execução do Databricks 10.0 (EoS)
Consulte Databricks Runtime 10.0 (EoS).
- 19 de abril de 2022
- [FAÍSCA-37270][SQL] Corrigir push foldable em CaseWhen ramificações se elseValue estiver vazio
- Atualizações de segurança do sistema operacional.
- 6 de abril de 2022
- [FAÍSCA-38631][CORE] Usa implementação baseada em Java para un-tarring em Utils.unpack
- Atualizações de segurança do sistema operacional.
- 22 de março de 2022
- [FAÍSCA-38437][SQL] Serialização leniente de datetime a partir da fonte de dados
- [FAÍSCA-38180][SQL] Permitir expressões upcast seguras em predicados de igualdade correlacionados
- [FAÍSCA-38155][SQL] Não permitir agregados distintos em subconsultas laterais com predicados sem suporte
- [FAÍSCA-38325][SQL] Modo ANSI: evite possíveis erros de tempo de execução em HashJoin.extractKeyExprAt()
- 14 de março de 2022
- Melhor deteção de conflitos de transações para transações vazias no Delta Lake.
- [FAÍSCA-38185][SQL] Corrigir dados incorretos se a função agregada estiver vazia
- [FAÍSCA-38318]Regressão [SQL] ao substituir uma exibição de conjunto de dados
- [FAÍSCA-38236][SQL] Os caminhos de arquivo absolutos especificados na tabela create/alter são tratados como relativos
- [FAÍSCA-35937][SQL] A extração do campo de data e hora do carimbo de data/hora deve funcionar no modo ANSI
-
[FAÍSCA-34069][SQL] Tarefas de barreira de morte devem respeitar
SPARK_JOB_INTERRUPT_ON_CANCEL
- [FAÍSCA-37707][SQL] Permitir atribuição de armazenamento entre TimestampNTZ e Data/Carimbo de Hora
- 23 de fevereiro de 2022
- [FAÍSCA-37577][SQL] Fix ClassCastException: ArrayType não pode ser convertido para StructType para gerar poda
- 8 de fevereiro de 2022
- [FAÍSCA-27442][SQL] Remova o nome do campo de verificação ao ler/gravar dados no parquet.
- [FAÍSCA-36905][SQL] Corrigir a leitura de vistas da secção sem nomes de colunas explícitos
- [FAÍSCA-37859][SQL] Corrigir problema que as tabelas SQL criadas com JDBC com Spark 3.1 não são legíveis com 3.2
- Atualizações de segurança do sistema operacional.
- 1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
- 26 de janeiro de 2022
- Corrigido um bug em que transações simultâneas em tabelas Delta podiam ser confirmadas em uma ordem não serializável sob certas condições raras.
- Corrigido um bug em que o comando OTIMIZE podia falhar quando o dialeto ANSI SQL estava habilitado.
- 19 de janeiro de 2022
- Correções de bugs e melhorias de segurança.
- Atualizações de segurança do sistema operacional.
- 20 de dezembro de 2021
- Corrigido um bug raro com a filtragem baseada no índice de coluna Parquet.
- 9 de novembro de 2021
- Introduziu sinalizadores de configuração adicionais para permitir o controle refinado de comportamentos ANSI.
- 4 de novembro de 2021
- Corrigido um bug que poderia fazer com que os fluxos de streaming estruturado falhassem com um ArrayIndexOutOfBoundsException
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: No FileSystem for scheme
ou que poderia fazer com que as modificaçõessparkContext.hadoopConfiguration
não tivessem efeito nas consultas. - O Apache Spark Connector for Delta Sharing foi atualizado para 0.2.0.
- 30 de novembro de 2021
- Corrigido um problema com a análise de carimbo de data/hora em que uma cadeia de caracteres de fuso horário sem dois pontos era considerada inválida.
- Corrigido um problema de falta de memória com o cache de resultados da consulta sob determinadas condições.
- Corrigido um problema quando
USE DATABASE
um usuário alterna o catálogo atual para um catálogo não padrão.
Tempo de execução do Databricks 9.0 (EoS)
Consulte Databricks Runtime 9.0 (EoS).
- 8 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
- 1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
- 26 de janeiro de 2022
- Corrigido um bug em que o comando OTIMIZE podia falhar quando o dialeto ANSI SQL estava habilitado.
- 19 de janeiro de 2022
- Correções de bugs e melhorias de segurança.
- Atualizações de segurança do sistema operacional.
- 4 de novembro de 2021
- Corrigido um bug que poderia fazer com que os fluxos de streaming estruturado falhassem com um ArrayIndexOutOfBoundsException
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: No FileSystem for scheme
ou que poderia fazer com que as modificaçõessparkContext.hadoopConfiguration
não tivessem efeito nas consultas. - O Apache Spark Connector for Delta Sharing foi atualizado para 0.2.0.
- 22 de setembro de 2021
- Corrigido um bug na matriz cast Spark com null to string
- 15 de setembro de 2021
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: org.apache.spark.SparkException: Failed to get broadcast_x_piecey of broadcast_x
.
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
- 8 de setembro de 2021
- Adicionado suporte para nome do esquema (
databaseName.schemaName.tableName
formato) como o nome da tabela de destino para o Azure Synapse Connector. - Adicionado suporte a tipos JDBC de geometria e geografia para Spark SQL.
- [FAÍSCA-33527][SQL] Ampliou a função de decodificação para ser consistente com os bancos de dados convencionais.
-
[FAÍSCA-36532][CORE][3.1] Bloqueio
CoarseGrainedExecutorBackend.onDisconnected
corrigido para evitarexecutorsconnected
o bloqueio do desligamento do executor.
- Adicionado suporte para nome do esquema (
- 25 de agosto de 2021
- A biblioteca de drivers do SQL Server foi atualizada para 9.2.1.jre8.
- O conector Snowflake foi atualizado para 2.9.0.
- Corrigido link quebrado para o melhor bloco de anotações de avaliação na página de experimento AutoML.
Tempo de execução do Databricks 8.4 (EoS)
Consulte Databricks Runtime 8.4 (EoS).
- 19 de janeiro de 2022
- Atualizações de segurança do sistema operacional.
- 4 de novembro de 2021
- Corrigido um bug que poderia fazer com que os fluxos de streaming estruturado falhassem com um ArrayIndexOutOfBoundsException
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: No FileSystem for scheme
ou que poderia fazer com que as modificaçõessparkContext.hadoopConfiguration
não tivessem efeito nas consultas. - O Apache Spark Connector for Delta Sharing foi atualizado para 0.2.0.
- 22 de setembro de 2021
- O driver JDBC Spark foi atualizado para 2.6.19.1030
- [FAÍSCA-36734][SQL] Atualize o ORC para 1.5.1
- 15 de setembro de 2021
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: org.apache.spark.SparkException: Failed to get broadcast_x_piecey of broadcast_x
. - Atualizações de segurança do sistema operacional.
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
- 8 de setembro de 2021
-
[FAÍSCA-36532][CORE][3.1] Bloqueio
CoarseGrainedExecutorBackend.onDisconnected
corrigido para evitarexecutorsconnected
o bloqueio do desligamento do executor.
-
[FAÍSCA-36532][CORE][3.1] Bloqueio
- 25 de agosto de 2021
- A biblioteca de drivers do SQL Server foi atualizada para 9.2.1.jre8.
- O conector Snowflake foi atualizado para 2.9.0.
- Corrige um bug na passagem de credenciais causado pela nova otimização de pré-busca do Parquet, em que a credencial de passagem do usuário pode não ser encontrada durante o acesso ao arquivo.
- 11 de agosto de 2021
- Corrige um problema de incompatibilidade do RocksDB que impede o Databricks Runtime 8.4 mais antigo. Isso corrige a compatibilidade direta para o Auto Loader
COPY INTO
e aplicativos de streaming com monitoração de estado. - Corrige um bug ao usar o Auto Loader para ler arquivos CSV com arquivos de cabeçalho incompatíveis. Se os nomes das colunas não corresponderem, a coluna será preenchida com nulos. Agora, se um esquema for fornecido, ele assumirá que o esquema é o mesmo e só salvará incompatibilidades de coluna se as colunas de dados resgatadas estiverem habilitadas.
- Adiciona uma nova opção chamada
externalDataSource
no conector Synapse do Azure para remover oCONTROL
requisito de permissão no banco de dados para leitura do PolyBase.
- Corrige um problema de incompatibilidade do RocksDB que impede o Databricks Runtime 8.4 mais antigo. Isso corrige a compatibilidade direta para o Auto Loader
- 29 de julho de 2021
- [FAÍSCA-36034][CONSTRUIR] Rebaseie a datetime em filtros empurrados para baixo para Parquet
-
[FAÍSCA-36163][CONSTRUIR] Propagar propriedades JDBC corretas no provedor de conector JDBC e adicionar
connectionProvider
opção
Tempo de execução do Databricks 8.3 (EoS)
Consulte Databricks Runtime 8.3 (EoS).
- 19 de janeiro de 2022
- Atualizações de segurança do sistema operacional.
- 4 de novembro de 2021
- Corrigido um bug que poderia fazer com que os fluxos de streaming estruturado falhassem com um ArrayIndexOutOfBoundsException
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: No FileSystem for scheme
ou que poderia fazer com que as modificaçõessparkContext.hadoopConfiguration
não tivessem efeito nas consultas.
- 22 de setembro de 2021
- O driver JDBC Spark foi atualizado para 2.6.19.1030
- 15 de setembro de 2021
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: org.apache.spark.SparkException: Failed to get broadcast_x_piecey of broadcast_x
. - Atualizações de segurança do sistema operacional.
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
- 8 de setembro de 2021
- [FAÍSCA-35700][SQL][WARMFIX] Leia char/varchar orc table quando criado e escrito por sistemas externos.
-
[FAÍSCA-36532][CORE][3.1] Bloqueio
CoarseGrainedExecutorBackend.onDisconnected
corrigido para evitarexecutorsconnected
o bloqueio do desligamento do executor.
- 25 de agosto de 2021
- A biblioteca de drivers do SQL Server foi atualizada para 9.2.1.jre8.
- O conector Snowflake foi atualizado para 2.9.0.
- Corrige um bug na passagem de credenciais causado pela nova otimização de pré-busca do Parquet, em que a credencial de passagem do usuário pode não ser encontrada durante o acesso ao arquivo.
- 11 de agosto de 2021
- Corrige um bug ao usar o Auto Loader para ler arquivos CSV com arquivos de cabeçalho incompatíveis. Se os nomes das colunas não corresponderem, a coluna será preenchida com nulos. Agora, se um esquema for fornecido, ele assumirá que o esquema é o mesmo e só salvará incompatibilidades de coluna se as colunas de dados resgatadas estiverem habilitadas.
- 29 de julho de 2021
- Atualize o conector Databricks Snowflake Spark para 2.9.0-spark-3.1
- [FAÍSCA-36034][CONSTRUIR] Rebaseie a datetime em filtros empurrados para baixo para Parquet
-
[FAÍSCA-36163][CONSTRUIR] Propagar propriedades JDBC corretas no provedor de conector JDBC e adicionar
connectionProvider
opção
- 14 de julho de 2021
- Corrigido um problema ao usar nomes de coluna com pontos no conector Synapse do Azure.
- Introduzido
database.schema.table
o formato para Synapse Connector. - Adicionado suporte para fornecer
databaseName.schemaName.tableName
formato como a tabela de destino em vez de apenasschemaName.tableName
outableName
.
- 15 de junho de 2021
- Corrigido um
NoSuchElementException
bug nas gravações otimizadas do Delta Lake que pode acontecer ao escrever grandes quantidades de dados e encontrar perdas do executor - Adiciona comandos SQL
CREATE GROUP
,DROP GROUP
,ALTER GROUP
,SHOW GROUPS
, eSHOW USERS
. Para obter detalhes, consulte Instruções de segurança e Mostrar instruções.
- Corrigido um
Tempo de execução do Databricks 8.2 (EoS)
Consulte Databricks Runtime 8.2 (EoS).
22 de setembro de 2021
- Atualizações de segurança do sistema operacional.
15 de setembro de 2021
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: org.apache.spark.SparkException: Failed to get broadcast_x_piecey of broadcast_x
.
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
8 de setembro de 2021
- [FAÍSCA-35700][SQL][WARMFIX] Leia char/varchar orc table quando criado e escrito por sistemas externos.
-
[FAÍSCA-36532][CORE][3.1] Bloqueio
CoarseGrainedExecutorBackend.onDisconnected
corrigido para evitarexecutorsconnected
o bloqueio do desligamento do executor.
25 de agosto de 2021
- O conector Snowflake foi atualizado para 2.9.0.
11 de agosto de 2021
- [FAÍSCA-36034][SQL] Rebaseie a datetime em filtros empurrados para baixo para parquet.
29 de julho de 2021
- Atualize o conector Databricks Snowflake Spark para 2.9.0-spark-3.1
-
[FAÍSCA-36163][CONSTRUIR] Propagar propriedades JDBC corretas no provedor de conector JDBC e adicionar
connectionProvider
opção
14 de julho de 2021
- Corrigido um problema ao usar nomes de coluna com pontos no conector Synapse do Azure.
- Introduzido
database.schema.table
o formato para Synapse Connector. - Adicionado suporte para fornecer
databaseName.schemaName.tableName
formato como a tabela de destino em vez de apenasschemaName.tableName
outableName
. - Corrigido um bug que impedia os usuários de viajar no tempo para versões disponíveis mais antigas com tabelas Delta.
15 de junho de 2021
- Corrige um
NoSuchElementException
bug nas gravações otimizadas do Delta Lake que podem acontecer ao gravar grandes quantidades de dados e encontrar perdas do executor
- Corrige um
26 de maio de 2021
- Python atualizado com patch de segurança para corrigir a vulnerabilidade de segurança do Python (CVE-2021-3177).
30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- [FAÍSCA-34245][CORE] Certifique-se de que o Mestre remove os executores que não conseguiram enviar o estado concluído
- Corrigido um problema de OOM quando o Auto Loader relata métricas de progresso do Streaming Estruturado.
Tempo de execução do Databricks 8.1 (EoS)
Consulte Databricks Runtime 8.1 (EoS).
22 de setembro de 2021
- Atualizações de segurança do sistema operacional.
15 de setembro de 2021
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: org.apache.spark.SparkException: Failed to get broadcast_x_piecey of broadcast_x
.
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
8 de setembro de 2021
- [FAÍSCA-35700][SQL][WARMFIX] Leia char/varchar orc table quando criado e escrito por sistemas externos.
-
[FAÍSCA-36532][CORE][3.1] Bloqueio
CoarseGrainedExecutorBackend.onDisconnected
corrigido para evitarexecutorsconnected
o bloqueio do desligamento do executor.
25 de agosto de 2021
- O conector Snowflake foi atualizado para 2.9.0.
11 de agosto de 2021
- [FAÍSCA-36034][SQL] Rebaseie a datetime em filtros empurrados para baixo para parquet.
29 de julho de 2021
- Atualize o conector Databricks Snowflake Spark para 2.9.0-spark-3.1
-
[FAÍSCA-36163][CONSTRUIR] Propagar propriedades JDBC corretas no provedor de conector JDBC e adicionar
connectionProvider
opção
14 de julho de 2021
- Corrigido um problema ao usar nomes de coluna com pontos no conector Synapse do Azure.
- Corrigido um bug que impedia os usuários de viajar no tempo para versões disponíveis mais antigas com tabelas Delta.
15 de junho de 2021
- Corrige um
NoSuchElementException
bug nas gravações otimizadas do Delta Lake que podem acontecer ao gravar grandes quantidades de dados e encontrar perdas do executor
- Corrige um
26 de maio de 2021
- Python atualizado com patch de segurança para corrigir a vulnerabilidade de segurança do Python (CVE-2021-3177).
30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- Corrigido um problema de OOM quando o Auto Loader relata métricas de progresso do Streaming Estruturado.
27 de abril de 2021
- [FAÍSCA-34245][CORE] Certifique-se de que o Mestre remove os executores que não conseguiram enviar o estado concluído
- [FAÍSCA-34856][SQL] Modo ANSI: permite a transmissão de tipos complexos como tipo de cadeia de caracteres
- [FAÍSCA-35014] Corrigir o padrão PhysicalAggregation para não reescrever expressões dobráveis
- [FAÍSCA-34769][SQL] AnsiTypeCoercion: retorna o tipo conversível mais estreito entre TypeCollection
- [FAÍSCA-34614][SQL] Modo ANSI: Casting String to Boolean lançará exceção no erro de análise
- [FAÍSCA-33794][SQL] Modo ANSI: corrija a expressão NextDay para lançar o tempo de execução IllegalArgumentException ao receber entrada inválida em
Tempo de execução do Databricks 8.0 (EoS)
Consulte Databricks Runtime 8.0 (EoS).
15 de setembro de 2021
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: org.apache.spark.SparkException: Failed to get broadcast_x_piecey of broadcast_x
.
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
25 de agosto de 2021
- O conector Snowflake foi atualizado para 2.9.0.
11 de agosto de 2021
- [FAÍSCA-36034][SQL] Rebaseie a datetime em filtros empurrados para baixo para parquet.
29 de julho de 2021
-
[FAÍSCA-36163][CONSTRUIR] Propagar propriedades JDBC corretas no provedor de conector JDBC e adicionar
connectionProvider
opção
-
[FAÍSCA-36163][CONSTRUIR] Propagar propriedades JDBC corretas no provedor de conector JDBC e adicionar
14 de julho de 2021
- Corrigido um problema ao usar nomes de coluna com pontos no conector Synapse do Azure.
- Corrigido um bug que impedia os usuários de viajar no tempo para versões disponíveis mais antigas com tabelas Delta.
26 de maio de 2021
- Python atualizado com patch de segurança para corrigir a vulnerabilidade de segurança do Python (CVE-2021-3177).
30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- [FAÍSCA-34245][CORE] Certifique-se de que o Mestre remove os executores que não conseguiram enviar o estado concluído
24 de março de 2021
- [SPARK-34681][SQL] Corrigir o erro da associação externa completa de hash aleatório ao compilar o lado esquerdo com condição não igual
- [FAÍSCA-34534] Corrigir ordem blockIds ao usar FetchShuffleBlocks para buscar blocos
- [FAÍSCA-34613][SQL] A visualização de correção não captura a configuração de dica de desativação
9 de março de 2021
-
[FAÍSCA-34543][SQL] Respeite a configuração ao resolver especificações de
spark.sql.caseSensitive
partição na v1SET LOCATION
- [FAÍSCA-34392][SQL] Suporte ZoneOffset +h:mm em DateTimeUtils. getZoneId
- [UI] Corrigir o link href da visualização do Spark DAG
- [FAÍSCA-34436][SQL] Suporte DPP LIKE ANY/ALL expressão
-
[FAÍSCA-34543][SQL] Respeite a configuração ao resolver especificações de
Tempo de execução do Databricks 7.6 (EoS)
Consulte Databricks Runtime 7.6 (EoS).
- 11 de agosto de 2021
- [FAÍSCA-36034][SQL] Rebaseie a datetime em filtros empurrados para baixo para parquet.
- 29 de julho de 2021
- [FAÍSCA-32998][CONSTRUIR] Adicionar capacidade de substituir repositórios remotos padrão apenas com repositórios internos
- 14 de julho de 2021
- Corrigido um bug que impedia os usuários de viajar no tempo para versões disponíveis mais antigas com tabelas Delta.
- 26 de maio de 2021
- Python atualizado com patch de segurança para corrigir a vulnerabilidade de segurança do Python (CVE-2021-3177).
- 30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- [FAÍSCA-34245][CORE] Certifique-se de que o Mestre remove os executores que não conseguiram enviar o estado concluído
- 24 de março de 2021
- [FAÍSCA-34768][SQL] Respeite o tamanho do buffer de entrada padrão no Univocity
- [FAÍSCA-34534] Corrigir ordem blockIds ao usar FetchShuffleBlocks para buscar blocos
- 9 de março de 2021
- (Apenas Azure) Corrigido um bug do Auto Loader que pode causar NullPointerException ao usar o Databricks Runtime 7.6 para executar um fluxo antigo do Auto Loader criado no Databricks Runtime 7.2
- [UI] Corrigir o link href da visualização do Spark DAG
- Desconhecido nó folha SparkPlan não é tratado corretamente em SizeInBytesOnlyStatsSparkPlanVisitor
- Restaure o esquema de saída de
SHOW DATABASES
- [Delta][8.0, 7.6] Corrigido bug de cálculo na lógica de ajuste automático do tamanho do arquivo
- Desativar a verificação de obsoletos para arquivos de tabela Delta no cache de disco
- [SQL] Use a chave de construção de poda dinâmica correta quando a dica de junção de intervalo estiver presente
- Desabilitar o suporte a tipos de char no caminho de código não-SQL
- Evite NPE em DataFrameReader.schema
- Corrigir NPE quando a resposta EventGridClient não tem entidade
- Corrigir um bug de fluxo fechado de leitura no Azure Auto Loader
- [SQL] Não gere conselhos de número de partição aleatório quando o AOS estiver ativado
- 24 de fevereiro de 2021
- Atualizado o conector Spark BigQuery para v0.18, que introduz várias correções de bugs e suporte para iteradores Arrow e Avro.
- Corrigido um problema de correção que fazia com que o Spark retornasse resultados incorretos quando a precisão decimal e a escala do arquivo Parquet eram diferentes do esquema do Spark.
- Corrigido o problema de falha de leitura em tabelas do Microsoft SQL Server que contêm tipos de dados espaciais, adicionando suporte a tipos JDBC de geometria e geografia para o Spark SQL.
- Introduzida uma nova configuração
spark.databricks.hive.metastore.init.reloadFunctions.enabled
. Essa configuração controla a inicialização integrada do Hive. Quando definido como true, o Azure Databricks recarrega todas as funções de todos os bancos de dados que os usuários têm noFunctionRegistry
. Este é o comportamento padrão no Hive Metastore. Quando definido como false, o Azure Databricks desabilita esse processo para otimização. - [FAÍSCA-34212] Corrigidos problemas relacionados à leitura de dados decimais de arquivos Parquet.
- [FAÍSCA-34260][SQL] Corrija UnresolvedException ao criar o modo de exibição temporário duas vezes.
Tempo de execução do Databricks 7.5 (EoS)
Consulte Databricks Runtime 7.5 (EoS).
- 26 de maio de 2021
- Python atualizado com patch de segurança para corrigir a vulnerabilidade de segurança do Python (CVE-2021-3177).
- 30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- [FAÍSCA-34245][CORE] Certifique-se de que o Mestre remove os executores que não conseguiram enviar o estado concluído
- 24 de março de 2021
- [FAÍSCA-34768][SQL] Respeite o tamanho do buffer de entrada padrão no Univocity
- [FAÍSCA-34534] Corrigir ordem blockIds ao usar FetchShuffleBlocks para buscar blocos
- 9 de março de 2021
- (Apenas Azure) Corrigido um bug do Auto Loader que pode fazer com que NullPointerException ao usar o Databricks Runtime 7.5 execute um fluxo antigo do Auto Loader criado no Databricks Runtime 7.2.
- [UI] Corrigir o link href da visualização do Spark DAG
- Desconhecido nó folha SparkPlan não é tratado corretamente em SizeInBytesOnlyStatsSparkPlanVisitor
- Restaure o esquema de saída de
SHOW DATABASES
- Desativar a verificação de obsoletos para arquivos de tabela Delta no cache de disco
- [SQL] Use a chave de construção de poda dinâmica correta quando a dica de junção de intervalo estiver presente
- Desabilitar o suporte a tipos de char no caminho de código não-SQL
- Evite NPE em DataFrameReader.schema
- Corrigir NPE quando a resposta EventGridClient não tem entidade
- Corrigir um bug de fluxo fechado de leitura no Azure Auto Loader
- 24 de fevereiro de 2021
- Atualizado o conector Spark BigQuery para v0.18, que introduz várias correções de bugs e suporte para iteradores Arrow e Avro.
- Corrigido um problema de correção que fazia com que o Spark retornasse resultados incorretos quando a precisão decimal e a escala do arquivo Parquet eram diferentes do esquema do Spark.
- Corrigido o problema de falha de leitura em tabelas do Microsoft SQL Server que contêm tipos de dados espaciais, adicionando suporte a tipos JDBC de geometria e geografia para o Spark SQL.
- Introduzida uma nova configuração
spark.databricks.hive.metastore.init.reloadFunctions.enabled
. Essa configuração controla a inicialização integrada do Hive. Quando definido como true, o Azure Databricks recarrega todas as funções de todos os bancos de dados que os usuários têm noFunctionRegistry
. Este é o comportamento padrão no Hive Metastore. Quando definido como false, o Azure Databricks desabilita esse processo para otimização. - [FAÍSCA-34212] Corrigidos problemas relacionados à leitura de dados decimais de arquivos Parquet.
- [FAÍSCA-34260][SQL] Corrija UnresolvedException ao criar o modo de exibição temporário duas vezes.
- 4 de fevereiro de 2021
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
SELECT * FROM table LIMIT nrows
. A regressão foi experimentada por usuários que executam consultas via ODBC/JDBC com a serialização de seta habilitada. - Introduziu verificações de tempo de gravação no cliente Hive para evitar a corrupção de metadados no metastore do Hive para tabelas Delta.
- Corrigida uma regressão que fazia com que o DBFS FUSE falhasse ao iniciar quando as configurações de variáveis de ambiente de cluster contivessem sintaxe bash inválida.
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
- 20 de janeiro de 2021
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
df.join(df.select($"col" as "new_col"), cond)
- O DataFrame derivado exclui algumas colunas via select, groupBy ou window.
- A condição de junção ou a seguinte transformação após o Dataframe unido refere-se às colunas não comuns. Por exemplo,
df.join(df.drop("a"), df("a") === 1)
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
- 12 de janeiro de 2021
- Atualize o SDK de Armazenamento do Azure de 2.3.8 para 2.3.9.
- [FAÍSCA-33593][SQL] Leitor de vetores tem dados incorretos com valor de partição binária
- [FAÍSCA-33480][SQL] atualiza a mensagem de erro da verificação do comprimento de inserção da tabela char/varchar
Tempo de execução do Databricks 7.3 LTS (EoS)
Consulte Databricks Runtime 7.3 LTS (EoS).
10 de setembro de 2023
- Correções de bugs diversos.
30 de agosto de 2023
- Atualizações de segurança do sistema operacional.
15 de agosto de 2023
- Atualizações de segurança do sistema operacional.
23 de junho de 2023
- A biblioteca Snowflake-jdbc foi atualizada para 3.13.29 para resolver um problema de segurança.
- Atualizações de segurança do sistema operacional.
15 de junho de 2023
-
[FAÍSCA-43413][SQL] Corrija a
IN
anulabilidade da subconsultaListQuery
. - Atualizações de segurança do sistema operacional.
-
[FAÍSCA-43413][SQL] Corrija a
2 de junho de 2023
- Corrigido um problema no Auto Loader em que diferentes formatos de arquivo de origem eram inconsistentes quando o esquema fornecido não incluía partições inferidas. Esse problema pode causar falhas inesperadas ao ler arquivos com colunas ausentes no esquema de partição inferida.
17 de maio de 2023
- Atualizações de segurança do sistema operacional.
25 de abril de 2023
- Atualizações de segurança do sistema operacional.
11 de abril de 2023
- [FAÍSCA-42967][CORE] Corrija SparkListenerTaskStart.stageAttemptId quando uma tarefa é iniciada depois que o estágio é cancelado.
- Correções de bugs diversos.
29 de março de 2023
- Atualizações de segurança do sistema operacional.
14 de Março de 2023
- Correções de bugs diversos.
28 de fevereiro de 2023
- Atualizações de segurança do sistema operacional.
16 de fevereiro de 2023
- Atualizações de segurança do sistema operacional.
31 de janeiro de 2023
- Os tipos de tabela de tabelas JDBC agora são EXTERNOS por padrão.
18 de janeiro de 2023
- Atualizações de segurança do sistema operacional.
29 de novembro de 2022
- Correções de bugs diversos.
15 de novembro de 2022
- Apache commons-text atualizado para 1.10.0.
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
1 de novembro de 2022
- [FAÍSCA-38542][SQL] UnsafeHashedRelation deve serializar numKeys para fora
18 de outubro de 2022
- Atualizações de segurança do sistema operacional.
5 de outubro de 2022
- Correções de bugs diversos.
- Atualizações de segurança do sistema operacional.
22 de setembro de 2022
- [FAÍSCA-40089][SQL] Corrigir a classificação para alguns tipos decimais
6 de setembro de 2022
- [FAÍSCA-35542][CORE][ML] Correção: Bucketizer criado para várias colunas com parâmetros splitsArray, inputCols e outputCols não pode ser carregado depois de salvá-lo
- [FAÍSCA-40079][CORE] Adicionar validação de inputCols do Imputer para caso de entrada vazio
24 de agosto de 2022
- [FAÍSCA-39962][PYTHON][SQL] Aplicar projeção quando os atributos de grupo estiverem vazios
- Atualizações de segurança do sistema operacional.
9 de agosto de 2022
- Atualizações de segurança do sistema operacional.
27 de julho de 2022
- Torne os resultados da operação Delta MERGE consistentes quando a origem não for determinística.
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
13 de julho de 2022
- [FAÍSCA-32680][SQL] Não pré-processe CTAS V2 com consulta não resolvida
- Desabilitado o uso do Auto Loader de APIs de nuvem nativas para listagem de diretórios no Azure.
- Atualizações de segurança do sistema operacional.
5 de julho de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
2 de junho de 2022
- [FAÍSCA-38918][SQL] A remoção de coluna aninhada deve filtrar atributos que não pertencem à relação atual
- Atualizações de segurança do sistema operacional.
18 de maio de 2022
- Atualize a versão do AWS SDK de 1.11.655 para 1.11.678.
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
19 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
6 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
14 de março de 2022
- Remover classes vulneráveis do log4j 1.2.17 jar
- Correções de bugs diversos.
23 de fevereiro de 2022
- [FAÍSCA-37859][SQL] Não verifique se há metadados durante a comparação de esquema
8 de fevereiro de 2022
- Atualize o Ubuntu JDK para 1.8.0.312.
- Atualizações de segurança do sistema operacional.
1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
26 de janeiro de 2022
- Corrigido um bug em que o comando OTIMIZE podia falhar quando o dialeto ANSI SQL estava habilitado.
19 de janeiro de 2022
- O canal padrão Conda é removido do 7.3 ML LTS
- Atualizações de segurança do sistema operacional.
7 de dezembro de 2021
- Atualizações de segurança do sistema operacional.
4 de novembro de 2021
- Corrigido um bug que poderia fazer com que os fluxos de streaming estruturado falhassem com um ArrayIndexOutOfBoundsException
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: No FileSystem for scheme
ou que poderia fazer com que as modificaçõessparkContext.hadoopConfiguration
não tivessem efeito nas consultas.
15 de setembro de 2021
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
java.io.IOException: org.apache.spark.SparkException: Failed to get broadcast_x_piecey of broadcast_x
. - Atualizações de segurança do sistema operacional.
- Corrigida uma condição de corrida que poderia causar uma falha de consulta com um IOException como
8 de setembro de 2021
- [FAÍSCA-35700][SQL][WARMFIX] Leia char/varchar orc table quando criado e escrito por sistemas externos.
-
[FAÍSCA-36532][CORE][3.1] Bloqueio
CoarseGrainedExecutorBackend.onDisconnected
corrigido para evitarexecutorsconnected
o bloqueio do desligamento do executor.
25 de agosto de 2021
- O conector Snowflake foi atualizado para 2.9.0.
29 de julho de 2021
- [FAÍSCA-36034][CONSTRUIR] Rebaseie a datetime em filtros empurrados para baixo para Parquet
-
[FAÍSCA-34508][CONSTRUIR] Ignorar
HiveExternalCatalogVersionsSuite
se a rede estiver inativa
14 de julho de 2021
- Formato introduzido
database.schema.table
para o conector Synapse do Azure. - Adicionado suporte para fornecer
databaseName.schemaName.tableName
formato como a tabela de destino em vez de apenasschemaName.tableName
outableName
. - Corrigido um bug que impedia os usuários de viajar no tempo para versões disponíveis mais antigas com tabelas Delta.
- Formato introduzido
15 de junho de 2021
- Corrige um
NoSuchElementException
bug nas gravações otimizadas do Delta Lake que podem acontecer ao gravar grandes quantidades de dados e encontrar perdas do executor - Python atualizado com patch de segurança para corrigir a vulnerabilidade de segurança do Python (CVE-2021-3177).
- Corrige um
30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- [FAÍSCA-34245][CORE] Certifique-se de que o Mestre remove os executores que não conseguiram enviar o estado concluído
- [FAÍSCA-35045][SQL] Adicionar uma opção interna para controlar o buffer de entrada na univocity
24 de março de 2021
- [FAÍSCA-34768][SQL] Respeite o tamanho do buffer de entrada padrão no Univocity
- [FAÍSCA-34534] Corrigir ordem blockIds ao usar FetchShuffleBlocks para buscar blocos
- [FAÍSCA-33118][SQL]CREATE TEMPORARY TABLE falha com a localização
9 de março de 2021
- O driver atualizado do Sistema de Arquivos de Blob do Azure para o Azure Data Lake Storage Gen2 agora está habilitado por padrão. Traz várias melhorias de estabilidade.
- Corrigir separador de caminho no Windows para
databricks-connect get-jar-dir
- [UI] Corrigir o link href da visualização do Spark DAG
- [DBCONNECT] Adicionar suporte para FlatMapCoGroupsInPandas no Databricks Connect 7.3
- Restaure o esquema de saída de
SHOW DATABASES
- [SQL] Use a chave de construção de poda dinâmica correta quando a dica de junção de intervalo estiver presente
- Desativar a verificação de obsoletos para arquivos de tabela Delta no cache de disco
- [SQL] Não gere conselhos de número de partição aleatório quando o AOS estiver ativado
24 de fevereiro de 2021
- Atualizado o conector Spark BigQuery para v0.18, que introduz várias correções de bugs e suporte para iteradores Arrow e Avro.
- Corrigido um problema de correção que fazia com que o Spark retornasse resultados incorretos quando a precisão decimal e a escala do arquivo Parquet eram diferentes do esquema do Spark.
- Corrigido o problema de falha de leitura em tabelas do Microsoft SQL Server que contêm tipos de dados espaciais, adicionando suporte a tipos JDBC de geometria e geografia para o Spark SQL.
- Introduzida uma nova configuração
spark.databricks.hive.metastore.init.reloadFunctions.enabled
. Essa configuração controla a inicialização integrada do Hive. Quando definido como true, o Azure Databricks recarrega todas as funções de todos os bancos de dados que os usuários têm noFunctionRegistry
. Este é o comportamento padrão no Hive Metastore. Quando definido como false, o Azure Databricks desabilita esse processo para otimização. - [FAÍSCA-34212] Corrigidos problemas relacionados à leitura de dados decimais de arquivos Parquet.
- [FAÍSCA-33579][UI] Corrija a página em branco do executor atrás do proxy.
- [FAÍSCA-20044][UI] Suporte Spark UI atrás de proxy reverso front-end usando um prefixo de caminho.
- [FAÍSCA-33277][PYSPARK][SQL] Use ContextAwareIterator para parar de consumir após o término da tarefa.
4 de fevereiro de 2021
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
SELECT * FROM table LIMIT nrows
. A regressão foi experimentada por usuários que executam consultas via ODBC/JDBC com a serialização de seta habilitada. - Corrigida uma regressão que fazia com que o DBFS FUSE falhasse ao iniciar quando as configurações de variáveis de ambiente de cluster contivessem sintaxe bash inválida.
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
20 de janeiro de 2021
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
df.join(df.select($"col" as "new_col"), cond)
- O DataFrame derivado exclui algumas colunas via select, groupBy ou window.
- A condição de junção ou a seguinte transformação após o Dataframe unido refere-se às colunas não comuns. Por exemplo,
df.join(df.drop("a"), df("a") === 1)
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-33593][SQL] Leitor de vetores tem dados incorretos com valor de partição binária
- [FAÍSCA-33677][SQL] Ignorar regra LikeSimplification se o padrão contiver qualquer escapeChar
- [FAÍSCA-33592][ML][PYTHON] Params do validador Pyspark ML no estimadorParamMaps podem ser perdidos após salvar e recarregar
- [FAÍSCA-33071][FAÍSCA-33536][SQL] Evite alterar dataset_id de LogicalPlan em join() para não quebrar DetectAmbiguousSelfJoin
8 de dezembro de 2020
- [FAÍSCA-33587][CORE] Matar o executor em erros fatais aninhados
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
- [FAÍSCA-33316][SQL] O usuário de suporte forneceu esquema Avro anulável para esquema de catalisador não anulável na gravação Avro
- O Spark Jobs lançado usando o Databricks Connect pode travar indefinidamente com
Executor$TaskRunner.$anonfun$copySessionState
o rastreamento de pilha do executor - Atualizações de segurança do sistema operacional.
1 de dezembro de 2020
-
[FAÍSCA-33404][SQL][3.0] Corrigir resultados incorretos na
date_trunc
expressão - [FAÍSCA-33339][PYTHON] O aplicativo Pyspark travará devido a um erro não Exception
- [FAÍSCA-33183][SQL][HOTFIX] Corrigir a regra do otimizador EliminateSorts e adicionar uma regra física para remover classificações redundantes
- [FAÍSCA-33371][PYTHON][3.0] Atualização setup.py e testes para Python 3.9
- [FAÍSCA-33391][SQL] element_at com CreateArray não respeitam um índice baseado.
- [FAÍSCA-33306][SQL]O fuso horário é necessário quando a data de conversão para a cadeia de caracteres
- [FAÍSCA-33260][SQL] Corrigir resultados incorretos de SortExec quando sortOrder é Stream
-
[FAÍSCA-33404][SQL][3.0] Corrigir resultados incorretos na
5 de novembro de 2020
- Corrigir o bloqueio ABFS e WASB em relação ao
UserGroupInformation.getCurrentUser()
. - Corrija um bug de loop infinito quando o leitor Avro lê os bytes MAGIC.
- Adicione suporte para o privilégio USAGE.
- Melhorias de desempenho para verificação de privilégios no controle de acesso à tabela.
- Corrigir o bloqueio ABFS e WASB em relação ao
13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
- Você pode ler e gravar a partir do DBFS usando a montagem FUSE em /dbfs/ quando estiver em um cluster habilitado para passagem de credenciais de alta simultaneidade. Montagens regulares são suportadas, mas montagens que precisam de credenciais de passagem ainda não são suportadas.
- [FAÍSCA-32999][SQL] Use Utils.getSimpleName para evitar pressionar o nome da classe malformada em TreeNode
- [FAÍSCA-32585][SQL] Suporte a enumeração scala em ScalaReflection
- Diretórios de listagem fixos na montagem FUSE que contêm nomes de arquivo com caracteres XML inválidos
- A montagem FUSE não usa mais ListMultipartUploads
29 de setembro de 2020
- [FAÍSCA-32718][SQL] Remover palavras-chave desnecessárias para unidades de intervalo
- [FAÍSCA-32635][SQL] Corrigir propagação dobrável
- Adicione uma nova configuração
spark.shuffle.io.decoder.consolidateThreshold
. Defina o valor config comoLong.MAX_VALUE
para ignorar a consolidação de netty FrameBuffers, o que impedejava.lang.IndexOutOfBoundsException
em casos de canto.
25 de abril de 2023
- Atualizações de segurança do sistema operacional.
11 de abril de 2023
- Correções de bugs diversos.
29 de março de 2023
- Correções de bugs diversos.
14 de Março de 2023
- Atualizações de segurança do sistema operacional.
28 de fevereiro de 2023
- Atualizações de segurança do sistema operacional.
16 de fevereiro de 2023
- Atualizações de segurança do sistema operacional.
31 de janeiro de 2023
- Correções de bugs diversos.
18 de janeiro de 2023
- Atualizações de segurança do sistema operacional.
29 de novembro de 2022
- Atualizações de segurança do sistema operacional.
15 de novembro de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
1 de novembro de 2022
- Atualizações de segurança do sistema operacional.
18 de outubro de 2022
- Atualizações de segurança do sistema operacional.
- 5 de outubro de 2022
- Atualizações de segurança do sistema operacional.
- 24 de agosto de 2022
- Atualizações de segurança do sistema operacional.
- 9 de agosto de 2022
- Atualizações de segurança do sistema operacional.
- 27 de julho de 2022
- Atualizações de segurança do sistema operacional.
- 5 de julho de 2022
- Atualizações de segurança do sistema operacional.
- 2 de junho de 2022
- Atualizações de segurança do sistema operacional.
- 18 de maio de 2022
- Atualizações de segurança do sistema operacional.
- 19 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
- 6 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
- 14 de março de 2022
- Correções de bugs diversos.
- 23 de fevereiro de 2022
- Correções de bugs diversos.
- 8 de fevereiro de 2022
- Atualize o Ubuntu JDK para 1.8.0.312.
- Atualizações de segurança do sistema operacional.
- 1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
- 19 de janeiro de 2022
- Atualizações de segurança do sistema operacional.
- 22 de setembro de 2021
- Atualizações de segurança do sistema operacional.
- 30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- 12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
- 8 de dezembro de 2020
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
- Atualizações de segurança do sistema operacional.
- 1 de dezembro de 2020
- [FAÍSCA-33260][SQL] Corrigir resultados incorretos de SortExec quando sortOrder é Stream
- 3 de novembro de 2020
- Versão Java atualizada de 1.8.0_252 para 1.8.0_265.
- Corrija o bloqueio ABFS e WASB em relação a UserGroupInformation.getCurrentUser()
- 13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
Suporte estendido (EoS) do Databricks Runtime 6.4
Consulte Databricks Runtime 6.4 (EoS) e Databricks Runtime 6.4 Extended Support (EoS).
5 de julho de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
2 de junho de 2022
- Atualizações de segurança do sistema operacional.
18 de maio de 2022
- Atualizações de segurança do sistema operacional.
19 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
6 de abril de 2022
- Atualizações de segurança do sistema operacional.
- Correções de bugs diversos.
14 de março de 2022
- Remover classes vulneráveis do log4j 1.2.17 jar
- Correções de bugs diversos.
23 de fevereiro de 2022
- Correções de bugs diversos.
8 de fevereiro de 2022
- Atualize o Ubuntu JDK para 1.8.0.312.
- Atualizações de segurança do sistema operacional.
1 de fevereiro de 2022
- Atualizações de segurança do sistema operacional.
26 de janeiro de 2022
- Corrigido um bug em que o comando OTIMIZE podia falhar quando o dialeto ANSI SQL estava habilitado.
19 de janeiro de 2022
- Atualizações de segurança do sistema operacional.
8 de dezembro de 2021
- Atualizações de segurança do sistema operacional.
22 de setembro de 2021
- Atualizações de segurança do sistema operacional.
15 de junho de 2021
- [FAÍSCA-35576][SQL] Redigir as informações confidenciais no resultado do comando Definir
7 de junho de 2021
- Adicione uma nova configuração chamada
spark.sql.maven.additionalRemoteRepositories
, uma configuração de cadeia de caracteres delimitada por vírgulas do espelho maven remoto adicional opcional. O valor padrão é .https://maven-central.storage-download.googleapis.com/maven2/
- Adicione uma nova configuração chamada
30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
9 de março de 2021
- Porta HADOOP-17215 para o driver do Sistema de Arquivos de Blob do Azure (Suporte para substituição condicional).
- Corrigir separador de caminho no Windows para
databricks-connect get-jar-dir
- Adicionado suporte para as versões 2.3.5, 2.3.6 e 2.3.7 do Hive metastore
- Seta "totalResultsCollected" reportada incorretamente após o derrame
24 de fevereiro de 2021
- Introduzida uma nova configuração
spark.databricks.hive.metastore.init.reloadFunctions.enabled
. Essa configuração controla a inicialização integrada do Hive. Quando definido como true, o Azure Databricks recarrega todas as funções de todos os bancos de dados que os usuários têm noFunctionRegistry
. Este é o comportamento padrão no Hive Metastore. Quando definido como false, o Azure Databricks desabilita esse processo para otimização.
- Introduzida uma nova configuração
4 de fevereiro de 2021
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
SELECT * FROM table LIMIT nrows
. A regressão foi experimentada por usuários que executam consultas via ODBC/JDBC com a serialização de seta habilitada. - Corrigida uma regressão que fazia com que o DBFS FUSE falhasse ao iniciar quando as configurações de variáveis de ambiente de cluster contivessem sintaxe bash inválida.
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
8 de dezembro de 2020
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
- [FAÍSCA-33183][SQL] Corrigir a regra do otimizador EliminateSorts e adicionar uma regra física para remover classificações redundantes
- [GPU de 6,4 ML em tempo de execução] Instalamos anteriormente uma versão incorreta (2.7.8-1+cuda11.1) do NCCL. Esta versão corrige-o para 2.4.8-1+cuda10.0 que é compatível com CUDA 10.0.
- Atualizações de segurança do sistema operacional.
1 de dezembro de 2020
- [FAÍSCA-33260][SQL] Corrigir resultados incorretos de SortExec quando sortOrder é Stream
- [FAÍSCA-32635][SQL] Corrigir propagação dobrável
3 de novembro de 2020
- Versão Java atualizada de 1.8.0_252 para 1.8.0_265.
- Corrija o bloqueio ABFS e WASB em relação a UserGroupInformation.getCurrentUser()
- Corrija um bug de loop infinito do leitor Avro ao ler os bytes MAGIC.
13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-32999][SQL][2.4] Use Utils.getSimpleName para evitar pressionar o nome da classe malformada no TreeNode
- Diretórios de listagem fixos na montagem FUSE que contêm nomes de arquivo com caracteres XML inválidos
- A montagem FUSE não usa mais ListMultipartUploads
24 de setembro de 2020
- Corrigida uma limitação anterior em que a passagem no cluster padrão ainda restringia a implementação do sistema de arquivos que o usuário usa. Agora, os usuários poderiam acessar sistemas de arquivos locais sem restrições.
- Atualizações de segurança do sistema operacional.
8 de setembro de 2020
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
maxbinlength
. Este parâmetro é usado para controlar o comprimento da coluna de colunas BinaryType e é traduzido comoVARBINARY(maxbinlength)
. Pode ser definido usando.option("maxbinlength", n)
, onde 0 < n <= 8000. - Atualize o SDK de Armazenamento do Azure para 8.6.4 e habilite o TCP keep alive em conexões feitas pelo driver WASB
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
25 de agosto de 2020
- Resolução de atributos ambíguos fixa na automesclagem
18 de agosto de 2020
- [FAÍSCA-32431][SQL] Verificar colunas aninhadas duplicadas em fontes de dados incorporadas lidas
- Corrigida uma condição de corrida no conector AQS ao usar Trigger.Once.
11 de agosto de 2020
- [FAÍSCA-28676][CORE] Evite o registro excessivo do ContextCleaner
3 de agosto de 2020
- Agora você pode usar a função de transformação LDA em um cluster habilitado para passagem.
- Atualizações de segurança do sistema operacional.
7 de julho de 2020
- Versão Java atualizada de 1.8.0_232 para 1.8.0_252.
21 de abril de 2020
- [FAÍSCA-31312][SQL] Instância de classe de cache para a instância UDF em HiveFunctionWrapper
7 de abril de 2020
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
ARROW_PRE_0_15_IPC_FORMAT=1
) para habilitar o suporte para essas versões do PyArrow. Consulte as instruções em [SPARK-29367].
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
10 de março de 2020
- O dimensionamento automático otimizado agora é usado por padrão em clusters interativos no plano de segurança.
- O conector Snowflake (
spark-snowflake_2.11
) incluído no Databricks Runtime é atualizado para a versão 2.5.9.snowflake-jdbc
é atualizado para a versão 3.12.0.
Tempo de execução do Databricks 5.5 LTS (EoS)
Consulte Databricks Runtime 5.5 LTS (EoS) e Databricks Runtime 5.5 Extended Support (EoS).
8 de dezembro de 2021
- Atualizações de segurança do sistema operacional.
22 de setembro de 2021
- Atualizações de segurança do sistema operacional.
25 de agosto de 2021
- Rebaixou alguns pacotes python atualizados anteriormente na versão de suporte estendido de 5,5 ML para manter uma melhor paridade com 5,5 ML LTS (agora preterido). Consulte [_]/release-notes/runtime/5.5xml.md) para obter as diferenças atualizadas entre as duas versões.
15 de junho de 2021
- [FAÍSCA-35576][SQL] Redigir as informações confidenciais no resultado do comando Definir
7 de junho de 2021
- Adicione uma nova configuração chamada
spark.sql.maven.additionalRemoteRepositories
, uma configuração de cadeia de caracteres delimitada por vírgulas do espelho maven remoto adicional opcional. O valor padrão é .https://maven-central.storage-download.googleapis.com/maven2/
- Adicione uma nova configuração chamada
30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
9 de março de 2021
- Porta HADOOP-17215 para o driver do Sistema de Arquivos de Blob do Azure (Suporte para substituição condicional).
24 de fevereiro de 2021
- Introduzida uma nova configuração
spark.databricks.hive.metastore.init.reloadFunctions.enabled
. Essa configuração controla a inicialização integrada do Hive. Quando definido como true, o Azure Databricks recarrega todas as funções de todos os bancos de dados que os usuários têm noFunctionRegistry
. Este é o comportamento padrão no Hive Metastore. Quando definido como false, o Azure Databricks desabilita esse processo para otimização.
- Introduzida uma nova configuração
12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
- Correção para [HADOOP-17130].
8 de dezembro de 2020
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
- Atualizações de segurança do sistema operacional.
1 de dezembro de 2020
- [FAÍSCA-33260][SQL] Corrigir resultados incorretos de SortExec quando sortOrder é Stream
- [FAÍSCA-32635][SQL] Corrigir propagação dobrável
29 de outubro de 2020
- Versão Java atualizada de 1.8.0_252 para 1.8.0_265.
- Corrija o bloqueio ABFS e WASB em relação a UserGroupInformation.getCurrentUser()
- Corrija um bug de loop infinito do leitor Avro ao ler os bytes MAGIC.
13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-32999][SQL][2.4] Use Utils.getSimpleName para evitar pressionar o nome da classe malformada no TreeNode
24 de setembro de 2020
- Atualizações de segurança do sistema operacional.
8 de setembro de 2020
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
maxbinlength
. Este parâmetro é usado para controlar o comprimento da coluna de colunas BinaryType e é traduzido comoVARBINARY(maxbinlength)
. Pode ser definido usando.option("maxbinlength", n)
, onde 0 < n <= 8000.
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
18 de agosto de 2020
- [FAÍSCA-32431][SQL] Verificar colunas aninhadas duplicadas em fontes de dados incorporadas lidas
- Corrigida uma condição de corrida no conector AQS ao usar Trigger.Once.
11 de agosto de 2020
- [FAÍSCA-28676][CORE] Evite o registro excessivo do ContextCleaner
3 de agosto de 2020
- Atualizações de segurança do sistema operacional
7 de julho de 2020
- Versão Java atualizada de 1.8.0_232 para 1.8.0_252.
21 de abril de 2020
- [FAÍSCA-31312][SQL] Instância de classe de cache para a instância UDF em HiveFunctionWrapper
7 de abril de 2020
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
ARROW_PRE_0_15_IPC_FORMAT=1
) para habilitar o suporte para essas versões do PyArrow. Consulte as instruções em [SPARK-29367].
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
25 de março de 2020
- O conector Snowflake (
spark-snowflake_2.11
) incluído no Databricks Runtime é atualizado para a versão 2.5.9.snowflake-jdbc
é atualizado para a versão 3.12.0.
- O conector Snowflake (
10 de março de 2020
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
spark.databricks.driver.disableScalaOutput
Spark comotrue
. Por padrão, o valor do sinalizador éfalse
. O sinalizador controla a saída da célula para trabalhos JAR Scala e notebooks Scala. Se o sinalizador estiver habilitado, o Spark não retornará os resultados da execução do trabalho para o cliente. O sinalizador não afeta os dados gravados nos arquivos de log do cluster. A definição desse sinalizador é recomendada apenas para clusters automatizados para trabalhos JAR, pois desativará os resultados do bloco de anotações.
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
18 de fevereiro de 2020
- [FAÍSCA-24783][SQL] spark.sql.shuffle.partitions=0 deve lançar exceção
- A passagem de credenciais com o ADLS Gen2 tem uma degradação de desempenho devido ao tratamento local de thread incorreto quando a pré-busca do cliente ADLS está habilitada. Esta versão desativa a pré-busca do ADLS Gen2 quando a passagem de credenciais está habilitada até que tenhamos uma correção adequada.
28 de janeiro de 2020
- [FAÍSCA-30447][SQL] Problema de nulidade de propagação constante.
14/01/2020
- Versão Java atualizada de 1.8.0_222 para 1.8.0_232.
Novembro 19, 2019
- [FAÍSCA-29743] O exemplo [SQL] deve definir needCopyResult como true se o needCopyResult de seu filho for true
- A versão R foi involuntariamente atualizada de 3.6.0 para 3.6.1. Nós o rebaixamos de volta para 3.6.0.
Novembro 5, 2019
- Versão Java atualizada de 1.8.0_212 para 1.8.0_222.
Outubro 23, 2019
- [FAÍSCA-29244][CORE] Impedir página liberada em BytesToBytesMap livre novamente
8 de outubro de 2019
- Alterações do lado do servidor para permitir que o driver ODBC Simba Apache Spark se reconecte e continue após uma falha de conexão durante a busca de resultados (requer o driver ODBC Simba Apache Spark versão 2.6.10).
- Corrigido um problema que afetava o uso do
Optimize
comando com clusters habilitados para ACL de tabela. - Corrigido um problema em que
pyspark.ml
as bibliotecas falhavam devido ao erro proibido do Scala UDF na ACL da tabela e nos clusters habilitados para passagem de credenciais. - Métodos Allowlisted SerDe e SerDeUtil para passagem de credenciais.
- Corrigido NullPointerException ao verificar o código de erro no cliente WASB.
Setembro 24, 2019
- Estabilidade melhorada do escritor Parquet.
- Corrigido o problema de que a consulta Thrift cancelada antes de começar a ser executada pode ficar presa no estado INICIADO.
Setembro 10, 2019
- Adicionar iterador seguro de thread a BytesToBytesMap
- [FAÍSCA-27992][FAÍSCA-28881]Permitir que o Python se junte ao thread de conexão para propagar erros
- Corrigido um bug que afetava determinadas consultas de agregação global.
- Redação de credenciais melhorada.
- [FAÍSCA-27330][SS] tarefa de suporte abortada no gravador foreach
- [FAÍSCA-28642]Ocultar credenciais em SHOW CREATE TABLE
- [FAÍSCA-28699][SQL] Desativar o uso de radix sort para ShuffleExchangeExec no caso de repartição
Agosto 27, 2019
- [FAÍSCA-20906][SQL]Permitir esquema especificado pelo usuário na API to_avro com registro de esquema
- [FAÍSCA-27838][SQL] O usuário de suporte forneceu esquema avro não anulável para esquema de catalisador anulável sem qualquer registro nulo
- Melhoria na viagem no tempo do Lago Delta
- Corrigido um problema que afetava determinadas
transform
expressões - Suporta variáveis de difusão quando o Isolamento de Processos está ativado
Agosto 13, 2019
- A fonte de streaming Delta deve verificar o protocolo mais recente de uma tabela
- [FAÍSCA-28260]Adicionar estado FECHADO a ExecutionState
- [FAÍSCA-28489][SS]Corrija um bug que KafkaOffsetRangeCalculator.getRanges pode deixar offsets
Julho 30, 2019
- [FAÍSCA-28015][SQL] Check stringToDate() consome entrada inteira para os formatos aaaa e aaaa-[m]m
- [FAÍSCA-28308][CORE] A sub-segunda parte de CalendarInterval deve ser preenchida antes da análise
- [FAÍSCA-27485]EnsureRequirements.reorder deve lidar com expressões duplicadas graciosamente
- [FAÍSCA-28355][CORE][PYTHON] Use o Spark conf para o limite no qual o UDF é compactado por broadcast
Suporte estendido a Databricks Light 2.4
Consulte Databricks Light 2.4 (EoS) e Databricks Light 2.4 Extended Support (EoS).
Tempo de execução do Databricks 7.4 (EoS)
Consulte Databricks Runtime 7.4 (EoS).
30 de abril de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-35227][CONSTRUIR] Atualizar o resolvedor para spark-packages no SparkSubmit
- [FAÍSCA-34245][CORE] Certifique-se de que o Mestre remove os executores que não conseguiram enviar o estado concluído
- [FAÍSCA-35045][SQL] Adicione uma opção interna para controlar o buffer de entrada na univocity e uma configuração para o tamanho do buffer de entrada CSV
24 de março de 2021
- [FAÍSCA-34768][SQL] Respeite o tamanho do buffer de entrada padrão no Univocity
- [FAÍSCA-34534] Corrigir ordem blockIds ao usar FetchShuffleBlocks para buscar blocos
9 de março de 2021
- O driver atualizado do Sistema de Arquivos de Blob do Azure para o Azure Data Lake Storage Gen2 agora está habilitado por padrão. Traz várias melhorias de estabilidade.
- [ES-67926][UI] Corrigir o link href da visualização do Spark DAG
- [ES-65064] Restaure o esquema de saída de
SHOW DATABASES
- [SC-70522][SQL] Use a chave de construção de poda dinâmica correta quando a dica de junção de intervalo estiver presente
- [SC-35081] Desativar a verificação de obsoletos para arquivos de tabela Delta no cache de disco
- [SC-70640] Corrigir NPE quando a resposta EventGridClient não tem entidade
- [SC-70220][SQL] Não gere conselhos de número de partição aleatório quando o AOS estiver ativado
24 de fevereiro de 2021
- Atualizado o conector Spark BigQuery para v0.18, que introduz várias correções de bugs e suporte para iteradores Arrow e Avro.
- Corrigido um problema de correção que fazia com que o Spark retornasse resultados incorretos quando a precisão decimal e a escala do arquivo Parquet eram diferentes do esquema do Spark.
- Corrigido o problema de falha de leitura em tabelas do Microsoft SQL Server que contêm tipos de dados espaciais, adicionando suporte a tipos JDBC de geometria e geografia para o Spark SQL.
- Introduzida uma nova configuração
spark.databricks.hive.metastore.init.reloadFunctions.enabled
. Essa configuração controla a inicialização integrada do Hive. Quando definido como true, o Azure Databricks recarrega todas as funções de todos os bancos de dados que os usuários têm noFunctionRegistry
. Este é o comportamento padrão no Hive Metastore. Quando definido como false, o Azure Databricks desabilita esse processo para otimização. - [FAÍSCA-34212] Corrigidos problemas relacionados à leitura de dados decimais de arquivos Parquet.
- [FAÍSCA-33579][UI] Corrija a página em branco do executor atrás do proxy.
- [FAÍSCA-20044][UI] Suporte Spark UI atrás de proxy reverso front-end usando um prefixo de caminho.
- [FAÍSCA-33277][PYSPARK][SQL] Use ContextAwareIterator para parar de consumir após o término da tarefa.
4 de fevereiro de 2021
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
SELECT * FROM table LIMIT nrows
. A regressão foi experimentada por usuários que executam consultas via ODBC/JDBC com a serialização de seta habilitada. - Corrigida uma regressão que fazia com que o DBFS FUSE falhasse ao iniciar quando as configurações de variáveis de ambiente de cluster contivessem sintaxe bash inválida.
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
20 de janeiro de 2021
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
df.join(df.select($"col" as "new_col"), cond)
- O DataFrame derivado exclui algumas colunas via select, groupBy ou window.
- A condição de junção ou a seguinte transformação após o Dataframe unido refere-se às colunas não comuns. Por exemplo,
df.join(df.drop("a"), df("a") === 1)
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-33593][SQL] Leitor de vetores tem dados incorretos com valor de partição binária
- [FAÍSCA-33677][SQL] Ignorar regra LikeSimplification se o padrão contiver qualquer escapeChar
- [FAÍSCA-33071][FAÍSCA-33536][SQL] Evite alterar dataset_id de LogicalPlan em join() para não quebrar DetectAmbiguousSelfJoin
8 de dezembro de 2020
- [FAÍSCA-33587][CORE] Matar o executor em erros fatais aninhados
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
- [FAÍSCA-33316][SQL] O usuário de suporte forneceu esquema Avro anulável para esquema de catalisador não anulável na gravação Avro
- Atualizações de segurança do sistema operacional.
1 de dezembro de 2020
-
[FAÍSCA-33404][SQL][3.0] Corrigir resultados incorretos na
date_trunc
expressão - [FAÍSCA-33339][PYTHON] O aplicativo Pyspark travará devido a um erro não Exception
- [FAÍSCA-33183][SQL][HOTFIX] Corrigir a regra do otimizador EliminateSorts e adicionar uma regra física para remover classificações redundantes
- [FAÍSCA-33371][PYTHON][3.0] Atualização setup.py e testes para Python 3.9
- [FAÍSCA-33391][SQL] element_at com CreateArray não respeitam um índice baseado.
- [FAÍSCA-33306][SQL]O fuso horário é necessário quando a data de conversão para a cadeia de caracteres
- [FAÍSCA-33260][SQL] Corrigir resultados incorretos de SortExec quando sortOrder é Stream
- [FAÍSCA-33272][SQL] eliminar o mapeamento de atributos em QueryPlan.transformUpWithNewOutput
-
[FAÍSCA-33404][SQL][3.0] Corrigir resultados incorretos na
Tempo de execução do Databricks 7.2 (EoS)
Consulte Databricks Runtime 7.2 (EoS).
4 de fevereiro de 2021
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
SELECT * FROM table LIMIT nrows
. A regressão foi experimentada por usuários que executam consultas via ODBC/JDBC com a serialização de seta habilitada. - Corrigida uma regressão que fazia com que o DBFS FUSE falhasse ao iniciar quando as configurações de variáveis de ambiente de cluster contivessem sintaxe bash inválida.
- Corrigida uma regressão que impede a execução incremental de uma consulta que define um limite global, como
20 de janeiro de 2021
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
df.join(df.select($"col" as "new_col"), cond)
- O DataFrame derivado exclui algumas colunas via select, groupBy ou window.
- A condição de junção ou a seguinte transformação após o Dataframe unido refere-se às colunas não comuns. Por exemplo,
df.join(df.drop("a"), df("a") === 1)
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-33593][SQL] Leitor de vetores tem dados incorretos com valor de partição binária
- [FAÍSCA-33677][SQL] Ignorar regra LikeSimplification se o padrão contiver qualquer escapeChar
- [FAÍSCA-33071][FAÍSCA-33536][SQL] Evite alterar dataset_id de LogicalPlan em join() para não quebrar DetectAmbiguousSelfJoin
8 de dezembro de 2020
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
-
[FAÍSCA-33404][SQL] Corrigir resultados incorretos na
date_trunc
expressão - [FAÍSCA-33339][PYTHON] O aplicativo Pyspark travará devido a um erro não Exception
- [FAÍSCA-33183][SQL] Corrigir a regra do otimizador EliminateSorts e adicionar uma regra física para remover classificações redundantes
- [FAÍSCA-33391][SQL] element_at com CreateArray não respeitam um índice baseado.
- Atualizações de segurança do sistema operacional.
1 de dezembro de 2020
- [FAÍSCA-33306][SQL]O fuso horário é necessário quando a data de conversão para a cadeia de caracteres
- [FAÍSCA-33260][SQL] Corrigir resultados incorretos de SortExec quando sortOrder é Stream
3 de novembro de 2020
- Versão Java atualizada de 1.8.0_252 para 1.8.0_265.
- Corrija o bloqueio ABFS e WASB em relação a UserGroupInformation.getCurrentUser()
- Corrija um bug de loop infinito do leitor Avro ao ler os bytes MAGIC.
13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-32999][SQL] Use Utils.getSimpleName para evitar pressionar o nome da classe malformada em TreeNode
- Diretórios de listagem fixos na montagem FUSE que contêm nomes de arquivo com caracteres XML inválidos
- A montagem FUSE não usa mais ListMultipartUploads
29 de setembro de 2020
- [FAÍSCA-28863][SQL][WARMFIX] Introduza AlreadyOptimized para evitar a reanálise de V1FallbackWriters
- [FAÍSCA-32635][SQL] Corrigir propagação dobrável
- Adicione uma nova configuração
spark.shuffle.io.decoder.consolidateThreshold
. Defina o valor config comoLong.MAX_VALUE
para ignorar a consolidação de netty FrameBuffers, o que impedejava.lang.IndexOutOfBoundsException
em casos de canto.
24 de setembro de 2020
- [FAÍSCA-32764][SQL] -0.0 deve ser igual a 0.0
- [FAÍSCA-32753][SQL] Copie tags somente para o nó sem tags ao transformar planos
- [FAÍSCA-32659][SQL] Corrigir o problema de dados da Poda de Partição Dinâmica inserida em tipo não atômico
- Atualizações de segurança do sistema operacional.
8 de setembro de 2020
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
maxbinlength
. Este parâmetro é usado para controlar o comprimento da coluna de colunas BinaryType e é traduzido comoVARBINARY(maxbinlength)
. Pode ser definido usando.option("maxbinlength", n)
, onde 0 < n <= 8000.
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
Tempo de execução do Databricks 7.1 (EoS)
Consulte Databricks Runtime 7.1 (EoS).
4 de fevereiro de 2021
- Corrigida uma regressão que fazia com que o DBFS FUSE falhasse ao iniciar quando as configurações de variáveis de ambiente de cluster contivessem sintaxe bash inválida.
20 de janeiro de 2021
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
df.join(df.select($"col" as "new_col"), cond)
- O DataFrame derivado exclui algumas colunas via select, groupBy ou window.
- A condição de junção ou a seguinte transformação após o Dataframe unido refere-se às colunas não comuns. Por exemplo,
df.join(df.drop("a"), df("a") === 1)
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-33593][SQL] Leitor de vetores tem dados incorretos com valor de partição binária
- [FAÍSCA-33677][SQL] Ignorar regra LikeSimplification se o padrão contiver qualquer escapeChar
- [FAÍSCA-33071][FAÍSCA-33536][SQL] Evite alterar dataset_id de LogicalPlan em join() para não quebrar DetectAmbiguousSelfJoin
8 de dezembro de 2020
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
- O Spark Jobs lançado usando o Databricks Connect pode travar indefinidamente com
Executor$TaskRunner.$anonfun$copySessionState
o rastreamento de pilha do executor - Atualizações de segurança do sistema operacional.
1 de dezembro de 2020
-
[FAÍSCA-33404][SQL][3.0] Corrigir resultados incorretos na
date_trunc
expressão - [FAÍSCA-33339][PYTHON] O aplicativo Pyspark travará devido a um erro não Exception
- [FAÍSCA-33183][SQL][HOTFIX] Corrigir a regra do otimizador EliminateSorts e adicionar uma regra física para remover classificações redundantes
- [FAÍSCA-33371][PYTHON][3.0] Atualização setup.py e testes para Python 3.9
- [FAÍSCA-33391][SQL] element_at com CreateArray não respeitam um índice baseado.
- [FAÍSCA-33306][SQL]O fuso horário é necessário quando a data de conversão para a cadeia de caracteres
-
[FAÍSCA-33404][SQL][3.0] Corrigir resultados incorretos na
3 de novembro de 2020
- Versão Java atualizada de 1.8.0_252 para 1.8.0_265.
- Corrija o bloqueio ABFS e WASB em relação a UserGroupInformation.getCurrentUser()
- Corrija um bug de loop infinito do leitor Avro ao ler os bytes MAGIC.
13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-32999][SQL] Use Utils.getSimpleName para evitar pressionar o nome da classe malformada em TreeNode
- Diretórios de listagem fixos na montagem FUSE que contêm nomes de arquivo com caracteres XML inválidos
- A montagem FUSE não usa mais ListMultipartUploads
29 de setembro de 2020
- [FAÍSCA-28863][SQL][WARMFIX] Introduza AlreadyOptimized para evitar a reanálise de V1FallbackWriters
- [FAÍSCA-32635][SQL] Corrigir propagação dobrável
- Adicione uma nova configuração
spark.shuffle.io.decoder.consolidateThreshold
. Defina o valor config comoLong.MAX_VALUE
para ignorar a consolidação de netty FrameBuffers, o que impedejava.lang.IndexOutOfBoundsException
em casos de canto.
24 de setembro de 2020
- [FAÍSCA-32764][SQL] -0.0 deve ser igual a 0.0
- [FAÍSCA-32753][SQL] Copie tags somente para o nó sem tags ao transformar planos
- [FAÍSCA-32659][SQL] Corrigir o problema de dados da Poda de Partição Dinâmica inserida em tipo não atômico
- Atualizações de segurança do sistema operacional.
8 de setembro de 2020
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
maxbinlength
. Este parâmetro é usado para controlar o comprimento da coluna de colunas BinaryType e é traduzido comoVARBINARY(maxbinlength)
. Pode ser definido usando.option("maxbinlength", n)
, onde 0 < n <= 8000.
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
25 de agosto de 2020
-
[FAÍSCA-32159][SQL] Corrigir a integração entre
Aggregator[Array[_], _, _]
eUnresolvedMapObjects
-
[FAÍSCA-32559][SQL] Corrigir a lógica de corte no
UTF8String.toInt/toLong
, que não manipulava caracteres não-ASCII corretamente -
[FAÍSCA-32543][R] Remover
arrow::as_tibble
o uso no SparkR - [FAÍSCA-32091][CORE] Ignorar erro de tempo limite ao remover blocos no executor perdido
- Corrigido um problema que afetava o conector Synapse do Azure com credenciais MSI
- Resolução de atributos ambíguos fixa na automesclagem
-
[FAÍSCA-32159][SQL] Corrigir a integração entre
18 de agosto de 2020
- [FAÍSCA-32594][SQL] Corrigir a serialização de datas inseridas em tabelas do Hive
- [FAÍSCA-32237][SQL] Resolver dica no CTE
- [FAÍSCA-32431][SQL] Verificar colunas aninhadas duplicadas em fontes de dados incorporadas lidas
- [FAÍSCA-32467][UI] Evite codificar URL duas vezes no redirecionamento https
- Corrigida uma condição de corrida no conector AQS ao usar Trigger.Once.
11 de agosto de 2020
- [FAÍSCA-32280][FAÍSCA-32372][SQL] ResolveReferences.dedupRight só deve reescrever atributos para nós ancestrais do plano de conflito
- [FAÍSCA-32234][SQL] Os comandos do Spark SQL estão falhando na seleção das tabelas ORC
3 de agosto de 2020
- Agora você pode usar a função de transformação LDA em um cluster habilitado para passagem.
Tempo de execução do Databricks 7.0 (EoS)
Consulte Databricks Runtime 7.0 (EoS).
4 de fevereiro de 2021
- Corrigida uma regressão que fazia com que o DBFS FUSE falhasse ao iniciar quando as configurações de variáveis de ambiente de cluster contivessem sintaxe bash inválida.
20 de janeiro de 2021
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
df.join(df.select($"col" as "new_col"), cond)
- O DataFrame derivado exclui algumas colunas via select, groupBy ou window.
- A condição de junção ou a seguinte transformação após o Dataframe unido refere-se às colunas não comuns. Por exemplo,
df.join(df.drop("a"), df("a") === 1)
- Esses dois DataFrames têm colunas comuns, mas a saída da junção automática não tem colunas comuns. Por exemplo,
- Corrigida uma regressão na versão de manutenção de 12 de janeiro de 2021 que pode causar uma AnalysisException incorreta e dizer que a coluna é ambígua em uma associação automática. Essa regressão acontece quando um usuário ingressa em um DataFrame com seu DataFrame derivado (a chamada autoassociação) com as seguintes condições:
12 de janeiro de 2021
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-33593][SQL] Leitor de vetores tem dados incorretos com valor de partição binária
- [FAÍSCA-33677][SQL] Ignorar regra LikeSimplification se o padrão contiver qualquer escapeChar
- [FAÍSCA-33071][FAÍSCA-33536][SQL] Evite alterar dataset_id de LogicalPlan em join() para não quebrar DetectAmbiguousSelfJoin
8 de dezembro de 2020
- [FAÍSCA-27421][SQL] Corrigir filtro para coluna int e classe de valor java.lang.String ao remover coluna de partição
-
[FAÍSCA-33404][SQL] Corrigir resultados incorretos na
date_trunc
expressão - [FAÍSCA-33339][PYTHON] O aplicativo Pyspark travará devido a um erro não Exception
- [FAÍSCA-33183][SQL] Corrigir a regra do otimizador EliminateSorts e adicionar uma regra física para remover classificações redundantes
- [FAÍSCA-33391][SQL] element_at com CreateArray não respeitam um índice baseado.
- Atualizações de segurança do sistema operacional.
1 de dezembro de 2020
- [FAÍSCA-33306][SQL]O fuso horário é necessário quando a data de conversão para a cadeia de caracteres
3 de novembro de 2020
- Versão Java atualizada de 1.8.0_252 para 1.8.0_265.
- Corrija o bloqueio ABFS e WASB em relação a UserGroupInformation.getCurrentUser()
- Corrija um bug de loop infinito do leitor Avro ao ler os bytes MAGIC.
13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-32999][SQL] Use Utils.getSimpleName para evitar pressionar o nome da classe malformada em TreeNode
- Diretórios de listagem fixos na montagem FUSE que contêm nomes de arquivo com caracteres XML inválidos
- A montagem FUSE não usa mais ListMultipartUploads
29 de setembro de 2020
- [FAÍSCA-28863][SQL][WARMFIX] Introduza AlreadyOptimized para evitar a reanálise de V1FallbackWriters
- [FAÍSCA-32635][SQL] Corrigir propagação dobrável
- Adicione uma nova configuração
spark.shuffle.io.decoder.consolidateThreshold
. Defina o valor config comoLong.MAX_VALUE
para ignorar a consolidação de netty FrameBuffers, o que impedejava.lang.IndexOutOfBoundsException
em casos de canto.
24 de setembro de 2020
- [FAÍSCA-32764][SQL] -0.0 deve ser igual a 0.0
- [FAÍSCA-32753][SQL] Copie tags somente para o nó sem tags ao transformar planos
- [FAÍSCA-32659][SQL] Corrigir o problema de dados da Poda de Partição Dinâmica inserida em tipo não atômico
- Atualizações de segurança do sistema operacional.
8 de setembro de 2020
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
maxbinlength
. Este parâmetro é usado para controlar o comprimento da coluna de colunas BinaryType e é traduzido comoVARBINARY(maxbinlength)
. Pode ser definido usando.option("maxbinlength", n)
, onde 0 < n <= 8000.
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
25 de agosto de 2020
-
[FAÍSCA-32159][SQL] Corrigir a integração entre
Aggregator[Array[_], _, _]
eUnresolvedMapObjects
-
[FAÍSCA-32559][SQL] Corrigir a lógica de corte no
UTF8String.toInt/toLong
, que não manipulava caracteres não-ASCII corretamente -
[FAÍSCA-32543][R] Remover
arrow::as_tibble
o uso no SparkR - [FAÍSCA-32091][CORE] Ignorar erro de tempo limite ao remover blocos no executor perdido
- Corrigido um problema que afetava o conector Synapse do Azure com credenciais MSI
- Resolução de atributos ambíguos fixa na automesclagem
-
[FAÍSCA-32159][SQL] Corrigir a integração entre
18 de agosto de 2020
- [FAÍSCA-32594][SQL] Corrigir a serialização de datas inseridas em tabelas do Hive
- [FAÍSCA-32237][SQL] Resolver dica no CTE
- [FAÍSCA-32431][SQL] Verificar colunas aninhadas duplicadas em fontes de dados incorporadas lidas
- [FAÍSCA-32467][UI] Evite codificar URL duas vezes no redirecionamento https
- Corrigida uma condição de corrida no conector AQS ao usar Trigger.Once.
11 de agosto de 2020
- [FAÍSCA-32280][FAÍSCA-32372][SQL] ResolveReferences.dedupRight só deve reescrever atributos para nós ancestrais do plano de conflito
- [FAÍSCA-32234][SQL] Os comandos do Spark SQL estão falhando na seleção das tabelas ORC
- Agora você pode usar a função de transformação LDA em um cluster habilitado para passagem.
Tempo de execução do Databricks 6.6 (EoS)
Consulte Databricks Runtime 6.6 (EoS).
1 de dezembro de 2020
- [FAÍSCA-33260][SQL] Corrigir resultados incorretos de SortExec quando sortOrder é Stream
- [FAÍSCA-32635][SQL] Corrigir propagação dobrável
3 de novembro de 2020
- Versão Java atualizada de 1.8.0_252 para 1.8.0_265.
- Corrija o bloqueio ABFS e WASB em relação a UserGroupInformation.getCurrentUser()
- Corrija um bug de loop infinito do leitor Avro ao ler os bytes MAGIC.
13 de outubro de 2020
- Atualizações de segurança do sistema operacional.
- [FAÍSCA-32999][SQL][2.4] Use Utils.getSimpleName para evitar pressionar o nome da classe malformada no TreeNode
- Diretórios de listagem fixos na montagem FUSE que contêm nomes de arquivo com caracteres XML inválidos
- A montagem FUSE não usa mais ListMultipartUploads
24 de setembro de 2020
- Atualizações de segurança do sistema operacional.
8 de setembro de 2020
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
maxbinlength
. Este parâmetro é usado para controlar o comprimento da coluna de colunas BinaryType e é traduzido comoVARBINARY(maxbinlength)
. Pode ser definido usando.option("maxbinlength", n)
, onde 0 < n <= 8000. - Atualize o SDK de Armazenamento do Azure para 8.6.4 e habilite o TCP keep alive em conexões feitas pelo driver WASB
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
25 de agosto de 2020
- Resolução de atributos ambíguos fixa na automesclagem
18 de agosto de 2020
- [FAÍSCA-32431][SQL] Verificar colunas aninhadas duplicadas em fontes de dados incorporadas lidas
- Corrigida uma condição de corrida no conector AQS ao usar Trigger.Once.
11 de agosto de 2020
- [FAÍSCA-28676][CORE] Evite o registro excessivo do ContextCleaner
- [FAÍSCA-31967][UI] Downgrade para vis.js 4.21.0 para corrigir a regressão do tempo de carregamento da interface do usuário de trabalhos
3 de agosto de 2020
- Agora você pode usar a função de transformação LDA em um cluster habilitado para passagem.
- Atualizações de segurança do sistema operacional.
Tempo de execução do Databricks 6.5 (EoS)
Consulte Databricks Runtime 6.5 (EoS).
- 24 de setembro de 2020
- Corrigida uma limitação anterior em que a passagem no cluster padrão ainda restringia a implementação do sistema de arquivos que o usuário usa. Agora, os usuários poderiam acessar sistemas de arquivos locais sem restrições.
- Atualizações de segurança do sistema operacional.
- 8 de setembro de 2020
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
maxbinlength
. Este parâmetro é usado para controlar o comprimento da coluna de colunas BinaryType e é traduzido comoVARBINARY(maxbinlength)
. Pode ser definido usando.option("maxbinlength", n)
, onde 0 < n <= 8000. - Atualize o SDK de Armazenamento do Azure para 8.6.4 e habilite o TCP keep alive em conexões feitas pelo driver WASB
- Um novo parâmetro foi criado para o Azure Synapse Analytics,
- 25 de agosto de 2020
- Resolução de atributos ambíguos fixa na automesclagem
- 18 de agosto de 2020
- [FAÍSCA-32431][SQL] Verificar colunas aninhadas duplicadas em fontes de dados incorporadas lidas
- Corrigida uma condição de corrida no conector AQS ao usar Trigger.Once.
- 11 de agosto de 2020
- [FAÍSCA-28676][CORE] Evite o registro excessivo do ContextCleaner
- 3 de agosto de 2020
- Agora você pode usar a função de transformação LDA em um cluster habilitado para passagem.
- Atualizações de segurança do sistema operacional.
- 7 de julho de 2020
- Versão Java atualizada de 1.8.0_242 para 1.8.0_252.
- 21 de abril de 2020
- [FAÍSCA-31312][SQL] Instância de classe de cache para a instância UDF em HiveFunctionWrapper
Tempo de execução do Databricks 6.3 (EoS)
Consulte Databricks Runtime 6.3 (EoS).
- 7 de julho de 2020
- Versão Java atualizada de 1.8.0_232 para 1.8.0_252.
- 21 de abril de 2020
- [FAÍSCA-31312][SQL] Instância de classe de cache para a instância UDF em HiveFunctionWrapper
- 7 de abril de 2020
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
ARROW_PRE_0_15_IPC_FORMAT=1
) para habilitar o suporte para essas versões do PyArrow. Consulte as instruções em [SPARK-29367].
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
- 10 de março de 2020
- O conector Snowflake (
spark-snowflake_2.11
) incluído no Databricks Runtime é atualizado para a versão 2.5.9.snowflake-jdbc
é atualizado para a versão 3.12.0.
- O conector Snowflake (
- 18 de fevereiro de 2020
- A passagem de credenciais com o ADLS Gen2 tem uma degradação de desempenho devido ao tratamento local de thread incorreto quando a pré-busca do cliente ADLS está habilitada. Esta versão desativa a pré-busca do ADLS Gen2 quando a passagem de credenciais está habilitada até que tenhamos uma correção adequada.
- 11 de fevereiro de 2020
- [FAÍSCA-24783][SQL] spark.sql.shuffle.partitions=0 deve lançar exceção
- [FAÍSCA-30447][SQL] Problema de nulidade de propagação constante
- [FAÍSCA-28152][SQL] Adicionar um conf herdado para mapeamento numérico MsSqlServerDialect antigo
- Allowlisted a função overwrite para que o MLModels estende MLWriter poderia chamar a função.
Databricks Runtime 6.2 (EoS)
Consulte Databricks Runtime 6.2 (EoS).
- 21 de abril de 2020
- [FAÍSCA-31312][SQL] Instância de classe de cache para a instância UDF em HiveFunctionWrapper
- 7 de abril de 2020
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
ARROW_PRE_0_15_IPC_FORMAT=1
) para habilitar o suporte para essas versões do PyArrow. Consulte as instruções em [SPARK-29367].
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
- 25 de março de 2020
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
spark.databricks.driver.disableScalaOutput
Spark comotrue
. Por padrão, o valor do sinalizador éfalse
. O sinalizador controla a saída da célula para trabalhos JAR Scala e notebooks Scala. Se o sinalizador estiver habilitado, o Spark não retornará os resultados da execução do trabalho para o cliente. O sinalizador não afeta os dados gravados nos arquivos de log do cluster. A definição desse sinalizador é recomendada apenas para clusters automatizados para trabalhos JAR, pois desativará os resultados do bloco de anotações.
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
- 10 de março de 2020
- O conector Snowflake (
spark-snowflake_2.11
) incluído no Databricks Runtime é atualizado para a versão 2.5.9.snowflake-jdbc
é atualizado para a versão 3.12.0.
- O conector Snowflake (
- 18 de fevereiro de 2020
- [FAÍSCA-24783][SQL] spark.sql.shuffle.partitions=0 deve lançar exceção
- A passagem de credenciais com o ADLS Gen2 tem uma degradação de desempenho devido ao tratamento local de thread incorreto quando a pré-busca do cliente ADLS está habilitada. Esta versão desativa a pré-busca do ADLS Gen2 quando a passagem de credenciais está habilitada até que tenhamos uma correção adequada.
- 28 de janeiro de 2020
- Função de substituição dos gravadores de modelo de ML permitidos para clusters habilitados para passagem de credenciais, para que o salvamento de modelo possa usar o modo de substituição em clusters de passagem de credenciais.
- [FAÍSCA-30447][SQL] Problema de nulidade de propagação constante.
- [FAÍSCA-28152][SQL] Adicione um conf herdado para mapeamento numérico MsSqlServerDialect antigo.
- 14 de janeiro de 2020
- Versão Java atualizada de 1.8.0_222 para 1.8.0_232.
- Dezembro 10, 2019
- [FAÍSCA-29904][SQL] Analise carimbos de data/hora com precisão de microssegundos por fontes de dados JSON/CSV.
Tempo de execução do Databricks 6.1 (EoS)
Consulte Databricks Runtime 6.1 (EoS).
- 7 de abril de 2020
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
ARROW_PRE_0_15_IPC_FORMAT=1
) para habilitar o suporte para essas versões do PyArrow. Consulte as instruções em [SPARK-29367].
- Para resolver um problema com pandas udf não funcionando com o PyArrow 0.15.0 e superior, adicionamos uma variável de ambiente (
- 25 de março de 2020
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
spark.databricks.driver.disableScalaOutput
Spark comotrue
. Por padrão, o valor do sinalizador éfalse
. O sinalizador controla a saída da célula para trabalhos JAR Scala e notebooks Scala. Se o sinalizador estiver habilitado, o Spark não retornará os resultados da execução do trabalho para o cliente. O sinalizador não afeta os dados gravados nos arquivos de log do cluster. A definição desse sinalizador é recomendada apenas para clusters automatizados para trabalhos JAR, pois desativará os resultados do bloco de anotações.
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
- 10 de março de 2020
- O conector Snowflake (
spark-snowflake_2.11
) incluído no Databricks Runtime é atualizado para a versão 2.5.9.snowflake-jdbc
é atualizado para a versão 3.12.0.
- O conector Snowflake (
- 18 de fevereiro de 2020
- [FAÍSCA-24783][SQL] spark.sql.shuffle.partitions=0 deve lançar exceção
- A passagem de credenciais com o ADLS Gen2 tem uma degradação de desempenho devido ao tratamento local de thread incorreto quando a pré-busca do cliente ADLS está habilitada. Esta versão desativa a pré-busca do ADLS Gen2 quando a passagem de credenciais está habilitada até que tenhamos uma correção adequada.
- 28 de janeiro de 2020
- [FAÍSCA-30447][SQL] Problema de nulidade de propagação constante.
- [FAÍSCA-28152][SQL] Adicione um conf herdado para mapeamento numérico MsSqlServerDialect antigo.
- 14 de janeiro de 2020
- Versão Java atualizada de 1.8.0_222 para 1.8.0_232.
- Novembro 7, 2019
- [FAÍSCA-29743]O exemplo [SQL] deve definir needCopyResult como true se o needCopyResult de seu filho for true.
- Segredos referenciados a partir de propriedades de configuração do Spark e variáveis de ambiente na Pré-visualização Pública. Consulte Usar um segredo em uma propriedade de configuração do Spark ou variável de ambiente.
- Novembro 5, 2019
- Corrigido um bug no DBFS FUSE para lidar com pontos de montagem que tinham
//
em seu caminho. - [FAÍSCA-29081] Substitua chamadas para SerializationUtils.clone em propriedades por uma implementação mais rápida
- [FAÍSCA-29244][CORE] Impedir página liberada em BytesToBytesMap livre novamente
- (6,1 ML) Library mkl versão 2019.4 foi instalado sem intenção. Nós o rebaixamos para a versão mkl 2019.3 para corresponder ao Anaconda Distribution 2019.03.
- Corrigido um bug no DBFS FUSE para lidar com pontos de montagem que tinham
Tempo de execução do Databricks 6.0 (EoS)
Consulte Databricks Runtime 6.0 (EoS).
- 25 de março de 2020
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
spark.databricks.driver.disableScalaOutput
Spark comotrue
. Por padrão, o valor do sinalizador éfalse
. O sinalizador controla a saída da célula para trabalhos JAR Scala e notebooks Scala. Se o sinalizador estiver habilitado, o Spark não retornará os resultados da execução do trabalho para o cliente. O sinalizador não afeta os dados gravados nos arquivos de log do cluster. A definição desse sinalizador é recomendada apenas para clusters automatizados para trabalhos JAR, pois desativará os resultados do bloco de anotações.
- A saída do trabalho, como a saída de log emitida para stdout, está sujeita a um limite de tamanho de 20MB. Se a saída total tiver um tamanho maior, a execução será cancelada e marcada como falha. Para evitar encontrar esse limite, você pode impedir que stdout seja retornado do driver para definindo a configuração do
- 18 de fevereiro de 2020
- A passagem de credenciais com o ADLS Gen2 tem uma degradação de desempenho devido ao tratamento local de thread incorreto quando a pré-busca do cliente ADLS está habilitada. Esta versão desativa a pré-busca do ADLS Gen2 quando a passagem de credenciais está habilitada até que tenhamos uma correção adequada.
- 11 de fevereiro de 2020
- [FAÍSCA-24783][SQL] spark.sql.shuffle.partitions=0 deve lançar exceção
- 28 de janeiro de 2020
- [FAÍSCA-30447][SQL] Problema de nulidade de propagação constante.
- [FAÍSCA-28152][SQL] Adicione um conf herdado para mapeamento numérico MsSqlServerDialect antigo.
- 14 de janeiro de 2020
- Versão Java atualizada de 1.8.0_222 para 1.8.0_232.
- Novembro 19, 2019
- [FAÍSCA-29743] O exemplo [SQL] deve definir needCopyResult como true se o needCopyResult de seu filho for true
- Novembro 5, 2019
-
dbutils.tensorboard.start()
agora suporta TensorBoard 2.0 (se instalado manualmente). - Corrigido um bug no DBFS FUSE para lidar com pontos de montagem que tinham
//
em seu caminho. - [FAÍSCA-29081]Substitua chamadas para SerializationUtils.clone em propriedades por uma implementação mais rápida
-
- Outubro 23, 2019
- [FAÍSCA-29244][CORE] Impedir página liberada em BytesToBytesMap livre novamente
- Outubro 8, 2019
- Alterações do lado do servidor para permitir que o driver ODBC Simba Apache Spark se reconecte e continue após uma falha de conexão durante a busca de resultados (requer o driver ODBC Simba Apache Spark versão 2.6.10).
- Corrigido um problema que afetava o uso do
Optimize
comando com clusters habilitados para ACL de tabela. - Corrigido um problema em que
pyspark.ml
as bibliotecas falhavam devido ao erro proibido do Scala UDF na ACL da tabela e nos clusters habilitados para passagem de credenciais. - Métodos Allowlisted SerDe/SerDeUtil para passagem de credenciais.
- Corrigido NullPointerException ao verificar o código de erro no cliente WASB.
- Corrigido o problema em que as credenciais do usuário não eram encaminhadas para trabalhos criados pelo
dbutils.notebook.run()
.
Databricks Runtime 5,4 ML (EoS)
Consulte Databricks Runtime 5.4 para ML (EoS).
- Junho 18, 2019
- Tratamento aprimorado de execuções ativas do MLflow na integração do Hyperopt
- Mensagens melhoradas no Hyperopt
- Pacote
Marchkdown
atualizado de 3.1 para 3.1.1
Tempo de execução do Databricks 5.4 (EoS)
Consulte Databricks Runtime 5.4 (EoS).
- Novembro 19, 2019
- [FAÍSCA-29743] O exemplo [SQL] deve definir needCopyResult como true se o needCopyResult de seu filho for true
- Outubro 8, 2019
- Alterações no lado do servidor para permitir que o driver Simba Apache Spark ODBC se reconecte e continue após uma falha de conexão durante a busca de resultados (requer a atualização do driver Simba Apache Spark ODBC para a versão 2.6.10).
- Corrigido NullPointerException ao verificar o código de erro no cliente WASB.
- Setembro 10, 2019
- Adicionar iterador seguro de thread a BytesToBytesMap
- Corrigido um bug que afetava determinadas consultas de agregação global.
- [FAÍSCA-27330][SS] tarefa de suporte abortada no gravador foreach
- [FAÍSCA-28642]Ocultar credenciais em SHOW CREATE TABLE
- [FAÍSCA-28699][SQL] Desativar o uso de radix sort para ShuffleExchangeExec no caso de repartição
- [FAÍSCA-28699][CORE] Corrigir um caso de canto para abortar estágio indeterminado
- Agosto 27, 2019
- Corrigido um problema que afetava determinadas
transform
expressões
- Corrigido um problema que afetava determinadas
- Agosto 13, 2019
- A fonte de streaming Delta deve verificar o protocolo mais recente de uma tabela
- [FAÍSCA-28489][SS]Corrija um bug que KafkaOffsetRangeCalculator.getRanges pode deixar offsets
- Julho 30, 2019
- [FAÍSCA-28015][SQL] Check stringToDate() consome entrada inteira para os formatos aaaa e aaaa-[m]m
- [FAÍSCA-28308][CORE] A sub-segunda parte de CalendarInterval deve ser preenchida antes da análise
- [FAÍSCA-27485]EnsureRequirements.reorder deve lidar com expressões duplicadas graciosamente
- Julho 2, 2019
- Atualizado snappy-java de 1.1.7.1 para 1.1.7.3.
- Junho 18, 2019
- Tratamento aprimorado de execuções ativas do MLflow na integração MLlib
- Mensagem melhorada do Databricks Advisor relacionada com a utilização de cache de disco
- Corrigido um bug que afetava o uso de funções de ordem superior
- Corrigido um bug que afetava as consultas de metadados Delta
Tempo de execução do Databricks 5.3 (EoS)
Consulte Databricks Runtime 5.3 (EoS).
- Novembro 7, 2019
- [FAÍSCA-29743]O exemplo [SQL] deve definir needCopyResult como true se o needCopyResult de seu filho for true
- Outubro 8, 2019
- Alterações no lado do servidor para permitir que o driver Simba Apache Spark ODBC se reconecte e continue após uma falha de conexão durante a busca de resultados (requer a atualização do driver Simba Apache Spark ODBC para a versão 2.6.10).
- Corrigido NullPointerException ao verificar o código de erro no cliente WASB.
- Setembro 10, 2019
- Adicionar iterador seguro de thread a BytesToBytesMap
- Corrigido um bug que afetava determinadas consultas de agregação global.
- [FAÍSCA-27330][SS] tarefa de suporte abortada no gravador foreach
- [FAÍSCA-28642]Ocultar credenciais em SHOW CREATE TABLE
- [FAÍSCA-28699][SQL] Desativar o uso de radix sort para ShuffleExchangeExec no caso de repartição
- [FAÍSCA-28699][CORE] Corrigir um caso de canto para abortar estágio indeterminado
- Agosto 27, 2019
- Corrigido um problema que afetava determinadas
transform
expressões
- Corrigido um problema que afetava determinadas
- Agosto 13, 2019
- A fonte de streaming Delta deve verificar o protocolo mais recente de uma tabela
- [FAÍSCA-28489][SS]Corrija um bug que KafkaOffsetRangeCalculator.getRanges pode deixar offsets
- Julho 30, 2019
- [FAÍSCA-28015][SQL] Check stringToDate() consome entrada inteira para os formatos aaaa e aaaa-[m]m
- [FAÍSCA-28308][CORE] A sub-segunda parte de CalendarInterval deve ser preenchida antes da análise
- [FAÍSCA-27485]EnsureRequirements.reorder deve lidar com expressões duplicadas graciosamente
- Junho 18, 2019
- Mensagem melhorada do Databricks Advisor relacionada com a utilização de cache de disco
- Corrigido um bug que afetava o uso de funções de ordem superior
- Corrigido um bug que afetava as consultas de metadados Delta
- Maio 28, 2019
- Melhoria da estabilidade da Delta
- Tolerar IOExceptions ao ler o arquivo Delta LAST_CHECKPOINT
- Recuperação adicionada à instalação da biblioteca com falha
- Maio 7, 2019
- Porta HADOOP-15778 (ABFS: corrigir a limitação do lado do cliente para leitura) para o conector do Azure Data Lake Storage Gen2
- Porta HADOOP-16040 (ABFS: correção de bug para configuração tolerateOobAppends) para o conector Gen2 do Azure Data Lake Storage
- Corrigido um bug que afetava as ACLs da tabela
- Corrigida uma condição de corrida ao carregar um arquivo de soma de verificação de log Delta
- Corrigida a lógica de deteção de conflitos Delta para não identificar "inserir + substituir" como operação "append" pura
- Verifique se o cache de disco não está desativado quando as ACLs de tabela estão habilitadas
- [FAÍSCA-27494][SS] Chaves/valores nulos não funcionam no Kafka source v2
- [FAÍSCA-27446][R] Use o spark conf existente, se disponível.
- [FAÍSCA-27454][FAÍSCA-27454][ML][SQL] A fonte de dados de imagem do Spark falha quando encontra algumas imagens ilegais
- [FAÍSCA-27160][SQL] Corrigir DecimalType ao criar filtros orc
- [FAÍSCA-27338][CORE] Corrigir impasse entre UnsafeExternalSorter e TaskMemoryManager
Tempo de execução do Databricks 5.2 (EoS)
Consulte Databricks Runtime 5.2 (EoS).
- Setembro 10, 2019
- Adicionar iterador seguro de thread a BytesToBytesMap
- Corrigido um bug que afetava determinadas consultas de agregação global.
- [FAÍSCA-27330][SS] tarefa de suporte abortada no gravador foreach
- [FAÍSCA-28642]Ocultar credenciais em SHOW CREATE TABLE
- [FAÍSCA-28699][SQL] Desativar o uso de radix sort para ShuffleExchangeExec no caso de repartição
- [FAÍSCA-28699][CORE] Corrigir um caso de canto para abortar estágio indeterminado
- Agosto 27, 2019
- Corrigido um problema que afetava determinadas
transform
expressões
- Corrigido um problema que afetava determinadas
- Agosto 13, 2019
- A fonte de streaming Delta deve verificar o protocolo mais recente de uma tabela
- [FAÍSCA-28489][SS]Corrija um bug que KafkaOffsetRangeCalculator.getRanges pode deixar offsets
- Julho 30, 2019
- [FAÍSCA-28015][SQL] Check stringToDate() consome entrada inteira para os formatos aaaa e aaaa-[m]m
- [FAÍSCA-28308][CORE] A sub-segunda parte de CalendarInterval deve ser preenchida antes da análise
- [FAÍSCA-27485]EnsureRequirements.reorder deve lidar com expressões duplicadas graciosamente
- Julho 2, 2019
- Tolerar IOExceptions ao ler o arquivo Delta LAST_CHECKPOINT
- Junho 18, 2019
- Mensagem melhorada do Databricks Advisor relacionada com a utilização da cache de disco
- Corrigido um bug que afetava o uso de funções de ordem superior
- Corrigido um bug que afetava as consultas de metadados Delta
- Maio 28, 2019
- Recuperação adicionada à instalação da biblioteca com falha
- Maio 7, 2019
- Porta HADOOP-15778 (ABFS: corrigir a limitação do lado do cliente para leitura) para o conector do Azure Data Lake Storage Gen2
- Porta HADOOP-16040 (ABFS: correção de bug para configuração tolerateOobAppends) para o conector Gen2 do Azure Data Lake Storage
- Corrigida uma condição de corrida ao carregar um arquivo de soma de verificação de log Delta
- Corrigida a lógica de deteção de conflitos Delta para não identificar "inserir + substituir" como operação "append" pura
- Verifique se o cache de disco não está desativado quando as ACLs de tabela estão habilitadas
- [FAÍSCA-27494][SS] Chaves/valores nulos não funcionam no Kafka source v2
- [FAÍSCA-27454][FAÍSCA-27454][ML][SQL] A fonte de dados de imagem do Spark falha quando encontra algumas imagens ilegais
- [FAÍSCA-27160][SQL] Corrigir DecimalType ao criar filtros orc
- [FAÍSCA-27338][CORE] Corrigir impasse entre UnsafeExternalSorter e TaskMemoryManager
- Março 26, 2019
- Evite incorporar deslocamentos dependentes da plataforma literalmente em código gerado em todo o estágio
- [FAÍSCA-26665][CORE] Corrija um bug que BlockTransferService.fetchBlockSync pode travar para sempre.
- [FAÍSCA-27134][SQL] array_distinct função não funciona corretamente com colunas contendo matriz de matriz.
- [FAÍSCA-24669][SQL] Invalidar tabelas em caso de DROP DATABASE CASCADE.
- [FAÍSCA-26572][SQL] corrige a avaliação agregada dos resultados do codegen.
- Corrigido um bug que afetava determinados PythonUDFs.
- Fevereiro 26, 2019
- [FAÍSCA-26864][SQL] A consulta pode retornar um resultado incorreto quando python udf é usado como uma condição de junção semi-esquerda.
- [FAÍSCA-26887][PYTHON] Crie datetime.date diretamente em vez de criar datetime64 como dados intermediários.
- Corrigido um bug que afetava o servidor JDBC/ODBC.
- Corrigido um bug que afetava o PySpark.
- Exclua os arquivos ocultos ao criar o HadoopRDD.
- Corrigido um bug no Delta que causava problemas de serialização.
- Fevereiro 12, 2019
- Corrigido um problema que afetava o uso do Delta com os pontos de montagem do Azure ADLS Gen2.
- Corrigido um problema que fazia com que o protocolo de rede de baixo nível do Spark pudesse ser quebrado ao enviar mensagens de erro RPC grandes com a criptografia habilitada (quando
spark.network.crypto.enabled
definido como true).
- Janeiro 30, 2019
- Corrigido o StackOverflowError ao colocar a dica de junção inclinada na relação em cache.
- Corrigida a inconsistência entre o RDD armazenado em cache de um cache SQL e seu plano físico, que causa resultados incorretos.
-
[FAÍSCA-26706][SQL] Correção
illegalNumericPrecedence
para ByteType. - [FAÍSCA-26709][SQL] OptimizeMetadataOnlyQuery não manipula registros vazios corretamente.
- As fontes de dados CSV/JSON devem evitar caminhos de globbing ao inferir o esquema.
- Inferência de restrição fixa no operador Window.
- Corrigido um problema que afetava a instalação de bibliotecas de ovos com clusters com ACL de tabela habilitada.
Tempo de execução do Databricks 5.1 (EoS)
Consulte Databricks Runtime 5.1 (EoS).
- Agosto 13, 2019
- A fonte de streaming Delta deve verificar o protocolo mais recente de uma tabela
- [FAÍSCA-28489][SS]Corrija um bug que KafkaOffsetRangeCalculator.getRanges pode deixar offsets
- Julho 30, 2019
- [FAÍSCA-28015][SQL] Check stringToDate() consome entrada inteira para os formatos aaaa e aaaa-[m]m
- [FAÍSCA-28308][CORE] A sub-segunda parte de CalendarInterval deve ser preenchida antes da análise
- [FAÍSCA-27485]EnsureRequirements.reorder deve lidar com expressões duplicadas graciosamente
- Julho 2, 2019
- Tolerar IOExceptions ao ler o arquivo Delta LAST_CHECKPOINT
- Junho 18, 2019
- Corrigido um bug que afetava o uso de funções de ordem superior
- Corrigido um bug que afetava as consultas de metadados Delta
- Maio 28, 2019
- Recuperação adicionada à instalação da biblioteca com falha
- Maio 7, 2019
- Porta HADOOP-15778 (ABFS: corrigir a limitação do lado do cliente para leitura) para o conector do Azure Data Lake Storage Gen2
- Porta HADOOP-16040 (ABFS: correção de bug para configuração tolerateOobAppends) para o conector Gen2 do Azure Data Lake Storage
- Corrigida uma condição de corrida ao carregar um arquivo de soma de verificação de log Delta
- Corrigida a lógica de deteção de conflitos Delta para não identificar "inserir + substituir" como operação "append" pura
- [FAÍSCA-27494][SS] Chaves/valores nulos não funcionam no Kafka source v2
- [FAÍSCA-27454][FAÍSCA-27454][ML][SQL] A fonte de dados de imagem do Spark falha quando encontra algumas imagens ilegais
- [FAÍSCA-27160][SQL] Corrigir DecimalType ao criar filtros orc
- [FAÍSCA-27338][CORE] Corrigir impasse entre UnsafeExternalSorter e TaskMemoryManager
- Março 26, 2019
- Evite incorporar deslocamentos dependentes da plataforma literalmente em código gerado em todo o estágio
- Corrigido um bug que afetava determinados PythonUDFs.
- Fevereiro 26, 2019
- [FAÍSCA-26864][SQL] A consulta pode retornar um resultado incorreto quando python udf é usado como uma condição de junção semi-esquerda.
- Corrigido um bug que afetava o servidor JDBC/ODBC.
- Exclua os arquivos ocultos ao criar o HadoopRDD.
- Fevereiro 12, 2019
- Corrigido um problema que afetava a instalação de bibliotecas de ovos com clusters com ACL de tabela habilitada.
- Corrigida a inconsistência entre o RDD armazenado em cache de um cache SQL e seu plano físico, que causa resultados incorretos.
-
[FAÍSCA-26706][SQL] Correção
illegalNumericPrecedence
para ByteType. - [FAÍSCA-26709][SQL] OptimizeMetadataOnlyQuery não manipula registros vazios corretamente.
- Inferência de restrição fixa no operador Window.
- Corrigido um problema que fazia com que o protocolo de rede de baixo nível do Spark pudesse ser quebrado ao enviar mensagens de erro RPC grandes com a criptografia habilitada (quando
spark.network.crypto.enabled
definido como true).
- Janeiro 30, 2019
- Corrigido um problema que podia fazer
df.rdd.count()
com que o UDT retornasse uma resposta incorreta para determinados casos. - Corrigido um problema que afetava a instalação de casas do leme.
- [FAÍSCA-26267]Tente novamente ao detetar deslocamentos incorretos de Kafka.
- Corrigido um bug que afetava várias fontes de fluxo de arquivos em uma consulta de streaming.
- Corrigido o StackOverflowError ao colocar a dica de junção inclinada na relação em cache.
- Corrigida a inconsistência entre o RDD armazenado em cache de um cache SQL e seu plano físico, que causa resultados incorretos.
- Corrigido um problema que podia fazer
- Janeiro 8, 2019
- Corrigido o problema que causa o erro
org.apache.spark.sql.expressions.Window.rangeBetween(long,long) is not whitelisted
. - [FAÍSCA-26352]A reordenação de junção não deve alterar a ordem dos atributos de saída.
- [FAÍSCA-26366]ReplaceExceptWithFilter deve considerar NULL como False.
- Melhoria da estabilidade do Lago Delta.
- O Delta Lake está ativado.
- Corrigido o problema que causava falha no acesso ao Azure Data Lake Storage Gen2 quando a Passagem de Credenciais do Microsoft Entra ID está habilitada para o Azure Data Lake Storage Gen1.
- O Cache de E/S do Databricks agora está habilitado para tipos de instância de trabalho da série Ls para todos os níveis de preços.
- Corrigido o problema que causa o erro
Databricks Runtime 5.0 (EoS)
Consulte Databricks Runtime 5.0 (EoS).
- Junho 18, 2019
- Corrigido um bug que afetava o uso de funções de ordem superior
- Maio 7, 2019
- Corrigida uma condição de corrida ao carregar um arquivo de soma de verificação de log Delta
- Corrigida a lógica de deteção de conflitos Delta para não identificar "inserir + substituir" como operação "append" pura
- [FAÍSCA-27494][SS] Chaves/valores nulos não funcionam no Kafka source v2
- [FAÍSCA-27454][FAÍSCA-27454][ML][SQL] A fonte de dados de imagem do Spark falha quando encontra algumas imagens ilegais
- [FAÍSCA-27160][SQL] Corrigir DecimalType ao criar filtros orc
- [FAÍSCA-27338][CORE] Corrigir impasse entre UnsafeExternalSorter e TaskMemoryManager
- Março 26, 2019
- Evite incorporar deslocamentos dependentes da plataforma literalmente em código gerado em todo o estágio
- Corrigido um bug que afetava determinados PythonUDFs.
- Março 12, 2019
- [FAÍSCA-26864][SQL] A consulta pode retornar um resultado incorreto quando python udf é usado como uma condição de junção semi-esquerda.
- Fevereiro 26, 2019
- Corrigido um bug que afetava o servidor JDBC/ODBC.
- Exclua os arquivos ocultos ao criar o HadoopRDD.
- Fevereiro 12, 2019
- Corrigida a inconsistência entre o RDD armazenado em cache de um cache SQL e seu plano físico, que causa resultados incorretos.
-
[FAÍSCA-26706][SQL] Correção
illegalNumericPrecedence
para ByteType. - [FAÍSCA-26709][SQL] OptimizeMetadataOnlyQuery não manipula registros vazios corretamente.
- Inferência de restrição fixa no operador Window.
- Corrigido um problema que fazia com que o protocolo de rede de baixo nível do Spark pudesse ser quebrado ao enviar mensagens de erro RPC grandes com a criptografia habilitada (quando
spark.network.crypto.enabled
definido como true).
- Janeiro 30, 2019
- Corrigido um problema que podia fazer
df.rdd.count()
com que o UDT retornasse uma resposta incorreta para determinados casos. - [FAÍSCA-26267]Tente novamente ao detetar deslocamentos incorretos de Kafka.
- Corrigido um bug que afetava várias fontes de fluxo de arquivos em uma consulta de streaming.
- Corrigido o StackOverflowError ao colocar a dica de junção inclinada na relação em cache.
- Corrigida a inconsistência entre o RDD armazenado em cache de um cache SQL e seu plano físico, que causa resultados incorretos.
- Corrigido um problema que podia fazer
- Janeiro 8, 2019
- Corrigido o problema que causava o erro
org.apache.spark.sql.expressions.Window.rangeBetween(long,long) is not whitelisted
. - [FAÍSCA-26352]A reordenação de junção não deve alterar a ordem dos atributos de saída.
- [FAÍSCA-26366]ReplaceExceptWithFilter deve considerar NULL como False.
- Melhoria da estabilidade do Lago Delta.
- O Delta Lake está ativado.
- O Cache de E/S do Databricks agora está habilitado para tipos de instância de trabalho da série Ls para todos os níveis de preços.
- Corrigido o problema que causava o erro
- Dezembro 18, 2018
- [FAÍSCA-26293]Exceção de transmissão ao ter Python UDF em subconsulta
- Corrigido um problema que afetava determinadas consultas usando Join e Limit.
- Credenciais editadas de nomes RDD na interface do usuário do Spark
- Dezembro 6, 2018
- Corrigido um problema que causava um resultado de consulta incorreto ao usar orderBy seguido imediatamente por groupBy com a chave group-by como a parte principal da chave sort-by.
- Conector Snowflake atualizado para Spark de 2.4.9.2-spark_2.4_pre_release para 2.4.10.
- Ignore apenas arquivos corrompidos após uma ou mais novas tentativas quando
spark.sql.files.ignoreCorruptFiles
o sinalizador ouspark.sql.files.ignoreMissingFiles
estiver ativado. - Corrigido um problema que afetava determinadas consultas de auto-união.
- Corrigido um bug com o servidor thrift onde as sessões às vezes são vazadas quando canceladas.
- [FAÍSCA-26307]CTAS corrigido quando INSERT uma tabela particionada usando Hive SerDe.
- [FAÍSCA-26147]UDFs Python na condição de junção falham mesmo ao usar colunas de apenas um lado da junção
- [FAÍSCA-26211]Corrija InSet para binário e struct e array com null.
-
[FAÍSCA-26181]o
hasMinMaxStats
método deColumnStatsMap
não está correto. - Corrigido um problema que afetava a instalação do Python Wheels em ambientes sem acesso à Internet.
- Novembro 20, 2018
- Corrigido um problema que fazia com que um bloco de notas não pudesse ser utilizado depois de cancelar uma consulta de streaming.
- Corrigido um problema que afetava determinadas consultas usando funções de janela.
- Corrigido um problema que afetava um fluxo do Delta com várias alterações de esquema.
- Corrigido um problema que afetava determinadas consultas de agregação com junções Semi/Anti esquerdas.
Databricks Runtime 4.3 (EoS)
Consulte Databricks Runtime 4.3 (EoS).
9 de abril de 2019
- [FAÍSCA-26665][CORE] Corrija um bug que pode fazer com que BlockTransferService.fetchBlockSync trave para sempre.
- [FAÍSCA-24669][SQL] Invalidar tabelas em caso de DROP DATABASE CASCADE.
Março 12, 2019
- Corrigido um bug que afetava a geração de código.
- Corrigido um bug que afetava a Delta.
Fevereiro 26, 2019
- Corrigido um bug que afetava o servidor JDBC/ODBC.
Fevereiro 12, 2019
- [FAÍSCA-26709][SQL] OptimizeMetadataOnlyQuery não manipula registros vazios corretamente.
- Excluindo os arquivos ocultos ao criar o HadoopRDD.
- Conversão de filtro de parquet fixo para predicado IN quando seu valor está vazio.
- Corrigido um problema que fazia com que o protocolo de rede de baixo nível do Spark pudesse ser quebrado ao enviar mensagens de erro RPC grandes com a criptografia habilitada (quando
spark.network.crypto.enabled
definido como true).
30 de janeiro de 2019
- Corrigido um problema que podia fazer
df.rdd.count()
com que o UDT retornasse uma resposta incorreta para determinados casos. - Corrigida a inconsistência entre o RDD armazenado em cache de um cache SQL e seu plano físico, que causa resultados incorretos.
- Corrigido um problema que podia fazer
8 de janeiro de 2019
- Corrigido o problema que causava o erro
org.apache.spark.sql.expressions.Window.rangeBetween(long,long) is not whitelisted
. - Credenciais editadas de nomes RDD na interface do usuário do Spark
- [FAÍSCA-26352]A reordenação de junção não deve alterar a ordem dos atributos de saída.
- [FAÍSCA-26366]ReplaceExceptWithFilter deve considerar NULL como False.
- O Delta Lake está ativado.
- O Cache de E/S do Databricks agora está habilitado para tipos de instância de trabalho da série Ls para todos os níveis de preços.
- Corrigido o problema que causava o erro
Dezembro 18, 2018
- [FAÍSCA-25002]Avro: revise o namespace do registro de saída.
- Corrigido um problema que afetava determinadas consultas usando Join e Limit.
- [FAÍSCA-26307]CTAS corrigido quando INSERT uma tabela particionada usando Hive SerDe.
- Ignore apenas arquivos corrompidos após uma ou mais novas tentativas quando
spark.sql.files.ignoreCorruptFiles
o sinalizador ouspark.sql.files.ignoreMissingFiles
estiver ativado. -
[FAÍSCA-26181]o
hasMinMaxStats
método deColumnStatsMap
não está correto. - Corrigido um problema que afetava a instalação do Python Wheels em ambientes sem acesso à Internet.
- Corrigido um problema de desempenho no analisador de consultas.
- Corrigido um problema no PySpark que fazia com que as ações do DataFrame falhassem com o erro "conexão recusada".
- Corrigido um problema que afetava determinadas consultas de auto-união.
20 de novembro de 2018
- [FAÍSCA-17916][FAÍSCA-25241]Corrija a cadeia de caracteres vazia que está sendo analisada como nula quando nullValue é definido.
- [FAÍSCA-25387]Correção para NPE causado por entrada CSV incorreta.
- Corrigido um problema que afetava determinadas consultas de agregação com junções Semi/Anti esquerdas.
Novembro 6, 2018
- [FAÍSCA-25741]URLs longos não são renderizados corretamente na interface do usuário da Web.
- [FAÍSCA-25714]Corrija a manipulação nula na regra do otimizador BooleanSimplification.
- Corrigido um problema que afetava a limpeza de objetos temporários no conector Synapse Analytics.
- [FAÍSCA-25816]Corrija a resolução de atributos em extratores aninhados.
16 de outubro de 2018
- Corrigido um bug que afetava a saída da execução
SHOW CREATE TABLE
em tabelas Delta. - Corrigido um bug que afetava a
Union
operação.
- Corrigido um bug que afetava a saída da execução
Setembro 25, 2018
- [FAÍSCA-25368][SQL] A inferência de restrição incorreta retorna um resultado errado.
- [FAÍSCA-25402][SQL] Tratamento nulo em BooleanSimplification.
- Corrigido
NotSerializableException
na fonte de dados Avro.
Setembro 11, 2018
-
[FAÍSCA-25214][SS] Corrija o problema de que a fonte Kafka v2 pode retornar registros duplicados quando
failOnDataLoss=false
. - [FAÍSCA-24987][SS] Corrija o vazamento do consumidor Kafka quando não houver novos deslocamentos para articlePartition.
- A redução de filtro deve manipular o valor nulo corretamente.
- Maior estabilidade do motor de execução.
-
[FAÍSCA-25214][SS] Corrija o problema de que a fonte Kafka v2 pode retornar registros duplicados quando
28 de Agosto de 2018
- Corrigido um bug no comando Delta Lake Delete que excluía incorretamente as linhas em que a condição é avaliada como nula.
-
[FAÍSCA-25142]Adicione mensagens de erro quando o trabalhador Python não pôde abrir o soquete no
_load_from_socket
.
Agosto 23, 2018
-
[FAÍSCA-23935]mapEntry lança
org.codehaus.commons.compiler.CompileException
. - Corrigido o problema de mapa anulável no leitor Parquet.
- [FAÍSCA-25051][SQL] FixNullability não deve parar em AnalysisBarrier.
- [FAÍSCA-25081]Corrigido um bug em que ShuffleExternalSorter pode acessar uma página de memória liberada quando o derramamento não consegue alocar memória.
- Corrigida uma interação entre Databricks Delta e Pyspark que poderia causar falhas de leitura transitórias.
- [FAÍSCA-25084]" distribute by" em várias colunas (wrap entre parênteses) pode levar a um problema de codegen.
- [FAÍSCA-25096]Afrouxe a anulabilidade se o elenco for anulável à força.
- Reduziu o número padrão de threads usados pelo comando Delta Lake Otimize, reduzindo a sobrecarga de memória e confirmando dados mais rapidamente.
- [FAÍSCA-25114]Corrija RecordBinaryComparator quando a subtração entre duas palavras é divisível por Integer.MAX_VALUE.
- Corrigida a redação do gerenciador de segredos quando o comando é parcialmente bem-sucedido.
-
[FAÍSCA-23935]mapEntry lança
Tempo de execução do Databricks 4.2 (EoS)
Consulte Databricks Runtime 4.2 (EoS).
Fevereiro 26, 2019
- Corrigido um bug que afetava o servidor JDBC/ODBC.
Fevereiro 12, 2019
- [FAÍSCA-26709][SQL] OptimizeMetadataOnlyQuery não manipula registros vazios corretamente.
- Excluindo os arquivos ocultos ao criar o HadoopRDD.
- Conversão de filtro de parquet fixo para predicado IN quando seu valor está vazio.
- Corrigido um problema que fazia com que o protocolo de rede de baixo nível do Spark pudesse ser quebrado ao enviar mensagens de erro RPC grandes com a criptografia habilitada (quando
spark.network.crypto.enabled
definido como true).
30 de janeiro de 2019
- Corrigido um problema que podia fazer
df.rdd.count()
com que o UDT retornasse uma resposta incorreta para determinados casos.
- Corrigido um problema que podia fazer
8 de janeiro de 2019
- Corrigido o problema que causa o erro
org.apache.spark.sql.expressions.Window.rangeBetween(long,long) is not whitelisted
. - Credenciais editadas de nomes RDD na interface do usuário do Spark
- [FAÍSCA-26352]A reordenação de junção não deve alterar a ordem dos atributos de saída.
- [FAÍSCA-26366]ReplaceExceptWithFilter deve considerar NULL como False.
- O Delta Lake está ativado.
- O Cache de E/S do Databricks agora está habilitado para tipos de instância de trabalho da série Ls para todos os níveis de preços.
- Corrigido o problema que causa o erro
Dezembro 18, 2018
- [FAÍSCA-25002]Avro: revise o namespace do registro de saída.
- Corrigido um problema que afetava determinadas consultas usando Join e Limit.
- [FAÍSCA-26307]CTAS corrigido quando INSERT uma tabela particionada usando Hive SerDe.
- Ignore apenas arquivos corrompidos após uma ou mais novas tentativas quando
spark.sql.files.ignoreCorruptFiles
o sinalizador ouspark.sql.files.ignoreMissingFiles
estiver ativado. -
[FAÍSCA-26181]o
hasMinMaxStats
método deColumnStatsMap
não está correto. - Corrigido um problema que afetava a instalação do Python Wheels em ambientes sem acesso à Internet.
- Corrigido um problema de desempenho no analisador de consultas.
- Corrigido um problema no PySpark que fazia com que as ações do DataFrame falhassem com o erro "conexão recusada".
- Corrigido um problema que afetava determinadas consultas de auto-união.
20 de novembro de 2018
- [FAÍSCA-17916][FAÍSCA-25241]Corrija a cadeia de caracteres vazia que está sendo analisada como nula quando nullValue é definido.
- Corrigido um problema que afetava determinadas consultas de agregação com junções Semi/Anti esquerdas.
Novembro 6, 2018
- [FAÍSCA-25741]URLs longos não são renderizados corretamente na interface do usuário da Web.
- [FAÍSCA-25714]Corrija a manipulação nula na regra do otimizador BooleanSimplification.
16 de outubro de 2018
- Corrigido um bug que afetava a saída da execução
SHOW CREATE TABLE
em tabelas Delta. - Corrigido um bug que afetava a
Union
operação.
- Corrigido um bug que afetava a saída da execução
Setembro 25, 2018
- [FAÍSCA-25368][SQL] A inferência de restrição incorreta retorna um resultado errado.
- [FAÍSCA-25402][SQL] Tratamento nulo em BooleanSimplification.
- Corrigido
NotSerializableException
na fonte de dados Avro.
Setembro 11, 2018
-
[FAÍSCA-25214][SS] Corrija o problema de que a fonte Kafka v2 pode retornar registros duplicados quando
failOnDataLoss=false
. - [FAÍSCA-24987][SS] Corrija o vazamento do consumidor Kafka quando não houver novos deslocamentos para articlePartition.
- A redução de filtro deve manipular o valor nulo corretamente.
-
[FAÍSCA-25214][SS] Corrija o problema de que a fonte Kafka v2 pode retornar registros duplicados quando
28 de Agosto de 2018
- Corrigido um bug no comando Delta Lake Delete que excluía incorretamente as linhas em que a condição é avaliada como nula.
Agosto 23, 2018
- NoClassDefError corrigido para instantâneo delta
-
[FAÍSCA-23935]mapEntry lança
org.codehaus.commons.compiler.CompileException
. - [FAÍSCA-24957][SQL] Média com decimal seguida de agregação retorna resultado errado. Os resultados incorretos de AVERAGE podem ser retornados. O CAST adicionado no operador Average será ignorado se o resultado de Divide for do mesmo tipo para o qual ele é moldado.
- [FAÍSCA-25081]Corrigido um bug em que ShuffleExternalSorter pode acessar uma página de memória liberada quando o derramamento não consegue alocar memória.
- Corrigida uma interação entre Databricks Delta e Pyspark que poderia causar falhas de leitura transitórias.
- [FAÍSCA-25114]Corrija RecordBinaryComparator quando a subtração entre duas palavras é divisível por Integer.MAX_VALUE.
- [FAÍSCA-25084]" distribute by" em várias colunas (wrap entre parênteses) pode levar a um problema de codegen.
- [FAÍSCA-24934][SQL] Lista explícita de tipos suportados em limites superiores/inferiores para remoção de partições na memória. Quando tipos de dados complexos são usados em filtros de consulta em dados armazenados em cache, o Spark sempre retorna um conjunto de resultados vazio. A remoção baseada em estatísticas na memória gera resultados incorretos, porque null é definido para limites superiores/inferiores para tipos complexos. A correção é não usar a remoção baseada em estatísticas na memória para tipos complexos.
- Corrigida a redação do gerenciador de segredos quando o comando é parcialmente bem-sucedido.
- Corrigido o problema de mapa anulável no leitor Parquet.
Agosto 2, 2018
- Adicionada API writeStream.table em Python.
- Corrigido um problema que afetava o ponto de verificação Delta.
- [FAÍSCA-24867][SQL] Adicione AnalysisBarrier a DataFrameWriter. O cache SQL não está sendo usado ao usar DataFrameWriter para gravar um DataFrame com UDF. Esta é uma regressão causada pelas alterações que fizemos no AnalysisBarrier, uma vez que nem todas as regras do Analyzer são idempotentes.
- Corrigido um problema que podia fazer com
mergeInto
que o comando produzisse resultados incorretos. - Estabilidade melhorada ao aceder ao Azure Data Lake Storage Gen1.
- [SPARK-24809] Serializar LongHashedRelation no executor pode resultar num erro de dados.
- [FAÍSCA-24878][SQL] Corrija a função inversa para o tipo de matriz do tipo primitivo que contém null.
11 de julho de 2018
- Corrigido um bug na execução da consulta que fazia com que agregações em colunas decimais com diferentes precisões retornassem resultados incorretos em alguns casos.
- Corrigido um
NullPointerException
bug que era gerado durante operações avançadas de agregação, como conjuntos de agrupamento.
Databricks Runtime 4.1 ML (EoS)
Consulte Databricks Runtime 4.1 ML (EoS).
- Julho 31, 2018
- Adicionado o Azure Synapse Analytics ao ML Runtime 4.1
- Corrigido um bug que poderia causar resultados de consulta incorretos quando o nome de uma coluna de partição usada em um predicado difere do caso dessa coluna no esquema da tabela.
- Corrigido um bug que afetava o mecanismo de execução do Spark SQL.
- Corrigido um bug que afetava a geração de código.
- Corrigido um bug (
java.lang.NoClassDefFoundError
) que afetava o Delta Lake. - Tratamento de erros melhorado no Delta Lake.
- Corrigido um bug que fazia com que estatísticas incorretas de pulo de dados fossem coletadas para colunas de cadeia de caracteres de 32 caracteres ou mais.
Tempo de execução do Databricks 4.1 (EoS)
Consulte Databricks Runtime 4.1 (EoS).
8 de janeiro de 2019
- [FAÍSCA-26366]ReplaceExceptWithFilter deve considerar NULL como False.
- O Delta Lake está ativado.
Dezembro 18, 2018
- [FAÍSCA-25002]Avro: revise o namespace do registro de saída.
- Corrigido um problema que afetava determinadas consultas usando Join e Limit.
- [FAÍSCA-26307]CTAS corrigido quando INSERT uma tabela particionada usando Hive SerDe.
- Ignore apenas arquivos corrompidos após uma ou mais novas tentativas quando
spark.sql.files.ignoreCorruptFiles
o sinalizador ouspark.sql.files.ignoreMissingFiles
estiver ativado. - Corrigido um problema que afetava a instalação do Python Wheels em ambientes sem acesso à Internet.
- Corrigido um problema no PySpark que fazia com que as ações do DataFrame falhassem com o erro "conexão recusada".
- Corrigido um problema que afetava determinadas consultas de auto-união.
20 de novembro de 2018
- [FAÍSCA-17916][FAÍSCA-25241]Corrija a cadeia de caracteres vazia que está sendo analisada como nula quando nullValue é definido.
- Corrigido um problema que afetava determinadas consultas de agregação com junções Semi/Anti esquerdas.
Novembro 6, 2018
- [FAÍSCA-25741]URLs longos não são renderizados corretamente na interface do usuário da Web.
- [FAÍSCA-25714]Corrija a manipulação nula na regra do otimizador BooleanSimplification.
16 de outubro de 2018
- Corrigido um bug que afetava a saída da execução
SHOW CREATE TABLE
em tabelas Delta. - Corrigido um bug que afetava a
Union
operação.
- Corrigido um bug que afetava a saída da execução
Setembro 25, 2018
- [FAÍSCA-25368][SQL] A inferência de restrição incorreta retorna um resultado errado.
- [FAÍSCA-25402][SQL] Tratamento nulo em BooleanSimplification.
- Corrigido
NotSerializableException
na fonte de dados Avro.
Setembro 11, 2018
-
[FAÍSCA-25214][SS] Corrija o problema de que a fonte Kafka v2 pode retornar registros duplicados quando
failOnDataLoss=false
. - [FAÍSCA-24987][SS] Corrija o vazamento do consumidor Kafka quando não houver novos deslocamentos para articlePartition.
- A redução de filtro deve manipular o valor nulo corretamente.
-
[FAÍSCA-25214][SS] Corrija o problema de que a fonte Kafka v2 pode retornar registros duplicados quando
28 de Agosto de 2018
- Corrigido um bug no comando Delta Lake Delete que excluía incorretamente as linhas em que a condição é avaliada como nula.
- [FAÍSCA-25084]" distribute by" em várias colunas (wrap entre parênteses) pode levar a um problema de codegen.
- [FAÍSCA-25114]Corrija RecordBinaryComparator quando a subtração entre duas palavras é divisível por Integer.MAX_VALUE.
Agosto 23, 2018
- Corrigido NoClassDefError para Delta Snapshot.
- [FAÍSCA-24957][SQL] Média com decimal seguida de agregação retorna resultado errado. Os resultados incorretos de AVERAGE podem ser retornados. O CAST adicionado no operador Average será ignorado se o resultado de Divide for do mesmo tipo para o qual ele é moldado.
- Corrigido o problema de mapa anulável no leitor Parquet.
- [FAÍSCA-24934][SQL] Lista explícita de tipos suportados em limites superiores/inferiores para remoção de partições na memória. Quando tipos de dados complexos são usados em filtros de consulta em dados armazenados em cache, o Spark sempre retorna um conjunto de resultados vazio. A remoção baseada em estatísticas na memória gera resultados incorretos, porque null é definido para limites superiores/inferiores para tipos complexos. A correção é não usar a remoção baseada em estatísticas na memória para tipos complexos.
- [FAÍSCA-25081]Corrigido um bug em que ShuffleExternalSorter pode acessar uma página de memória liberada quando o derramamento não consegue alocar memória.
- Corrigida uma interação entre Databricks Delta e Pyspark que poderia causar falhas de leitura transitórias.
- Corrigida a redação do gerenciador de segredos quando o comando é parcialmente bem-sucedido
Agosto 2, 2018
- [FAÍSCA-24613][SQL] O cache com UDF não pôde ser correspondido com caches dependentes subsequentes. Encapsula o plano lógico com um AnalysisBarrier para compilação do plano de execução no CacheManager, a fim de evitar que o plano seja analisado novamente. Esta é também uma regressão do Spark 2.3.
- Corrigido um problema do conector do Synapse Analytics que afetava a conversão de fuso horário para gravar dados DateType.
- Corrigido um problema que afetava o ponto de verificação Delta.
- Corrigido um problema que podia fazer com
mergeInto
que o comando produzisse resultados incorretos. - [FAÍSCA-24867][SQL] Adicione AnalysisBarrier a DataFrameWriter. O cache SQL não está sendo usado ao usar DataFrameWriter para gravar um DataFrame com UDF. Esta é uma regressão causada pelas alterações que fizemos no AnalysisBarrier, uma vez que nem todas as regras do Analyzer são idempotentes.
- [SPARK-24809] Serializar LongHashedRelation no executor pode resultar num erro de dados.
11 de julho de 2018
- Corrigido um bug na execução da consulta que fazia com que agregações em colunas decimais com diferentes precisões retornassem resultados incorretos em alguns casos.
- Corrigido um
NullPointerException
bug que era gerado durante operações avançadas de agregação, como conjuntos de agrupamento.
28 de junho de 2018
- Corrigido um bug que poderia causar resultados de consulta incorretos quando o nome de uma coluna de partição usada em um predicado difere do caso dessa coluna no esquema da tabela.
Junho 7, 2018
- Corrigido um bug que afetava o mecanismo de execução do Spark SQL.
- Corrigido um bug que afetava a geração de código.
- Corrigido um bug (
java.lang.NoClassDefFoundError
) que afetava o Delta Lake. - Tratamento de erros melhorado no Delta Lake.
17 de maio de 2018
- Corrigido um bug que fazia com que estatísticas incorretas de pulo de dados fossem coletadas para colunas de cadeia de caracteres de 32 caracteres ou mais.
Tempo de execução do Databricks 4.0 (EoS)
Consulte Databricks Runtime 4.0 (EoS).
Novembro 6, 2018
- [FAÍSCA-25714]Corrija a manipulação nula na regra do otimizador BooleanSimplification.
16 de outubro de 2018
- Corrigido um bug que afetava a
Union
operação.
- Corrigido um bug que afetava a
Setembro 25, 2018
- [FAÍSCA-25368][SQL] A inferência de restrição incorreta retorna um resultado errado.
- [FAÍSCA-25402][SQL] Tratamento nulo em BooleanSimplification.
- Corrigido
NotSerializableException
na fonte de dados Avro.
Setembro 11, 2018
- A redução de filtro deve manipular o valor nulo corretamente.
28 de Agosto de 2018
- Corrigido um bug no comando Delta Lake Delete que excluía incorretamente as linhas em que a condição é avaliada como nula.
Agosto 23, 2018
- Corrigido o problema de mapa anulável no leitor Parquet.
- Corrigida a redação do gerenciador de segredos quando o comando é parcialmente bem-sucedido
- Corrigida uma interação entre Databricks Delta e Pyspark que poderia causar falhas de leitura transitórias.
- [FAÍSCA-25081]Corrigido um bug em que ShuffleExternalSorter pode acessar uma página de memória liberada quando o derramamento não consegue alocar memória.
- [FAÍSCA-25114]Corrija RecordBinaryComparator quando a subtração entre duas palavras é divisível por Integer.MAX_VALUE.
Agosto 2, 2018
- [FAÍSCA-24452]Evite possíveis estouro em int add ou múltiplo.
- [SPARK-24588]A associação de transmissão deve exigir HashClusteredPartitioning a elementos subordinados.
- Corrigido um problema que podia fazer com
mergeInto
que o comando produzisse resultados incorretos. - [FAÍSCA-24867][SQL] Adicione AnalysisBarrier a DataFrameWriter. O cache SQL não está sendo usado ao usar DataFrameWriter para gravar um DataFrame com UDF. Esta é uma regressão causada pelas alterações que fizemos no AnalysisBarrier, uma vez que nem todas as regras do Analyzer são idempotentes.
- [SPARK-24809] Serializar LongHashedRelation no executor pode resultar num erro de dados.
28 de junho de 2018
- Corrigido um bug que poderia causar resultados de consulta incorretos quando o nome de uma coluna de partição usada em um predicado difere do caso dessa coluna no esquema da tabela.
Junho 7, 2018
- Corrigido um bug que afetava o mecanismo de execução do Spark SQL.
- Tratamento de erros melhorado no Delta Lake.
17 de maio de 2018
- Correções de bugs para o gerenciamento secreto do Databricks.
- Estabilidade melhorada na leitura de dados armazenados no Azure Data Lake Store.
- Corrigido um bug que afetava o cache RDD.
- Corrigido um bug que afetava Null-safe Equal no Spark SQL.
24 de abril de 2018
- SDK do Azure Data Lake Store atualizado de 2.0.11 para 2.2.8 para melhorar a estabilidade do acesso ao Azure Data Lake Store.
- Corrigido um bug que afetava a inserção de substituições em tabelas particionadas do Hive quando
spark.databricks.io.hive.fastwriter.enabled
éfalse
. - Corrigido um problema que falhava na serialização de tarefas.
- Estabilidade melhorada do Lago Delta.
14 de março de 2018
- Evite atualizações desnecessárias de metadados ao gravar no Delta Lake.
- Corrigido um problema causado por uma condição de corrida que poderia, em circunstâncias raras, levar à perda de alguns arquivos de saída.
Databricks Runtime 3.5 LTS (EoS)
Consulte Databricks Runtime 3.5 LTS (EoS).
Novembro 7, 2019
- [FAÍSCA-29743]O exemplo [SQL] deve definir needCopyResult como true se o needCopyResult de seu filho for true
8 de outubro de 2019
- Alterações no lado do servidor para permitir que o driver Simba Apache Spark ODBC se reconecte e continue após uma falha de conexão durante a busca de resultados (requer a atualização do driver Simba Apache Spark ODBC para a versão 2.6.10).
Setembro 10, 2019
- [FAÍSCA-28699][SQL] Desativar o uso de radix sort para ShuffleExchangeExec no caso de repartição
9 de abril de 2019
- [FAÍSCA-26665][CORE] Corrija um bug que pode fazer com que BlockTransferService.fetchBlockSync trave para sempre.
Fevereiro 12, 2019
- Corrigido um problema que fazia com que o protocolo de rede de baixo nível do Spark pudesse ser quebrado ao enviar mensagens de erro RPC grandes com a criptografia habilitada (quando
spark.network.crypto.enabled
definido como true).
- Corrigido um problema que fazia com que o protocolo de rede de baixo nível do Spark pudesse ser quebrado ao enviar mensagens de erro RPC grandes com a criptografia habilitada (quando
30 de janeiro de 2019
- Corrigido um problema que podia fazer
df.rdd.count()
com que o UDT retornasse uma resposta incorreta para determinados casos.
- Corrigido um problema que podia fazer
Dezembro 18, 2018
- Ignore apenas arquivos corrompidos após uma ou mais novas tentativas quando
spark.sql.files.ignoreCorruptFiles
o sinalizador ouspark.sql.files.ignoreMissingFiles
estiver ativado. - Corrigido um problema que afetava determinadas consultas de auto-união.
- Ignore apenas arquivos corrompidos após uma ou mais novas tentativas quando
20 de novembro de 2018
- [FAÍSCA-25816]Resolução de atributos fixa em extratores aninhados.
Novembro 6, 2018
- [FAÍSCA-25714]Corrija a manipulação nula na regra do otimizador BooleanSimplification.
16 de outubro de 2018
- Corrigido um bug que afetava a
Union
operação.
- Corrigido um bug que afetava a
Setembro 25, 2018
- [FAÍSCA-25402][SQL] Tratamento nulo em BooleanSimplification.
- Corrigido
NotSerializableException
na fonte de dados Avro.
Setembro 11, 2018
- A redução de filtro deve manipular o valor nulo corretamente.
28 de Agosto de 2018
- Corrigido um bug no comando Delta Lake Delete que excluía incorretamente as linhas em que a condição é avaliada como nula.
- [FAÍSCA-25114]Corrija RecordBinaryComparator quando a subtração entre duas palavras é divisível por Integer.MAX_VALUE.
Agosto 23, 2018
- [SPARK-24809] Serializar LongHashedRelation no executor pode resultar num erro de dados.
- Corrigido o problema de mapa anulável no leitor Parquet.
- [FAÍSCA-25081]Corrigido um bug em que ShuffleExternalSorter pode acessar uma página de memória liberada quando o derramamento não consegue alocar memória.
- Corrigida uma interação entre Databricks Delta e Pyspark que poderia causar falhas de leitura transitórias.
28 de junho de 2018
- Corrigido um bug que poderia causar resultados de consulta incorretos quando o nome de uma coluna de partição usada em um predicado difere do caso dessa coluna no esquema da tabela.
28 de junho de 2018
- Corrigido um bug que poderia causar resultados de consulta incorretos quando o nome de uma coluna de partição usada em um predicado difere do caso dessa coluna no esquema da tabela.
Junho 7, 2018
- Corrigido um bug que afetava o mecanismo de execução do Spark SQL.
- Tratamento de erros melhorado no Delta Lake.
17 de maio de 2018
- Estabilidade melhorada na leitura de dados armazenados no Azure Data Lake Store.
- Corrigido um bug que afetava o cache RDD.
- Corrigido um bug que afetava Null-safe Equal no Spark SQL.
- Corrigido um bug que afetava determinadas agregações em consultas de streaming.
24 de abril de 2018
- SDK do Azure Data Lake Store atualizado de 2.0.11 para 2.2.8 para melhorar a estabilidade do acesso ao Azure Data Lake Store.
- Corrigido um bug que afetava a inserção de substituições em tabelas particionadas do Hive quando
spark.databricks.io.hive.fastwriter.enabled
éfalse
. - Corrigido um problema que falhava na serialização de tarefas.
Março 09, 2018
- Corrigido um problema causado por uma condição de corrida que poderia, em circunstâncias raras, levar à perda de alguns arquivos de saída.
Março 01, 2018
- Melhorou a eficiência do manuseio de fluxos que podem levar muito tempo para parar.
- Corrigido um problema que afetava o preenchimento automático do Python.
- Patches de segurança do Ubuntu aplicados.
- Corrigido um problema que afetava determinadas consultas usando UDFs Python e funções de janela.
- Corrigido um problema que afetava o uso de UDFs em um cluster com o controle de acesso à tabela habilitado.
Janeiro 29, 2018
- Corrigido um problema que afetava a manipulação de tabelas armazenadas no armazenamento de Blob do Azure.
- Agregação fixa após dropDuplicates em DataFrame vazio.
Tempo de execução do Databricks 3.4 (EoS)
Consulte Databricks Runtime 3.4 (EoS).
Junho 7, 2018
- Corrigido um bug que afetava o mecanismo de execução do Spark SQL.
- Tratamento de erros melhorado no Delta Lake.
17 de maio de 2018
- Estabilidade melhorada na leitura de dados armazenados no Azure Data Lake Store.
- Corrigido um bug que afetava o cache RDD.
- Corrigido um bug que afetava Null-safe Equal no Spark SQL.
24 de abril de 2018
- Corrigido um bug que afetava a inserção de substituições em tabelas particionadas do Hive quando
spark.databricks.io.hive.fastwriter.enabled
éfalse
.
- Corrigido um bug que afetava a inserção de substituições em tabelas particionadas do Hive quando
Março 09, 2018
- Corrigido um problema causado por uma condição de corrida que poderia, em circunstâncias raras, levar à perda de alguns arquivos de saída.
13 de dezembro de 2017
- Corrigido um problema que afetava UDFs no Scala.
- Corrigido um problema que afetava o uso do índice de pulo de dados em tabelas de fonte de dados armazenadas em caminhos não DBFS.
Dezembro 07, 2017
- Estabilidade de embaralhamento melhorada.
Versões não suportadas do Databricks Runtime
Para obter as notas de versão originais, siga o link abaixo do subtítulo.