Databricks Runtime 9.0 (EoS)
Observação
O suporte para esta versão do Databricks Runtime foi encerrado. Para obter a data de fim do suporte, consulte o Histórico de fim do suporte. Para ver todas as versões compatíveis do Databricks Runtime, consulte Versões de notas de versão do Databricks Runtime e compatibilidade.
As notas sobre a versão a seguir fornecem informações sobre o Databricks Runtime 9.0 e o Photon do Databricks Runtime 9.0, da plataforma do Apache Spark 3.1.2. O Databricks lançou essa versão em agosto de 2021. O Photon está em Visualização Pública.
Correção
Uma versão anterior dessas notas de versão declarava incorretamente que as dependências do Apache Parquet foram atualizadas da versão 1.10 para a 1.12. Na verdade, as dependências do Parquet permanecem na versão 1.10. A nota de versão incorreta foi removida.
Novos recursos e aprimoramentos
- Nova API para estatísticas resumidas de conjuntos de dados (Visualização Pública)
- Configuração de fonte de dados externa mais fácil para o conector do Azure Synapse
- Opcionalmente, limite a sessão a uma duração especificada para o conector do Amazon Redshift
- Carregador Automático
- SQL
- Suporte a R
- Evite refazer ao especificar o estado inicial para o processamento com estado de Streaming Estruturado
- Uma implementação de ordem aleatória baixa do comando MERGE INTO Delta agora está disponível (Visualização Pública)
Nova API para estatísticas resumidas de conjuntos de dados (Visualização Pública)
O novo comando dbutils.data.summarize
em Utilitários do Databricks permite iniciar um trabalho do Spark que calcula automaticamente as estatísticas resumidas nas colunas de um DataFrame do Spark e, em seguida, exibe os resultados interativamente. Essa função está disponível no Scala e no Python. Consulte Utilitário de dados (dbutils.data).
Configuração de fonte de dados externa mais fácil para o conector do Azure Synapse
A nova opção externalDataSource
no conector Consultar dados no Azure Synapse Analytics permite que você use uma fonte de dados externa pré-provisionada para ler um banco de dados do Azure Synapse. A opção externalDataSource
remove a necessidade da permissão CONTROL
necessária anteriormente.
Ao definir externalDataSource
, a fonte de dados externa e a opção tempDir
usada para configurar o armazenamento temporário devem referenciar o mesmo contêiner na conta de armazenamento.
Opcionalmente, limite a sessão a uma duração especificada para o conector do Amazon Redshift
A nova fs.s3a.assumed.role.session.duration
opção no conector Consultar o Amazon Redshift com o Azure Databricks permite que você defina opcionalmente uma duração para a sessão quando o Redshift estiver acessando o bucket S3 temporário com uma função assumida.
Carregador Automático
- Listagem de arquivo otimizada
- Armazenamento de dados de imagem otimizado
- Miniaturas de imagem para arquivos binários (Visualização Pública)
DirectoryRename
eventos permitem o processamento atômico de vários arquivos
Listagem de arquivo otimizada
As otimizações do Carregador Automático fornecem melhorias de desempenho e economia de custos ao listar diretórios aninhados no armazenamento em nuvem, incluindo AWS S3, ADLS Gen2 (Azure Data Lake Armazenamento Gen2) e GCS (Google Cloud Armazenamento).
Por exemplo, se você tivesse arquivos sendo carregados como /some/path/YYYY/MM/DD/HH/fileName
, para encontrar todos os arquivos nesses diretórios, o Carregador Automático costumava fazer uma listagem paralela de todos os subdiretórios, causando 365 (por dia) * 24 (por hora) = 8760 LIST de chamadas de diretório da API para o armazenamento subjacente para cada diretório de ano. Ao receber uma resposta nivelada desses sistemas de armazenamento, o Carregador Automático reduz o número de chamadas à API para o número de arquivos no sistema de armazenamento dividido pelo número de resultados retornados por cada chamada à API (1000 para S3, 5000 para ADLS Gen2 e 1024 para GCS), reduzindo significativamente os custos de nuvem.
Armazenamento de dados de imagem otimizado
O Carregador Automático agora pode detectar automaticamente os dados de imagem que estão sendo ingeridos e otimizar seu armazenamento em tabelas Delta para melhorar o desempenho de leitura e gravação. Confira Ingerir dados binários ou de imagem no Delta Lake para ML.
Miniaturas de imagem para arquivos binários (Visualização Pública)
As imagens no formato binaryFile
carregadas ou salvas como tabelas Delta usando o Carregador Automático têm anotações anexadas para que as miniaturas da imagem apareçam ao exibir a tabela em um notebook do Azure Databricks. Para obter mais informações, confira Imagens.
DirectoryRename
eventos permitem o processamento atômico de vários arquivos
Os fluxos do Carregador Automático criados no Databricks Runtime 9.0 e superior no Data Lake Storage Gen2 configuram notificações de eventos de arquivo para incluir renomeações de diretório e escutar eventos RenameDirectory
. É possível usar renomeações de diretório para fazer com que vários arquivos apareçam atomicamente no Carregador Automático.
SQL
- Excluir colunas em
SELECT *
(Visualização Pública) - Funções escalares do SQL (Visualização Pública)
- Referência de aliases e colunas anteriores em
FROM
subconsultas (Visualização Pública)
Excluir colunas em SELECT *
(Visualização Pública)
SELECT *
agora dá suporte a uma palavra-chave EXCEPT
, que permite excluir colunas de nível superior especificadas da expansão. Por exemplo, SELECT * EXCEPT (b) FROM tbl
de uma tabela com esquema expande (a, b, c)
para (a, c)
.
Funções escalares do SQL (Visualização Pública)
CREATE FUNCTION
agora dá suporte funções escalares do SQL. É possível criar funções escalares que levam um conjunto de argumentos e retornam um único valor de tipo escalar. O corpo da função do SQL pode ser qualquer expressão. Por exemplo:
CREATE FUNCTION square(x DOUBLE) RETURNS DOUBLE RETURN x * x;
SELECT square(2);
Para obter detalhes, consulte CRIAR FUNÇÃO (SQL e Python).
Referência de aliases e colunas anteriores em subconsultas FROM
(Visualização Pública)
As subconsultas FROM
na cláusula de uma consulta agora podem ser precedidas pela palavra-chave LATERAL
, que permite referenciar aliases e colunas nos itens FROM
anteriores. Por exemplo:
SELECT * FROM t1, LATERAL (SELECT * FROM t2 WHERE t1.c1 = t2.c1)
A palavra-chave LATERAL
dá suporte INNER
, CROSS
, e LEFT (OUTER) JOIN
.
Consulte Parâmetros e Parâmetros.
Suporte a R
Bibliotecas do R no escopo do notebook (Visualização Pública)
As bibliotecas no escopo do notebook permitem instalar bibliotecas e criar um ambiente com escopo para uma sessão de notebook. Essas bibliotecas não afetam outros notebooks em execução no mesmo cluster. As bibliotecas estão disponíveis nos nós de driver e de trabalho, portanto, você pode fazer referência a elas em funções definidas pelo usuário. Consulte Bibliotecas do R no escopo do notebook.
Mensagens de aviso em notebooks do R
O valor padrão da opção warn
agora está definido como 1 dentro de notebooks do R. Como resultado, todos os avisos agora são expostos como parte do resultado do comando. Para saber mais sobre a opção warn
, consulte Configurações de opções.
Evite refazer ao especificar o estado inicial para o processamento com estado de Streaming Estruturado
Agora você pode especificar um estado inicial definido pelo usuário para processamento com estado de streaming estruturado usando o operador [flat]MapGroupsWithState
.
Confira Especificar o estado inicial para mapGroupsWithState.
Uma implementação de ordem aleatória baixa do comando MERGE INTO Delta agora está disponível (Visualização Pública)
O comando Delta MERGE INTO
tem uma nova implementação disponível que reduz o embaraçamento de linhas não modificadas. Isso melhora o desempenho do comando e ajuda a preservar o clustering existente na tabela, como a ordenação Z. Para habilitar a mesclagem aleatória baixa, de definido spark.databricks.delta.merge.enableLowShuffle
como true
. Veja Mesclagem baixa de ordem aleatória no Azure Databricks.
Correções de bug
- Não é mais possível substituir uma exibição criando uma exibição com o mesmo nome.
Atualizações da biblioteca
- Bibliotecas do Python atualizadas:
- certificado de 2021.5.30 a 2020.12.5
- chardet de 3.0.4 a 4.0.0
- Cython de 0.29.21 a 0.29.23
- decorador de 4.4.2 a 5.0.6
- ipython de 7.19.0 a 7.22.0
- joblib de 0.17.0 a 1.0.1
- jupyter-client de 6.1.7 a 6.1.12
- jupyter-core de 4.6.3 a 4.7.1
- kiwisolver de 1.3.0 a 1.3.1
- matplotlib de 3.2.2 a 3.4.2
- pandas de 1.1.5 a 1.2.4
- pip de 20.2.4 a 21.0.1
- prompt-toolkit de 3.0.8 a 3.0.17
- protobuf de 3.17.3 a 3.17.2
- ptyprocess de 0.6.0 a 0.7.0
- pyarrow de 1.0.1 a 4.0.0
- Pygments de 2.7.2 a 2.8.1
- pyzmq de 19.0.2 a 20.0.0
- solicitações de 2.24.0 a 2.25.1
- s3transfer de 0.3.6 a 0.3.7
- scikit-learn de 0.23.2 a 0.24.1
- scipy de 1.5.2 a 1.6.2
- seaborn de 0.10.0 a 0.11.1
- setuptools de 50.3.1 a 52.0.0
- statsmodels de 0.12.0 a 0.12.2
- tornado de 6.0.4 a 6.1
- virtualenv de 20.2.1 a 20.4.1
- roda de 0.35.1 a 0.36.2
- Bibliotecas do R atualizadas:
- Matriz de 1.3-3 a 1.3-4
Apache Spark
Databricks Runtime 9.0 inclui o Apache Spark 3.1.2. Esta versão inclui todas as correções e melhorias do Spark incluídas no Databricks Runtime 8.4 (EoS), bem como as seguintes correções de bugs e melhorias adicionais feitas no Spark:
- [SPARK-35886] [SQL][3.1] PromotePrecision não deve substituir genCodePromotePrecision não deve substituir genCode
- [SPARK-35879] [CORE][SHUFFLE] Correção da regressão de desempenho causada por collectFetchRequests
- [SPARK-35817] [SQL][3.1] Restaurar o desempenho de consultas em tabelas Avro amplas
- [SPARK-35841] [SQL] A transmissão da cadeia de caracteres para o tipo decimal não funcionará se o...
- [SPARK-35783] [SQL] Definir a lista de colunas de leitura na configuração da tarefa para reduzir a leitura de dados ORC
- [SPARK-35576] [SQL][3.1] Editar as informações confidenciais no resultado do comando Set
- [SPARK-35449] [SQL][3.1] Extrair apenas expressões comuns de valores CaseWhen se elseValue for definido
- [SPARK-35288] [SQL] StaticInvoke deve encontrar o método sem a combinação exata de classes de argumento
- [SPARK-34794] [SQL] Corrigir problemas de nome de variável lambda em funções aninhadas do DataFrame
- [SPARK-35278] [SQL] A invocação deve encontrar o método com o número correto de parâmetros
- [SPARK-35226] [SQL] Opção refreshKrb5Config em fonte de dados JDBC
- [SPARK-35244] [SQL] A invocação deve lançar a exceção original
- [SPARK-35213] [SQL] Mantenha a ordenação correta de structs aninhados em operações encadeadas withField
- [SPARK-35087] [interface do usuário] Algumas colunas na tabela Métricas Agregadas por Executor da página de detalhes do estágio são apresentadas incorretamente.
- [SPARK-35168] [SQL] mapred.reduce.tasks devem ser shuffle.partitions não adaptive.coalescePartitions.initialPartitionNum
- [SPARK-35127] [interface do usuário] Quando alternamos entre diferentes páginas de detalhes de estágio, o item de entrada na página recém-aberta pode estar em branco
- [SPARK-35142] [PYTHON][ML] Corrigir o tipo de retorno incorreto para
rawPredictionUDF
emOneVsRestModel
- [SPARK-35096] [SQL] O SchemaPruning deve aderir à configuração spark.sql.caseSensitive
- [SPARK-34639] [SQL][3.1] RelationalGroupedDataset.alias não deve criar UnresolvedAlias
- [SPARK-35080] [SQL] Permitir apenas um subconjunto de predicados de igualdade correlacionados quando uma subconsulta é agregada
- [SPARK-35117] [interface do usuário] Alterar a barra de progresso de volta para realça a taxa de tarefas em andamento
- [SPARK-35136] Remover o valor nulo inicial de LiveStage.info
- [SPARK-34834] [REDE] Corrigir um possível vazamento de memória Netty em TransportResponseHandler
- [SPARK-35045] [SQL] Adicionar uma opção interna para controlar o buffer de entrada em univocidade
- [SPARK-35014] Corrige o padrão PhysicalAggregation para não reescrever expressões fold
- [SPARK-35019] [PYTHON][SQL] Corrigir incompatibilidades de dicas de tipo em pyspark.sql.*
- [SPARK-34926] [SQL][3.1] PartitioningUtils.getPathFragment() deve respeitar o valor da partição é nulo
- [SPARK-34630] [PYTHON] Adicionar typehint para pyspark. Versão
- [SPARK-34963] [SQL] Correção da remoção de coluna aninhada para extrair o campo de struct sem valor de maiúsculas e minúsculas da matriz de struct
- [SPARK-34988] [CORE][3.1] Atualizar Jetty para CVE-2021-28165
- [SPARK-34922] [SQL][3.1] Usar uma função de comparação de custo relativo no CBO
- [SPARK-34970] [SQL][SECURITY][3.1] Redigir opções de map-type na saída de explain()
- [SPARK-34923] [SQL] A saída de metadados deve estar vazia para mais planos
- [SPARK-34949] [CORE] Impedir o novo registro do BlockManager quando o Executor estiver sendo desligado
- [SPARK-34939] [CORE] Lançar exceção de falha de busca quando não for possível desserializar os status do mapa transmitido
- [SPARK-34909] [SQL] Correção da conversão de negativo em não assinado em conv()
- [SPARK-34845] [CORE] ProcfsMetricsGetter não deve retornar métricas de procfs parciais
- [SPARK-34814] [SQL] LikeSimplification deve manipular NULL
- [SPARK-34876] [SQL] Preenchimento defaultResult de agregações não anuladas
- [SPARK-34829] [SQL] Corrigir resultados da função de ordem superior
- [SPARK-34840] [SHUFFLE] Corrigir casos de corrupção em embaralhamento mesclado...
- [SPARK-34833] [SQL] Aplicar o preenchimento à direita corretamente para subconsultas correlacionadas
- [SPARK-34630] [PYTHON][SQL] Adicionado typehint para pyspark.sql.Column.contains
- [SPARK-34763] [SQL] col(), $”name” e df(“name”) devem tratar os nomes de coluna entre aspas corretamente
- [SPARK-33482] [SPARK-34756] [SQL] Corrigir a verificação de igualdade do FileScan
- [SPARK-34790] [CORE] Desabilitar a busca de blocos de embaralhamento no lote quando a criptografia de E/S estiver habilitada
- [SPARK-34803] [PYSPARK] Passe o ImportError gerado se pandas ou pyarrow falharem na importação
- [SPARK-34225] [CORE] Não codificar mais quando uma cadeia de caracteres de formulário de URI for passada para addFile ou addJar
- [SPARK-34811] [CORE] Editar fs.s3a.access.key como segredo e token
- [SPARK-34796] [SQL][3.1] Inicializar variável de contador para LIMIT code-gen em doProduce()
- [SPARK-34128] [SQL] Suprimir avisos TTransportException indesejáveis envolvidos no THRIFT-4805
- [SPARK-34776] [SQL] A remoção de coluna aninhada não deve remoção de atributos produzidos pela janela
- [SPARK-34087] [3.1][SQL] Correção do vazamento de memória de ExecutionListenerBus
- [SPARK-34772] [SQL] RebaseDateTime loadRebaseRecords deve usar o carregador de classe Spark em vez do contexto
- [SPARK-34719] [SQL][3.1] Resolver corretamente a consulta de exibição com nomes de coluna duplicados
- [SPARK-34766] [SQL][3.1] Não capturar a configuração do Maven para exibições
- [SPARK-34731] [CORE] Evite ConcurrentModificationException ao redigir propriedades em EventLoggingListener
- [SPARK-34737] [SQL][3.1] Fazer a entrada de entrada float para dobrar
TIMESTAMP_SECONDS
- [SPARK-34749] [SQL][3.1] Simplificar ResolveCreateNamedStruct
- [SPARK-34768] [SQL] Respeitar o tamanho padrão do buffer de entrada em Univocity
- [SPARK-34770] [SQL] InMemoryCatalog.tableExists não deverá falhar se o banco de dados não existir
- [SPARK-34504] [SQL] Evite resolver desnecessariamente o SQL de exibições temporárias para comandos DDL
- [SPARK-34727] [SQL] Correção da discrepância na transmissão de float para o carimbo de data/hora
- [SPARK-34723] [SQL] Tipo de parâmetro correto para eliminação de subexpressão em estágio inteiro
- [SPARK-34724] [SQL] Correção da avaliação interpretada usando getMethod em vez de getDeclaredMethod
- [SPARK-34713] [SQL] Corrigir grupo por CreateStruct com ExtractValue
- [SPARK-34697] [SQL] Permitir DESCREVER FUNÇÃO e MOSTRAR FUNÇÕES explicam sobre || (operador de concatenação de cadeia de caracteres)
- [SPARK-34682] [SQL] Usar PrivateMethodTester em vez de reflexão
- [SPARK-34682] [SQL] Correção da regressão na verificação de erros de canonização em CustomShureadReaderExec
- [SPARK-34681] [SQL] Correção de bug para a junção de hash embaralhada externa completa ao compilar o lado esquerdo com condição não igual
- [SPARK-34545] [SQL] Correção de problemas com o recurso valueCompare de seu uso
- [SPARK-34607] [SQL][3.1] Adicionar
Utils.isMemberClass
para corrigir um erro de nome de classe malformado no jdk8u - [SPARK-34596] [SQL] Use Utils.getSimpleName para evitar atingir o nome da classe Malformed em NewInstance.doGenCode
- [SPARK-34613] [SQL] A exibição de correção não captura configuração de dica de desabilitação
- [SPARK-32924] [WEBUI] Fazer a coluna duração na interface do usuário mestra classificação na ordem correta
- [SPARK-34482] [SS] Corrigir a SparkSession ativa para StreamExecution.logicalPlan
- [SPARK-34567] [SQL] CreateTableAsSelect também deve atualizar as métricas
- [SPARK-34599] [SQL] Corrige o problema em que INSERIR EM SUBSTITUIÇÃO não dá suporte a colunas de partição que contêm ponto para DSv2
- [SPARK-34577] [SQL] Correção de soltar/adicionar colunas a um conjuntos de dados de
DESCRIBE NAMESPACE
- [SPARK-34584] [SQL] A partição estática também deve seguir StoreAssignmentPolicy ao inserir em tabelas v2
- [SPARK-34555] [SQL] Resolver a saída de metadados do DataFrame
- [SPARK-34534] Corrige a ordem de blockIds ao usar o FetchShuffleBlocks para pegar os blocos
- [SPARK-34547] [SQL] Usar apenas colunas de metadados para resolução como último recurso
- [SPARK-34417] [SQL] org.apache.spark.sql.DataFrameNaFunctions.fillMap falha para o nome da coluna que tem um ponto
- [SPARK-34561] [SQL] Correção de soltar/adicionar colunas de/para um conjunto de dados do v2
DESCRIBE TABLE
- [SPARK-34556] [SQL] A verificação de colunas de partição estática duplicada deve respeitar a verificação de minúsculas
- [SPARK-34392] [SQL] suporte a ZoneOffset + h:mm em DateTimeUtils. getZoneId
- [SPARK-34550] [SQL] Ignorar valor nulo de inserção durante o filtro de push para metastore do Hive
- [SPARK-34543] [SQL] respeitar a configuração
spark.sql.caseSensitive
ao resolver a especificação de partição em v1SET LOCATION
- [SPARK-34436] [SQL] Suporte a DPP como qualquer expressão/todas
- [Spark-34531] [CORE] Remover marca de API experimental em PrometheusServlet
- [SPARK-34497] [SQL] Corrigir os provedores de conexão JDBC internos para restaurar as alterações do contexto de segurança da JVM
- [SPARK-34515] [SQL] Corrigir NPE se InSet contiver valor nulo durante getPartitionsByFilter
- [SPARK-34490] [SQL] A análise deverá falhar se a exibição se referir a uma tabela descartado
- [SPARK-34473] [SQL] Evitar NPE em DataFrameReader.schema(StructType)
- [SPARK-34384] [CORE] Adicionar documentos ausentes para as APIs ResourceProfile
- [SPARK-34373] [SQL] HiveThriftServer2 startWithContext pode ficar com um problema de corrida
- [SPARK-20977] [CORE] Use um campo não final para o estado de CollectionAccumulator
- [SPARK-34421] [SQL] Resolver funções e exibições temporárias em exibições com CTEs
- [SPARK-34431] [CORE] Carregar apenas
hive-site.xml
uma vez - [SPARK-34405] [CORE] Corrigir o valor médio de timersLabels na classe PrometheusServlet
- [SPARK-33438] [SQL] Objetos de inicialização com afinco com as Confs do SQL definidos para comando
set -v
- [SPARK-34158] URL incorreta do único desenvolvedor Matei em pom.xml
- [SPARK-34346] [CORE][SQL][3.1] io.file.buffer.size definido por spark.buffer.size substituirá carregando hive-site.xml acidentalmente pode causar regressão do desempenho
- [SPARK-34359] [SQL][3.1] Adicionar uma configuração herdada para restaurar o esquema de saída de MOSTRAR BANCOS DE DADOS
- [SPARK-34331] [SQL] Acelerar a resolução de col de metadados DS v2
- [SPARK-34318] [SQL][3.1] Dataset.colRegex deve funcionar com nomes de coluna e qualificadores que contêm novas linhas
- [SPARK-34326] [CORE][SQL] Correção de UTs adicionadas no SPARK-31793, dependendo do comprimento do caminho temporário
- [SPARK-34319] [SQL] Resolver atributos duplicados para FlatMapCoGroupsInPandas/MapInPandas
- [SPARK-34310] [CORE][SQL] Substitui o mapa e o nivela por flatMap
- [SPARK-34083] [SQL][3.1] Usando definições originais de TPCDS para colunas char/varchar
- [SPARK-34233] [SQL][3.1] CORRIGIR NPE para preenchimento de caracteres na comparação binária
- [SPARK-34270] [SS] Combinar StateStoreMetrics não deve substituir StateStoreCustomMetric
- [SPARK-34144] [SQL] Exceção lançada ao tentar gravar valores LocalDate e Instant em uma relação JDBC
- [SPARK-34273] [CORE] Não faça o registro do BlockManager de novo quando SparkContext for interrompido
- [SPARK-34262] [SQL][3.1] Atualizar dados armazenados em cache da tabela v1 no
ALTER TABLE .. SET LOCATION
- [SPARK-34275] [CORE][SQL][MLLIB] Substitui filtro e tamanho pela contagem
- [SPARK-34260] [SQL] Corrigir UnresolvedException ao criar a exibição temporária duas vezes
- [SPARK-33867] [SQL] Valores instantâneos e LocalDate não são tratados ao gerar consultas do SQL
- [SPARK-34193] [CORE] O gerenciador de blocos TorrentBroadcast desativa a correção de corrida
- [SPARK-34221] [WEBUI] Verifique se um estágio falha na página da interface do usuário, a mensagem de erro correspondente pode ser exibida corretamente
- [SPARK-34236] [SQL] Correção v2 Aumento de partição estática w/ nula Não é possível converter expressão em filtro de origem: nulo
- [SPARK-34212] [SQL] Corrigir leitura decimal incorreta de arquivos Parquet
- [SPARK-34244] [SQL] Remover a versão da função Scala do regexp_extract_all
- [SPARK-34235] [SS] Tornar spark.sql.hive como um pacote privado
- [SPARK-34232] [CORE] Editar o evento SparkListenerEnvironmentUpdate no log
- [SPARK-34229] [SQL] Avro deve ler valores decimais com o esquema de arquivo
- [SPARK-34223] [SQL] CORRIGIR NPE para partição estática com nulo em InsertIntoHadoopFsRelationCommand
- [SPARK-34192] [SQL] Mover o preenchimento char para o lado de gravação e remover a verificação de comprimento no lado de leitura também
- [SPARK-34203] [SQL] Converter valores
null
de partição em__HIVE_DEFAULT_PARTITION__
no catálogo v1In-Memory
- [SPARK-33726] [SQL] Correção para nomes de campo duplicados durante a agregação
- [SPARK-34133] [AVRO] Respeitar a sensibilidade de caso ao executar a correspondência de campo do Catalyst para Avro
- [SPARK-34187] [SS] Usar o intervalo de deslocamento disponível obtido durante a sondagem ao verificar a validação de deslocamento
- [SPARK-34052] [SQL][3.1] Armazenar texto do SQL para uma exibição temporária criada usando “TABELA DE CACHE .. COMO SELECIONAR …”
- [SPARK-34213] [SQL] Atualizar dados armazenados em cache da tabela v1 no
LOAD DATA
- [SPARK-34191] [PYTHON][SQL] Adicionar digitação para sobrecarga udf
- [SPARK-34200] [SQL] A referência de coluna ambígua deve considerar a disponibilidade do atributo
- [SPARK-33813] [SQL][3.1] Correção do problema em que a fonte JDBC não pode tratar os tipos espaciais do MS SQL Server
- [SPARK-34178] [SQL] Copiar marcas para o novo nó criado por MultiInstanceRelation.newInstance
- [SPARK-34005] [CORE][3.1] Atualizar métricas de memória de pico para cada Executor no final da tarefa
- [SPARK-34115] [CORE] Verificar SPARK_TESTING como val lento para evitar lentidão
- [SPARK-34153] [SQL][3.1][3.0] Remover não utilizado
getRawTable()
deHiveExternalCatalog.alterPartitions()
- [SPARK-34130] [SQL] Melhorar o desempenho para preenchimento de char varchar e verificação de comprimento com StaticInvoke
- [SPARK-34027] [SQL][3.1] Atualizar o cache no
ALTER TABLE .. RECOVER PARTITIONS
- [SPARK-34151] [SQL] Substitui
java.io.File.toURL
porjava.io.File.toURI.toURL
- [SPARK-34140] [SQL][3.1] Mover QueryCompilationErrors.scala para org/apache/spark/sql/errors
- [SPARK-34080] [ML][PYTHON] Adicionar UnivariateFeatureSelector
- [SPARK-33790] [CORE][3.1] Reduzir a chamada rpc de getFileStatus em SingleFileEventLogFileReader
- [SPARK-34118] [CORE][SQL][3.1] Substitui o filtro e verifica se existe ou forall
- [SPARK-34114] [SQL] não deve cortar direito para verificação e preenchimento de comprimento de caractere do lado da leitura
- [SPARK-34086] [SQL][3.1] RaiseError gera muito código e pode falhar na verificação de codegen em comprimento para char varchar
- [SPARK-34075] [SQL][CORE] Diretórios ocultos estão sendo listados para inferência de partição
- [SPARK-34076] [SQL] SQLContext.dropTempTable falhará se o cache não estiver vazio
- [SPARK-34084] [SQL][3.1] Corrigir atualização automática de estatísticas de tabela no
ALTER TABLE .. ADD PARTITION
- [SPARK-34090] [SS] Cache HadoopDelegationTokenManager.isServiceEnabled resultado usado em KafkaTokenUtil.needTokenUpdate
- [SPARK-34069] [CORE] Tarefas de barreira de encerramento devem respeitar SPARK_JOB_INTERRUPT_ON_CANCEL
- [SPARK-34091] [SQL] A busca em lote aleatória deve ser capaz de desabilitar depois que ela for habilitada
- [SPARK-34059] [SQL][CORE][3.1] Usar for/foreach em vez de mapear para certificar-se de executá-lo com ânsia
- [SPARK-34002] [SQL] Corrigir o uso do codificador no ScalaUDF
- [SPARK-34060] [SQL][3.1] Corrigir o cache de tabela do Hive ao atualizar estatísticas por
ALTER TABLE .. DROP PARTITION
- [SPARK-31952] [SQL] Corrigir métrica de vazamento de memória incorreta ao fazer a agregação
- [SPARK-33591] [SQL][3.1] Reconhecer
null
em valores de especificação de partição - [SPARK-34055] [SQL][3.1] Atualizar o cache no
ALTER TABLE .. ADD PARTITION
- [SPARK-34039] [SQL][3.1] ReplaceTable deve invalidar o cache
- [SPARK-34003] [SQL] Corrigir conflitos de regra entre PaddingAndLengthCheckForCharVarchar e ResolveAggregateFunctions
- [SPARK-33938] [SQL][3.1] Otimizar como qualquer/tudo por LikeSimplification
- [SPARK-34021] [R] Corrigir hiper links na documentação do SparkR para envio CRAN
- [SPARK-34011] [SQL][3.1][3.0] Atualizar o cache no
ALTER TABLE .. RENAME TO PARTITION
- [SPARK-33948] [SQL] Correção do erro CodeGen do método MapObjects.doGenCode no Scala 2.13
- [SPARK-33635] [SS] Ajuste a ordem de verificação em KafkaTokenUtil.needTokenUpdate para corrigir a regressão de desempenho
- [SPARK-33029] [CORE][WEBUI] Corrigir a página do executor da interface do usuário marcando incorretamente o driver como excluído
- [SPARK-34015] [R] Corrigindo o tempo de entrada no gapply
- [SPARK-34012] [SQL] Manter o comportamento consistente quando conf
spark.sql.legacy.parser.havingWithoutGroupByAsWhere
for verdadeiro com o guia de migração - [SPARK-33844] [SQL][3.1] O comando InsertIntoHiveDir também deve verificar o nome col
- [SPARK-33935] [SQL] Corrigir função de custo CBO
- [SPARK-33100] [SQL] Ignorar um ponto e vírgula dentro de um comentário entre colchetes no spark-sql
- [SPARK-34000] [CORE] Corrigir stageAttemptToNumSpeculativeTasks java.util.NoSuchElementException
- [SPARK-33992] [SQL] Substir transformUpWithNewOutput para adicionar allowInvokingTransformsInAnalyzer
- [SPARK-33894] [SQL] Alterar a visibilidade de classes de caso particular em mllib para evitar erros de compilação em tempo de execução com Scala 2.13
- [SPARK-33950] [SQL][3.1][3.0] Atualizar o cache no v1
ALTER TABLE .. DROP PARTITION
- [SPARK-33980] [SS] Invalidar char/varchar em Spark. readStream. Schema
- [SPARK-33945] [SQL] [3.1] Manipular uma semente aleatória que consiste em uma árvore de expr
- [SPARK-33398] Corrigir modelos de árvore de carregamento antes do Spark 3.0
- [SPARK-33963] [SQL] Canonizar
HiveTableRelation
as estatísticas da tabela w/o - [SPARK-33906] [WEBUI] Corrigir o bug da página do executor da interface do usuário devido a peakMemoryMetrics indefinido
- [SPARK-33944] [SQL] Registro em log incorreto para chaves de depósito em opções de SharedState
- [SPARK-33936] [SQL] [3.1] Adicionar a versão quando as interfaces do conector foram adicionadas
- [SPARK-33916] [núcleo] Corrigir o deslocamento do armazenamento de fallback e melhorar a cobertura do teste do codec de compactação
- [SPARK-33899] [SQL] [3.1] Corrigir falha de declaração em v1 mostrar tabelas/exibições em
spark_catalog
- [SPARK-33901] [SQL] Corrigir o erro de exibição de Char e Varchar após DDLs
- [SPARK-33897] [SQL] Não é possível definir a opção ' cross ' no método join
- [SPARK-33907] [SQL] [3.1] Remover apenas colunas de JsonToStructs se as opções de análise estiverem vazias
- [SPARK-33621] [SPARK-33784] [SQL][3.1] Adicionar uma maneira de injetar regras de reescrita na fonte de dados
- [SPARK-33900] [WEBUI] Mostrar o tamanho de leitura aleatória/registros corretamente quando apenas remotebytesread estiver disponível
- [SPARK-33892] [SQL] Exibir char/varchar em DESC e mostrar CREATE TABLE
- [SPARK-33895] [SQL] Char e Varchar falham em MetaOperação de ThriftServer
- [SPARK-33659] [SS] Documentar o comportamento atual para a API datastreamwriter. ToTable
- [SPARK-33893] [núcleo] Excluir gerenciador de bloqueio de fallback da executorlist
- [SPARK-33277] [PYSPARK] [SQL] Usar ContextAwareIterator para parar de consumir após o término da tarefa
- [SPARK-33889] [SQL] [3.1] Corrigir o NPE de
SHOW PARTITIONS
em tabelas V2 - [SPARK-33879] [SQL] os valores Varchar de Char falham w/correspondem ao erro como colunas de partição
- [SPARK-33877] [SQL] Documentos de referência SQL para INSERIR w/uma lista de colunas
- [SPARK-33876] [SQL] Adicionar comprimento-verificação para ler char/varchar de tabelas com um local externo
- [SPARK-33846] [SQL] Incluir comentários para um esquema aninhado em structtype. toDDL
- [SPARK-33860] [SQL] Fazer CatalystTypeConverters. convertToCatalyst corresponder ao valor de matriz especial
- [SPARK-33834] [SQL] Verificar coluna alterar alteração de tabela com Char e Varchar
- [SPARK-33853] [SQL] EXPLIQUE O CODEGEN e BenchmarkQueryTest não mostram o código de subconsulta
- [SPARK-33836] [SS] [Python] Expor DataStreamReader.table e DataStreamWriter.toTable
- [SPARK-33829] [SQL] [3.1] Renomear as tabelas v2 deve recriar o cache
- [SPARK-33756] [SQL] Tornar o idempotente MapIterator de BytesToBytesMap
- [SPARK-33850] [SQL] EXPLICAÇÃO FORMATADA não mostra o plano para subconsultas se AQE estiver habilitado
- [SPARK-33841] [núcleo] [3.1] Corrigir problema com trabalhos desaparecendo de forma intermitente do SHS em alta carga
- [SPARK-33593] [SQL] O leitor de vetor recebeu dados incorretos com o valor de partição binária
- [SPARK-26341] [WEBUI] Expor métricas de memória de executor no nível de estágio, na guia estágios
- [SPARK-33831] [UI] Atualizar para Jetty 9.4.34
- [SPARK-33822] [SQL] Usar o método
CastSupport.cast
em HashJoin - [SPARK-33774] [UI] [núcleo] de volta ao mestre "retorna 500 erro no cluster autônomo
- [SPARK-26199] [SPARK-31517] [R] Corrigir a estratégia para lidar com ... nomes em mutação
- [SPARK-33819] [Core] [3.1] SingleFileEventLogFileReader/RollingEventLogFilesFileReader devem ser
package private
- [SPARK-33697] [SQL] RemoveRedundantProjects deve exigir ordenação de coluna por padrão
- [SPARK-33752] [SQL] [3.1] Evitar o getSimpleMessage de analysisexception adiciona ponto e vírgula repetidamente
- [SPARK-33788] [SQL] [3.1] [3.0] [2.4] Lançar NoSuchPartitionsException do HiveExternalCatalog. dropPartitions ()
- [SPARK-33803] [SQL] Classificar propriedades da tabela por chave no comando descrever tabela
- [SPARK-33786] [SQL] O nível de armazenamento para um cache deve ser respeitado quando um nome de tabela é alterado
- [SPARK-33273] [SQL] Corrigir uma condição de corrida na execução da subconsulta
- [SPARK-33653] [SQL] [3.1] DSv2: a TABELA DE ATUALIZAÇÃO deve armazenar novamente em cache a própria tabela
- [SPARK-33777] [SQL] Classificar saída de V2 mostrar partições
- [SPARK-33733] [SQL] PullOutNondeterministic deve verificar e coletar o campo determinístico
- [SPARK-33764] [SS] Tornar o intervalo de manutenção do repositório de estado como configuração do SQL
- [SPARK-33729] [SQL] Ao atualizar o cache, o SPARK não deve usar o plano armazenado em cache ao rearmazenar os dados em cache
- [SPARK-33742] [SQL] [3.1] Lançar PartitionsAlreadyExistException do HiveExternalCatalog. createpartitions ()
- [SPARK-33706] [SQL] Requer identificador de partição totalmente especificado em partitionExists ()
- [SPARK-33740] [SQL] As configurações do hadoop no hive-site.xml podem substituir os hadoop pré-existentes
- [SPARK-33692] [SQL] A exibição deve usar o catálogo e o namespace capturados para a função de pesquisa
- [Spark-33669] Mensagem de erro incorreta do monitor de estado do aplicativo YARN quando SC. Stop no modo de cliente do yarn
- [SPARK-32110] [SQL] Normalizar números flutuantes especiais no HyperLogLog++
- [SPARK-33677] [SQL] Ignorar regra LikeSimplification se o padrão contiver qualquer escapeChar
- [SPARK-33693] [SQL] Preterido spark.sql.hive.convertCTAS
- [SPARK-33641] [SQL] Invalidar novos tipos char/varchar em APIs públicas que produzem resultados incorretos
- [SPARK-32680] [SQL] Não pré-processe CTAS V2 com consulta não resolvida
- [SPARK-33676] [SQL] Exigir correspondência exata da especificação de partição para o esquema na V2
ALTER TABLE .. ADD/DROP PARTITION
- [SPARK-33670] [SQL] Verificar se o provedor de partição é Hive no v1 MOSTRAR TABELA ESTENDIDA
- [SPARK-33663] [SQL] O armazenamento em cache não deve ser chamado em exibições temporárias não existentes
- [SPARK-33667] [SQL] respeitar a configuração
spark.sql.caseSensitive
ao resolver a especificação de partição em v1SHOW PARTITIONS
- [SPARK-33652] [SQL] DSv2: DeleteFrom deve atualizar o cache
Atualizações de manutenção
Confira Atualizações de manutenção do Databricks Runtime 9.0.
Ambiente do sistema
- Sistema operacional: Ubuntu 20.04.2 LTS
- Java: Zulu 8.54.0.21-CA-linux64
- Scala: 2.12.10
- Python: 3.8.10
- R: 4.1.0 (2021-05-18)
- Delta Lake 1.0.0
Bibliotecas Python instaladas
Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
---|---|---|---|---|---|
Antergos Linux | 2015.10 (atualização cumulativa de ISO) | appdirs | 1.4.4 | backcall | 0.2.0 |
boto3 | 1.16.7 | botocore | 1.19.7 | certifi | 2020.12.5 |
chardet | 4.0.0 | cycler | 0.10.0 | Cython | 0.29.23 |
dbus-python | 1.2.16 | decorator | 5.0.6 | distlib | 0.3.2 |
distro-info | 0.23ubuntu1 | facets-overview | 1.0.0 | filelock | 3.0.12 |
idna | 2.10 | ipykernel | 5.3.4 | ipython | 7.22.0 |
ipython-genutils | 0.2.0 | jedi | 0.17.2 | jmespath | 0.10.0 |
joblib | 1.0.1 | jupyter-client | 6.1.12 | jupyter-core | 4.7.1 |
kiwisolver | 1.3.1 | koalas | 1.8.1 | matplotlib | 3.4.2 |
numpy | 1.19.2 | pandas | 1.2.4 | parso | 0.7.0 |
patsy | 0.5.1 | pexpect | 4.8.0 | pickleshare | 0.7.5 |
Pillow | 8.2.0 | pip | 21.0.1 | plotly | 4.14.3 |
prompt-toolkit | 3.0.17 | protobuf | 3.17.2 | psycopg2 | 2.8.5 |
ptyprocess | 0.7.0 | pyarrow | 4.0.0 | Pygments | 2.8.1 |
PyGObject | 3.36.0 | pyparsing | 2.4.7 | python-apt | 2.0.0+ubuntu0.20.4.5 |
python-dateutil | 2.8.1 | pytz | 2020.5 | pyzmq | 20.0.0 |
solicitações | 2.25.1 | requests-unixsocket | 0.2.0 | retrying | 1.3.3 |
s3transfer | 0.3.7 | scikit-learn | 0.24.1 | scipy | 1.6.2 |
seaborn | 0.11.1 | setuptools | 52.0.0 | six | 1.15.0 |
ssh-import-id | 5.10 | statsmodels | 0.12.2 | threadpoolctl | 2.1.0 |
tornado | 6.1 | traitlets | 5.0.5 | unattended-upgrades | 0,1 |
urllib3 | 1.25.11 | virtualenv | 20.4.1 | wcwidth | 0.2.5 |
wheel | 0.36.2 |
Bibliotecas R instaladas
As bibliotecas do R são instaladas do instantâneo do Microsoft CRAN em 2021-07-28.
Biblioteca | Versão | Biblioteca | Versão | Biblioteca | Versão |
---|---|---|---|---|---|
askpass | 1,1 | assertthat | 0.2.1 | backports | 1.2.1 |
base | 4.1.0 | base64enc | 0.1-3 | BH | 1.72.0-3 |
bit | 4.0.4 | bit64 | 4.0.5 | blob | 1.2.1 |
boot | 1.3-28 | brew | 1.0-6 | brio | 1.1.0 |
broom | 0.7.2 | callr | 3.5.1 | sinal de interpolação | 6.0-86 |
cellranger | 1.1.0 | chron | 2.3-56 | classe | 7.3-19 |
cli | 2.2.0 | clipr | 0.7.1 | cluster | 2.1.2 |
codetools | 0.2-18 | colorspace | 2.0-0 | commonmark | 1,7 |
compiler | 4.1.0 | config | 0.3 | covr | 3.5.1 |
cpp11 | 0.2.4 | crayon | 1.3.4 | credenciais | 1.3.0 |
crosstalk | 1.1.0.1 | curl | 4.3 | data.table | 1.13.4 |
conjuntos de dados | 4.1.0 | DBI | 1.1.0 | dbplyr | 2.0.0 |
desc | 1.2.0 | devtools | 2.3.2 | diffobj | 0.3.2 |
digest | 0.6.27 | dplyr | 1.0.2 | DT | 0.16 |
ellipsis | 0.3.1 | evaluate | 0,14 | fansi | 0.4.1 |
farver | 2.0.3 | fastmap | 1.0.1 | forcats | 0.5.0 |
foreach | 1.5.1 | foreign | 0.8-81 | forge | 0.2.0 |
fs | 1.5.0 | future | 1.21.0 | Genéricos | 0.1.0 |
gert | 1.0.2 | ggplot2 | 3.3.2 | gh | 1.2.0 |
gitcreds | 0.1.1 | glmnet | 4.0-2 | globals | 0.14.0 |
glue | 1.4.2 | gower | 0.2.2 | elemento gráfico | 4.1.0 |
grDevices | 4.1.0 | grade | 4.1.0 | gridExtra | 2.3 |
gsubfn | 0.7 | gtable | 0.3.0 | haven | 2.3.1 |
highr | 0.8 | hms | 0.5.3 | htmltools | 0.5.0 |
htmlwidgets | 1.5.3 | httpuv | 1.5.4 | httr | 1.4.2 |
hwriter | 1.3.2 | hwriterPlus | 1.0-3 | ini | 0.3.1 |
ipred | 0.9-9 | isoband | 0.2.3 | iterators | 1.0.13 |
jsonlite | 1.7.2 | KernSmooth | 2.23-20 | knitr | 1.30 |
labeling | 0.4.2 | later | 1.1.0.1 | lattice | 0.20-44 |
lava | 1.6.8.1 | lazyeval | 0.2.2 | ciclo de vida | 0.2.0 |
listenv | 0.8.0 | lubridate | 1.7.9.2 | magrittr | 2.0.1 |
markdown | 1,1 | MASS | 7.3-54 | Matriz | 1.3-4 |
memoise | 1.1.0 | methods | 4.1.0 | mgcv | 1.8-36 |
mime | 0,9 | ModelMetrics | 1.2.2.2 | modelr | 0.1.8 |
munsell | 0.5.0 | nlme | 3.1-152 | nnet | 7.3-16 |
numDeriv | 2016.8-1.1 | openssl | 1.4.3 | parallel | 4.1.0 |
parallelly | 1.22.0 | pillar | 1.4.7 | pkgbuild | 1.1.0 |
pkgconfig | 2.0.3 | pkgload | 1.1.0 | plogr | 0.2.0 |
plyr | 1.8.6 | praise | 1.0.0 | prettyunits | 1.1.1 |
pROC | 1.16.2 | processx | 3.4.5 | prodlim | 2019.11.13 |
progress | 1.2.2 | promises | 1.1.1 | proto | 1.0.0 |
ps | 1.5.0 | purrr | 0.3.4 | r2d3 | 0.2.3 |
R6 | 2.5.0 | randomForest | 4.6-14 | rappdirs | 0.3.1 |
rcmdcheck | 1.3.3 | RColorBrewer | 1.1-2 | Rcpp | 1.0.5 |
readr | 1.4.0 | readxl | 1.3.1 | recipes | 0.1.15 |
rematch | 1.0.1 | rematch2 | 2.1.2 | remotes | 2.2.0 |
reprex | 0.3.0 | reshape2 | 1.4.4 | rex | 1.2.0 |
rlang | 0.4.9 | rmarkdown | 2.6 | RODBC | 1.3-17 |
roxygen2 | 7.1.1 | rpart | 4.1-15 | rprojroot | 2.0.2 |
Rserve | 1.8-8 | RSQLite | 2.2.1 | rstudioapi | 0.13 |
rversions | 2.0.2 | rvest | 0.3.6 | scales | 1.1.1 |
selectr | 0.4-2 | sessioninfo | 1.1.1 | shape | 1.4.5 |
shiny | 1.5.0 | sourcetools | 0.1.7 | sparklyr | 1.5.2 |
SparkR | 3.1.1 | spatial | 7.3-11 | splines | 4.1.0 |
sqldf | 0.4-11 | SQUAREM | 2020.5 | stats | 4.1.0 |
stats4 | 4.1.0 | stringi | 1.5.3 | stringr | 1.4.0 |
survival | 3.2-11 | sys | 3.4 | tcltk | 4.1.0 |
TeachingDemos | 2,10 | testthat | 3.0.0 | tibble | 3.0.4 |
tidyr | 1.1.2 | tidyselect | 1.1.0 | tidyverse | 1.3.0 |
timeDate | 3043.102 | tinytex | 0,28 | tools | 4.1.0 |
usethis | 2.0.0 | utf8 | 1.1.4 | utils | 4.1.0 |
uuid | 0.1-4 | vctrs | 0.3.5 | viridisLite | 0.3.0 |
waldo | 0.2.3 | whisker | 0,4 | withr | 2.3.0 |
xfun | 0,19 | xml2 | 1.3.2 | xopen | 1.0.0 |
xtable | 1.8-4 | yaml | 2.2.1 | zip | 2.1.1 |
Bibliotecas do Java e do Scala instaladas (versão do cluster Scala 2.12)
ID do Grupo | Artifact ID | Versão |
---|---|---|
antlr | antlr | 2.7.7 |
com.amazonaws | amazon-kinesis-client | 1.12.0 |
com.amazonaws | aws-java-sdk-autoscaling | 1.11.655 |
com.amazonaws | aws-java-sdk-cloudformation | 1.11.655 |
com.amazonaws | aws-java-sdk-cloudfront | 1.11.655 |
com.amazonaws | aws-java-sdk-cloudhsm | 1.11.655 |
com.amazonaws | aws-java-sdk-cloudsearch | 1.11.655 |
com.amazonaws | aws-java-sdk-cloudtrail | 1.11.655 |
com.amazonaws | aws-java-sdk-cloudwatch | 1.11.655 |
com.amazonaws | aws-java-sdk-cloudwatchmetrics | 1.11.655 |
com.amazonaws | aws-java-sdk-codedeploy | 1.11.655 |
com.amazonaws | aws-java-sdk-cognitoidentity | 1.11.655 |
com.amazonaws | aws-java-sdk-cognitosync | 1.11.655 |
com.amazonaws | aws-java-sdk-config | 1.11.655 |
com.amazonaws | aws-java-sdk-core | 1.11.655 |
com.amazonaws | aws-java-sdk-datapipeline | 1.11.655 |
com.amazonaws | aws-java-sdk-directconnect | 1.11.655 |
com.amazonaws | aws-java-sdk-directory | 1.11.655 |
com.amazonaws | aws-java-sdk-dynamodb | 1.11.655 |
com.amazonaws | aws-java-sdk-ec2 | 1.11.655 |
com.amazonaws | aws-java-sdk-ecs | 1.11.655 |
com.amazonaws | aws-java-sdk-efs | 1.11.655 |
com.amazonaws | aws-java-sdk-elasticache | 1.11.655 |
com.amazonaws | aws-java-sdk-elasticbeanstalk | 1.11.655 |
com.amazonaws | aws-java-sdk-elasticloadbalancing | 1.11.655 |
com.amazonaws | aws-java-sdk-elastictranscoder | 1.11.655 |
com.amazonaws | aws-java-sdk-emr | 1.11.655 |
com.amazonaws | aws-java-sdk-glacier | 1.11.655 |
com.amazonaws | aws-java-sdk-glue | 1.11.655 |
com.amazonaws | aws-java-sdk-iam | 1.11.655 |
com.amazonaws | aws-java-sdk-importexport | 1.11.655 |
com.amazonaws | aws-java-sdk-kinesis | 1.11.655 |
com.amazonaws | aws-java-sdk-kms | 1.11.655 |
com.amazonaws | aws-java-sdk-lambda | 1.11.655 |
com.amazonaws | aws-java-sdk-logs | 1.11.655 |
com.amazonaws | aws-java-sdk-machinelearning | 1.11.655 |
com.amazonaws | aws-java-sdk-marketplacecommerceanalytics | 1.11.655 |
com.amazonaws | aws-java-sdk-marketplacemeteringservice | 1.11.655 |
com.amazonaws | aws-java-sdk-opsworks | 1.11.655 |
com.amazonaws | aws-java-sdk-rds | 1.11.655 |
com.amazonaws | aws-java-sdk-redshift | 1.11.655 |
com.amazonaws | aws-java-sdk-route53 | 1.11.655 |
com.amazonaws | aws-java-sdk-s3 | 1.11.655 |
com.amazonaws | aws-java-sdk-ses | 1.11.655 |
com.amazonaws | aws-java-sdk-simpledb | 1.11.655 |
com.amazonaws | aws-java-sdk-simpleworkflow | 1.11.655 |
com.amazonaws | aws-java-sdk-sns | 1.11.655 |
com.amazonaws | aws-java-sdk-sqs | 1.11.655 |
com.amazonaws | aws-java-sdk-ssm | 1.11.655 |
com.amazonaws | aws-java-sdk-storagegateway | 1.11.655 |
com.amazonaws | aws-java-sdk-sts | 1.11.655 |
com.amazonaws | aws-java-sdk-support | 1.11.655 |
com.amazonaws | aws-java-sdk-swf-libraries | 1.11.22 |
com.amazonaws | aws-java-sdk-workspaces | 1.11.655 |
com.amazonaws | jmespath-java | 1.11.655 |
com.chuusai | shapeless_2.12 | 2.3.3 |
com.clearspring.analytics | fluxo | 2.9.6 |
com.databricks | Rserve | 1.8-3 |
com.databricks | jets3t | 0.7.1-0 |
com.databricks.scalapb | compilerplugin_2.12 | 0.4.15-10 |
com.databricks.scalapb | scalapb-runtime_2.12 | 0.4.15-10 |
com.esotericsoftware | kryo-shaded | 4.0.2 |
com.esotericsoftware | minlog | 1.3.0 |
com.fasterxml | classmate | 1.3.4 |
com.fasterxml.jackson.core | jackson-annotations | 2.10.0 |
com.fasterxml.jackson.core | jackson-core | 2.10.0 |
com.fasterxml.jackson.core | jackson-databind | 2.10.0 |
com.fasterxml.jackson.dataformat | jackson-dataformat-cbor | 2.10.0 |
com.fasterxml.jackson.datatype | jackson-datatype-joda | 2.10.0 |
com.fasterxml.jackson.module | jackson-module-paranamer | 2.10.0 |
com.fasterxml.jackson.module | jackson-module-scala_2.12 | 2.10.0 |
com.github.ben-manes.caffeine | caffeine | 2.3.4 |
com.github.fommil | jniloader | 1,1 |
com.github.fommil.netlib | core | 1.1.2 |
com.github.fommil.netlib | native_ref-java | 1,1 |
com.github.fommil.netlib | native_ref-java-natives | 1,1 |
com.github.fommil.netlib | native_system-java | 1,1 |
com.github.fommil.netlib | native_system-java-natives | 1,1 |
com.github.fommil.netlib | netlib-native_ref-linux-x86_64-natives | 1,1 |
com.github.fommil.netlib | netlib-native_system-linux-x86_64-natives | 1,1 |
com.github.joshelser | dropwizard-metrics-hadoop-metrics2-reporter | 0.1.2 |
com.github.luben | zstd-jni | 1.4.8-1 |
com.github.wendykierp | JTransforms | 3.1 |
com.google.code.findbugs | jsr305 | 3.0.0 |
com.google.code.gson | gson | 2.2.4 |
com.google.flatbuffers | flatbuffers-java | 1.9.0 |
com.google.guava | guava | 15.0 |
com.google.protobuf | protobuf-java | 2.6.1 |
com.h2database | h2 | 1.4.195 |
com.helger | profiler | 1.1.1 |
com.jcraft | jsch | 0.1.50 |
com.jolbox | bonecp | 0.8.0.RELEASE |
com.lihaoyi | sourcecode_2.12 | 0.1.9 |
com.microsoft.azure | azure-data-lake-store-sdk | 2.3.9 |
com.microsoft.sqlserver | mssql-jdbc | 9.2.1.jre8 |
com.ning | compress-lzf | 1.0.3 |
com.sun.mail | javax.mail | 1.5.2 |
com.tdunning | json | 1.8 |
com.thoughtworks.paranamer | paranamer | 2.8 |
com.trueaccord.lenses | lenses_2.12 | 0.4.12 |
com.twitter | chill-java | 0.9.5 |
com.twitter | chill_2.12 | 0.9.5 |
com.twitter | util-app_2.12 | 7.1.0 |
com.twitter | util-core_2.12 | 7.1.0 |
com.twitter | util-function_2.12 | 7.1.0 |
com.twitter | util-jvm_2.12 | 7.1.0 |
com.twitter | util-lint_2.12 | 7.1.0 |
com.twitter | util-registry_2.12 | 7.1.0 |
com.twitter | util-stats_2.12 | 7.1.0 |
com.typesafe | config | 1.2.1 |
com.typesafe.scala-logging | scala-logging_2.12 | 3.7.2 |
com.univocity | univocity-parsers | 2.9.1 |
com.zaxxer | HikariCP | 3.1.0 |
commons-beanutils | commons-beanutils | 1.9.4 |
commons-cli | commons-cli | 1,2 |
commons-codec | commons-codec | 1,10 |
commons-collections | commons-collections | 3.2.2 |
commons-configuration | commons-configuration | 1.6 |
commons-dbcp | commons-dbcp | 1.4 |
commons-digester | commons-digester | 1.8 |
commons-fileupload | commons-fileupload | 1.3.3 |
commons-httpclient | commons-httpclient | 3.1 |
commons-io | commons-io | 2.4 |
commons-lang | commons-lang | 2.6 |
commons-logging | commons-logging | 1.1.3 |
commons-net | commons-net | 3.1 |
commons-pool | commons-pool | 1.5.4 |
hive-2.3__hadoop-2.7 | jets3t-0.7 | liball_deps_2.12 |
hive-2.3__hadoop-2.7 | zookeeper-3.4 | liball_deps_2.12 |
info.ganglia.gmetric4j | gmetric4j | 1.0.10 |
io.airlift | aircompressor | 0.10 |
io.delta | delta-sharing-spark_2.12 | 0.1.0 |
io.dropwizard.metrics | metrics-core | 4.1.1 |
io.dropwizard.metrics | metrics-graphite | 4.1.1 |
io.dropwizard.metrics | metrics-healthchecks | 4.1.1 |
io.dropwizard.metrics | metrics-jetty9 | 4.1.1 |
io.dropwizard.metrics | metrics-jmx | 4.1.1 |
io.dropwizard.metrics | metrics-json | 4.1.1 |
io.dropwizard.metrics | metrics-jvm | 4.1.1 |
io.dropwizard.metrics | metrics-servlets | 4.1.1 |
io.netty | netty-all | 4.1.51.Final |
io.prometheus | simpleclient | 0.7.0 |
io.prometheus | simpleclient_common | 0.7.0 |
io.prometheus | simpleclient_dropwizard | 0.7.0 |
io.prometheus | simpleclient_pushgateway | 0.7.0 |
io.prometheus | simpleclient_servlet | 0.7.0 |
io.prometheus.jmx | coletor | 0.12.0 |
jakarta.annotation | jakarta.annotation-api | 1.3.5 |
jakarta.validation | jakarta.validation-api | 2.0.2 |
jakarta.ws.rs | jakarta.ws.rs-api | 2.1.6 |
javax.activation | activation | 1.1.1 |
javax.el | javax.el-api | 2.2.4 |
javax.jdo | jdo-api | 3.0.1 |
javax.servlet | javax.servlet-api | 3.1.0 |
javax.servlet.jsp | jsp-api | 2.1 |
javax.transaction | jta | 1,1 |
javax.transaction | transaction-api | 1,1 |
javax.xml.bind | jaxb-api | 2.2.2 |
javax.xml.stream | stax-api | 1.0-2 |
javolution | javolution | 5.5.1 |
jline | jline | 2.14.6 |
joda-time | joda-time | 2.10.5 |
log4j | apache-log4j-extras | 1.2.17 |
log4j | log4j | 1.2.17 |
maven-trees | hive-2.3__hadoop-2.7 | liball_deps_2.12 |
net.java.dev.jna | jna | 5.8.0 |
net.razorvine | pyrolite | 4.30 |
net.sf.jpam | jpam | 1,1 |
net.sf.opencsv | opencsv | 2.3 |
net.sf.supercsv | super-csv | 2.2.0 |
net.snowflake | snowflake-ingest-sdk | 0.9.6 |
net.snowflake | snowflake-jdbc | 3.13.3 |
net.snowflake | spark-snowflake_2.12 | 2.9.0-spark_3.1 |
net.sourceforge.f2j | arpack_combined_all | 0,1 |
org.acplt.remotetea | remotetea-oncrpc | 1.1.2 |
org.antlr | ST4 | 4.0.4 |
org.antlr | antlr-runtime | 3.5.2 |
org.antlr | antlr4-runtime | 4.8-1 |
org.antlr | stringtemplate | 3.2.1 |
org.apache.ant | ant | 1.9.2 |
org.apache.ant | ant-jsch | 1.9.2 |
org.apache.ant | ant-launcher | 1.9.2 |
org.apache.arrow | arrow-format | 2.0.0 |
org.apache.arrow | arrow-memory-core | 2.0.0 |
org.apache.arrow | arrow-memory-netty | 2.0.0 |
org.apache.arrow | arrow-vector | 2.0.0 |
org.apache.avro | avro | 1.8.2 |
org.apache.avro | avro-ipc | 1.8.2 |
org.apache.avro | avro-mapred-hadoop2 | 1.8.2 |
org.apache.commons | commons-compress | 1.20 |
org.apache.commons | commons-crypto | 1.1.0 |
org.apache.commons | commons-lang3 | 3.10 |
org.apache.commons | commons-math3 | 3.4.1 |
org.apache.commons | commons-text | 1.6 |
org.apache.curator | curator-client | 2.7.1 |
org.apache.curator | curator-framework | 2.7.1 |
org.apache.curator | curator-recipes | 2.7.1 |
org.apache.derby | derby | 10.12.1.1 |
org.apache.directory.api | api-asn1-api | 1.0.0-M20 |
org.apache.directory.api | api-util | 1.0.0-M20 |
org.apache.directory.server | apacheds-i18n | 2.0.0-M15 |
org.apache.directory.server | apacheds-kerberos-codec | 2.0.0-M15 |
org.apache.hadoop | hadoop-annotations | 2.7.4 |
org.apache.hadoop | hadoop-auth | 2.7.4 |
org.apache.hadoop | hadoop-client | 2.7.4 |
org.apache.hadoop | hadoop-common | 2.7.4 |
org.apache.hadoop | hadoop-hdfs | 2.7.4 |
org.apache.hadoop | hadoop-mapreduce-client-app | 2.7.4 |
org.apache.hadoop | hadoop-mapreduce-client-common | 2.7.4 |
org.apache.hadoop | hadoop-mapreduce-client-core | 2.7.4 |
org.apache.hadoop | hadoop-mapreduce-client-jobclient | 2.7.4 |
org.apache.hadoop | hadoop-mapreduce-client-shuffle | 2.7.4 |
org.apache.hadoop | hadoop-yarn-api | 2.7.4 |
org.apache.hadoop | hadoop-yarn-client | 2.7.4 |
org.apache.hadoop | hadoop-yarn-common | 2.7.4 |
org.apache.hadoop | hadoop-yarn-server-common | 2.7.4 |
org.apache.hive | hive-beeline | 2.3.7 |
org.apache.hive | hive-cli | 2.3.7 |
org.apache.hive | hive-jdbc | 2.3.7 |
org.apache.hive | hive-llap-client | 2.3.7 |
org.apache.hive | hive-llap-common | 2.3.7 |
org.apache.hive | hive-serde | 2.3.7 |
org.apache.hive | hive-shims | 2.3.7 |
org.apache.hive | hive-storage-api | 2.7.2 |
org.apache.hive.shims | hive-shims-0.23 | 2.3.7 |
org.apache.hive.shims | hive-shims-common | 2.3.7 |
org.apache.hive.shims | hive-shims-scheduler | 2.3.7 |
org.apache.htrace | htrace-core | 3.1.0-incubating |
org.apache.httpcomponents | httpclient | 4.5.6 |
org.apache.httpcomponents | httpcore | 4.4.12 |
org.apache.ivy | ivy | 2.4.0 |
org.apache.mesos | mesos-shaded-protobuf | 1.4.0 |
org.apache.orc | orc-core | 1.5.12 |
org.apache.orc | orc-mapreduce | 1.5.12 |
org.apache.orc | orc-shims | 1.5.12 |
org.apache.parquet | parquet-column | 1.10.1-databricks9 |
org.apache.parquet | parquet-common | 1.10.1-databricks9 |
org.apache.parquet | parquet-encoding | 1.10.1-databricks9 |
org.apache.parquet | parquet-format | 2.4.0 |
org.apache.parquet | parquet-hadoop | 1.10.1-databricks9 |
org.apache.parquet | parquet-jackson | 1.10.1-databricks9 |
org.apache.thrift | libfb303 | 0.9.3 |
org.apache.thrift | libthrift | 0.12.0 |
org.apache.xbean | xbean-asm7-shaded | 4.15 |
org.apache.yetus | audience-annotations | 0.5.0 |
org.apache.zookeeper | zookeeper | 3.4.14 |
org.codehaus.jackson | jackson-core-asl | 1.9.13 |
org.codehaus.jackson | jackson-jaxrs | 1.9.13 |
org.codehaus.jackson | jackson-mapper-asl | 1.9.13 |
org.codehaus.jackson | jackson-xc | 1.9.13 |
org.codehaus.janino | commons-compiler | 3.0.16 |
org.codehaus.janino | janino | 3.0.16 |
org.datanucleus | datanucleus-api-jdo | 4.2.4 |
org.datanucleus | datanucleus-core | 4.1.17 |
org.datanucleus | datanucleus-rdbms | 4.1.19 |
org.datanucleus | javax.jdo | 3.2.0-m3 |
org.eclipse.jetty | jetty-client | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-continuation | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-http | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-io | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-jndi | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-plus | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-proxy | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-security | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-server | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-servlet | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-servlets | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-util | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-util-ajax | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-webapp | 9.4.36.v20210114 |
org.eclipse.jetty | jetty-xml | 9.4.36.v20210114 |
org.fusesource.leveldbjni | leveldbjni-all | 1.8 |
org.glassfish.hk2 | hk2-api | 2.6.1 |
org.glassfish.hk2 | hk2-locator | 2.6.1 |
org.glassfish.hk2 | hk2-utils | 2.6.1 |
org.glassfish.hk2 | osgi-resource-locator | 1.0.3 |
org.glassfish.hk2.external | aopalliance-repackaged | 2.6.1 |
org.glassfish.hk2.external | jakarta.inject | 2.6.1 |
org.glassfish.jersey.containers | jersey-container-servlet | 2.30 |
org.glassfish.jersey.containers | jersey-container-servlet-core | 2.30 |
org.glassfish.jersey.core | jersey-client | 2.30 |
org.glassfish.jersey.core | jersey-common | 2.30 |
org.glassfish.jersey.core | jersey-server | 2.30 |
org.glassfish.jersey.inject | jersey-hk2 | 2.30 |
org.glassfish.jersey.media | jersey-media-jaxb | 2.30 |
org.hibernate.validator | hibernate-validator | 6.1.0.Final |
org.javassist | javassist | 3.25.0-GA |
org.jboss.logging | jboss-logging | 3.3.2.Final |
org.jdbi | jdbi | 2.63.1 |
org.joda | joda-convert | 1,7 |
org.jodd | jodd-core | 3.5.2 |
org.json4s | json4s-ast_2.12 | 3.7.0-M5 |
org.json4s | json4s-core_2.12 | 3.7.0-M5 |
org.json4s | json4s-jackson_2.12 | 3.7.0-M5 |
org.json4s | json4s-scalap_2.12 | 3.7.0-M5 |
org.lz4 | lz4-java | 1.7.1 |
org.mariadb.jdbc | mariadb-java-client | 2.2.5 |
org.objenesis | objenesis | 2.5.1 |
org.postgresql | postgresql | 42.1.4 |
org.roaringbitmap | RoaringBitmap | 0.9.14 |
org.roaringbitmap | shims | 0.9.14 |
org.rocksdb | rocksdbjni | 6.20.3 |
org.rosuda.REngine | REngine | 2.1.0 |
org.scala-lang | scala-compiler_2.12 | 2.12.10 |
org.scala-lang | scala-library_2.12 | 2.12.10 |
org.scala-lang | scala-reflect_2.12 | 2.12.10 |
org.scala-lang.modules | scala-collection-compat_2.12 | 2.1.1 |
org.scala-lang.modules | scala-parser-combinators_2.12 | 1.1.2 |
org.scala-lang.modules | scala-xml_2.12 | 1.2.0 |
org.scala-sbt | test-interface | 1,0 |
org.scalacheck | scalacheck_2.12 | 1.14.2 |
org.scalactic | scalactic_2.12 | 3.0.8 |
org.scalanlp | breeze-macros_2.12 | 1,0 |
org.scalanlp | breeze_2.12 | 1,0 |
org.scalatest | scalatest_2.12 | 3.0.8 |
org.slf4j | jcl-over-slf4j | 1.7.30 |
org.slf4j | jul-to-slf4j | 1.7.30 |
org.slf4j | slf4j-api | 1.7.30 |
org.slf4j | slf4j-log4j12 | 1.7.30 |
org.spark-project.spark | unused | 1.0.0 |
org.springframework | spring-core | 4.1.4.RELEASE |
org.springframework | spring-test | 4.1.4.RELEASE |
org.threeten | threeten-extra | 1.5.0 |
org.tukaani | xz | 1.5 |
org.typelevel | algebra_2.12 | 2.0.0-M2 |
org.typelevel | cats-kernel_2.12 | 2.0.0-M4 |
org.typelevel | machinist_2.12 | 0.6.8 |
org.typelevel | macro-compat_2.12 | 1.1.1 |
org.typelevel | spire-macros_2.12 | 0.17.0-M1 |
org.typelevel | spire-platform_2.12 | 0.17.0-M1 |
org.typelevel | spire-util_2.12 | 0.17.0-M1 |
org.typelevel | spire_2.12 | 0.17.0-M1 |
org.wildfly.openssl | wildfly-openssl | 1.0.7.Final |
org.xerial | sqlite-jdbc | 3.8.11.2 |
org.xerial.snappy | snappy-java | 1.1.8.2 |
org.yaml | snakeyaml | 1,24 |
oro | oro | 2.0.8 |
pl.edu.icm | JLargeArrays | 1.5 |
software.amazon.ion | ion-java | 1.0.2 |
stax | stax-api | 1.0.1 |
xmlenc | xmlenc | 0.52 |