Introdução

Concluído

O Delta Lake do Linux Foundation é uma camada de armazenamento de código aberto para Spark que permite funcionalidades de banco de dados relacional para dados em lote e de streaming. Usando o Delta Lake, você pode implementar uma arquitetura de data lakehouse no Spark para dar suporte à semântica de manipulação de dados SQL_based com suporte para transações e imposição de esquema. O resultado é um armazenamento de dados analítico que oferece muitas das vantagens de um sistema de banco de dados relacional, com a flexibilidade do armazenamento de arquivos de dados em um data lake.

Neste módulo, você aprenderá a:

  • Descreva os principais recursos e funcionalidades do Delta Lake.
  • Crie e use tabelas do Delta Lake em um pool do Spark no Synapse Analytics.
  • Crie tabelas de catálogo do Spark para dados do Delta Lake.
  • Use tabelas do Delta Lake para dados de streaming.
  • Consulte tabelas do Delta Lake de um pool de SQL do Synapse Analytics.

Observação

A versão do Delta Lake disponível em um pool do Azure Synapse Analytics depende da versão do Spark especificada na configuração do pool. As informações neste módulo refletem o Delta Lake versão 1.0, que está instalado com o Spark 3.1.