Introdução
O Delta Lake do Linux Foundation é uma camada de armazenamento de código aberto para Spark que permite funcionalidades de banco de dados relacional para dados em lote e de streaming. Usando o Delta Lake, você pode implementar uma arquitetura de data lakehouse no Spark para dar suporte à semântica de manipulação de dados SQL_based com suporte para transações e imposição de esquema. O resultado é um armazenamento de dados analítico que oferece muitas das vantagens de um sistema de banco de dados relacional, com a flexibilidade do armazenamento de arquivos de dados em um data lake.
Neste módulo, você aprenderá a:
- Descreva os principais recursos e funcionalidades do Delta Lake.
- Crie e use tabelas do Delta Lake em um pool do Spark no Synapse Analytics.
- Crie tabelas de catálogo do Spark para dados do Delta Lake.
- Use tabelas do Delta Lake para dados de streaming.
- Consulte tabelas do Delta Lake de um pool de SQL do Synapse Analytics.
Observação
A versão do Delta Lake disponível em um pool do Azure Synapse Analytics depende da versão do Spark especificada na configuração do pool. As informações neste módulo refletem o Delta Lake versão 1.0, que está instalado com o Spark 3.1.