Introdução
Linux Foundation Delta Lake é uma camada de armazenamento de código aberto para o Spark que permite recursos de banco de dados relacional para dados em lote e streaming. Usando o Delta Lake, você pode implementar uma arquitetura data lakehouse no Spark para oferecer suporte à semântica de manipulação de dados SQL_based com suporte para transações e imposição de esquema. O resultado é um armazenamento de dados analíticos que oferece muitas das vantagens de um sistema de banco de dados relacional com a flexibilidade de armazenamento de arquivos de dados em um data lake.
Neste módulo, irá saber como:
- Descreva os principais recursos e capacidades do Delta Lake.
- Crie e use tabelas Delta Lake em um pool do Synapse Analytics Spark.
- Crie tabelas de catálogo do Spark para dados do Delta Lake.
- Use tabelas Delta Lake para transmitir dados.
- Consulte tabelas Delta Lake a partir de um pool SQL do Synapse Analytics.
Nota
A versão do Delta Lake disponível em um pool do Azure Synapse Analytics depende da versão do Spark especificada na configuração do pool. As informações neste módulo refletem Delta Lake versão 1.0, que é instalado com o Spark 3.1.