Introdução

1 minuto

O Delta Lake do Linux Foundation é uma camada de armazenamento de código aberto para Spark que permite funcionalidades de banco de dados relacional para dados em lote e de streaming. Usando o Delta Lake, você pode implementar uma arquitetura de data lakehouse no Spark para dar suporte à semântica de manipulação de dados SQL_based com suporte para transações e imposição de esquema. O resultado é um armazenamento de dados analítico que oferece muitas das vantagens de um sistema de banco de dados relacional, com a flexibilidade do armazenamento de arquivos de dados em um data lake.

Neste módulo, você aprenderá a:

Descreva os principais recursos e funcionalidades do Delta Lake.
Crie e use tabelas do Delta Lake em um pool do Spark no Synapse Analytics.
Crie tabelas de catálogo do Spark para dados do Delta Lake.
Use tabelas do Delta Lake para dados de streaming.
Consulte tabelas do Delta Lake de um pool de SQL do Synapse Analytics.

Observação

A versão do Delta Lake disponível em um pool do Azure Synapse Analytics depende da versão do Spark especificada na configuração do pool. As informações neste módulo refletem o Delta Lake versão 1.0, que está instalado com o Spark 3.1.

Introdução

Comentários