Introdução

1 minuto

As tabelas em um lakehouse do Microsoft Fabric são baseadas no formato de tabela Delta Lake da Linux Foundation, comumente usado no Apache Spark. O Delta Lake é uma camada de armazenamento de código aberto para Spark que habilita funcionalidades de banco de dados relacional para dados em lote e de streaming. Usando o Delta Lake, é possível implementar uma arquitetura de lakehouse para dar suporte à semântica de manipulação de dados baseada em SQL no Spark com suporte para transações e imposição de esquema. O resultado é um armazenamento de dados analítico que oferece muitas das vantagens de um sistema de banco de dados relacional, com a flexibilidade do armazenamento de arquivos de dados em um data lake.

Embora não seja necessário trabalhar diretamente com APIs do Delta Lake para usar tabelas em um lakehouse do Fabric, uma compreensão da arquitetura de metastore do Delta Lake e familiaridade com algumas das operações de tabela Delta mais especializadas podem expandir consideravelmente sua capacidade de criar soluções de análise avançadas no Microsoft Fabric.

Introdução

Comentários