Introducción

Completado

Delta Lake de Linux Foundation es una capa de almacenamiento de código abierto para Spark que permite funcionalidades de base de datos relacional para datos por lotes y streaming. Mediante Delta Lake, puede implementar una arquitectura de lago de datos en Spark para admitir semántica de manipulación de datos basada en SQL con compatibilidad con transacciones y cumplimiento de esquemas. El resultado es un almacén de datos analíticos que ofrece muchas de las ventajas de un sistema de bases de datos relacionales con la flexibilidad de almacenar archivos de datos en un lago de datos.

En este módulo aprenderá a:

  • Describir las características y funcionalidades principales de Delta Lake.
  • Crear y usar tablas de Delta Lake en un grupo de Spark de Synapse Analytics.
  • Crear tablas de catálogo de Spark para datos de Delta Lake.
  • Usar tablas de Delta Lake para transmitir datos.
  • Consultar tablas de Delta Lake desde un grupo de SQL de Synapse Analytics.

Nota

La versión de Delta Lake disponible en un grupo de Azure Synapse Analytics depende de la versión de Spark especificada en la configuración del grupo. La información de este módulo refleja la versión 1.0 de Delta Lake, que se instala con Spark 3.1.