Administración de datos con Delta Lake

Intermedio
Analista de datos
Azure Databricks

Delta Lake es una solución de administración de datos en Azure Databricks que proporciona características que incluyen transacciones ACID, aplicación de esquemas y viajes de tiempo, lo que garantiza la coherencia, integridad y control de versiones de los datos.

Objetivos de aprendizaje

En este módulo, aprenderá lo siguiente:

  • Qué es Delta Lake
  • Administración de transacciones ACID mediante Delta Lake
  • Cómo usar el control de versiones de esquema y el viaje en el tiempo en Delta Lake
  • Cómo mantener la integridad de los datos con Delta Lake

Requisitos previos

Antes de iniciar este módulo, debe saber cómo usar Apache Spark en Azure Databricks. Considere la posibilidad de completar el módulo Uso de Apache Spark en Azure Databricks antes de este.