Gérer des données avec Delta Lake
Delta Lake est une solution de gestion des données dans Azure Databricks qui fournit des fonctionnalités, notamment des transactions ACID, une application de schéma et un temps de trajet veillant aux fonctionnalités de contrôle de version, d’intégrité et de cohérence des données.
Objectifs d’apprentissage
Dans ce module, vous allez découvrir :
- Définition de Delta Lake
- Procédure de gestion de transactions ACID en utilisant Delta Lake
- Procédure de contrôle de version de schéma et temps de trajet dans Delta Lake
- Procédure de maintien de l’intégrité des données avec Delta Lake
Prérequis
Avant de démarrer ce module, vous devez savoir comment utiliser Apache Spark dans Azure Databricks. Envisagez de terminer le module Utiliser Apache Spark dans Azure Databricks avant celui-ci.