Explorer et transformer des données dans un lakehouse

Effectué

Transformez et chargez des données

La plupart des données nécessitent des transformations avant d’être chargées dans des tables. Vous pouvez ingérer des données brutes directement dans un lakehouse, puis les transformer et les charger dans des tables. Quelle que soit votre conception ETL, vous pouvez transformer et charger des données simplement en utilisant les mêmes outils pour ingérer des données. Les données transformées peuvent ensuite être chargées sous forme de fichier ou de table Delta.

  • Les notebooks sont privilégiés par les ingénieurs de données familiarisés avec différents langages de programmation, notamment PySpark, SQL et Scala.
  • Les Dataflows Gen2 sont excellents pour les développeurs familiarisés avec Power BI ou Excel car ils utilisent l'interface PowerQuery.
  • Les pipelines fournissent une interface visuelle pour exécuter et orchestrer les processus ETL. Les pipelines peuvent être aussi simples ou complexes que vous le souhaitez.

Analyser et visualiser des données dans un lakehouse

Une fois les données ingérées, transformées et chargées, elles sont prêtes à être utilisées par d’autres. Les articles en tissu offrent la flexibilité nécessaire à chaque organisation afin que vous puissiez utiliser les outils qui vous conviennent.

  • Les scientifiques des données peuvent utiliser des notebooks ou des Data Wrangler pour explorer et former des modèles d'apprentissage automatique pour l'IA.
  • Les développeurs de rapports peuvent utiliser le modèle sémantique pour créer des rapports Power BI.
  • Les analystes peuvent utiliser le point de terminaison d'analyse SQL pour interroger, filtrer, agréger et explorer les données dans les tables Lakehouse.

En combinant les fonctionnalités de visualisation des données de Power BI avec le stockage centralisé et le schéma tabulaire d’un data lakehouse, vous pouvez implémenter une solution d’analytique de bout en bout sur une plateforme unique.