Introduction

Effectué

Considérez le scénario où vous avez importé des données dans Power BI depuis différentes sources et où, quand vous examinez les données, vous constatez qu’elles ne sont pas préparées pour l’analyse. Qu’est-ce qui fait que les données ne sont pas préparées pour l’analyse ?

Quand vous examinez les données, vous découvrez plusieurs problèmes, notamment :

  • Une colonne appelée Employment status contient seulement des nombres.

  • Plusieurs colonnes contiennent des erreurs.

  • Certaines colonnes contiennent des valeurs Null.

  • L’ID client apparaît dans certaines colonnes comme s’il était dupliqué de façon répétée.

  • Une même colonne d’adresse contient l’adresse postale, la ville, l’état et le code postal combinés.

Vous commencez à travailler avec les données, mais chaque fois que vous créez des visuels sur des rapports, vous obtenez de mauvaises données, des résultats incorrects et les rapports simples sur les totaux des ventes sont erronés.

Les données à l’état brut peuvent engendrer des problèmes insurmontables. Bien que cela puisse être frustrant, vous décidez d’y travailler et de déterminer comment rendre ce modèle sémantique aussi parfait que possible.

Heureusement, Power BI et Power Query vous offrent un environnement puissant pour nettoyer et préparer les données. Des données « propres » ont les avantages les suivants :

  • Les mesures et les colonnes produisent des résultats plus précis quand des calculs et des agrégations sont effectués sur celles-ci.

  • Les tables sont organisées, où les utilisateurs peuvent trouver les données de façon intuitive.

  • Les doublons sont supprimés, ce qui simplifie la navigation dans les données. Elles se traduisent aussi par des colonnes qui peuvent être utilisées dans des sélecteurs et des filtres.

  • Une colonne complexe peut être fractionnée en deux colonnes plus simples. Plusieurs colonnes peuvent être combinées en une seule colonne pour des raisons de lisibilité.

  • Les codes et les entiers peuvent être remplacés par des valeurs lisibles par les humains.

Dans ce module, vous allez découvrir comment :

  • Résoudre les incohérences, les valeurs inattendues ou Null, et les problèmes de qualité des données.

  • Appliquer des remplacements de valeurs conviviales.

  • Profiler les données de façon à en savoir plus sur une colonne spécifique avant de l’utiliser.

  • Évaluer et transformer les types de données des colonnes.

  • Appliquer des transformations de forme de données aux structures des tables.

  • Combiner des requêtes.

  • Appliquer des conventions de nommage conviviales aux colonnes et aux requêtes.

  • Modifier du code M dans l’éditeur avancé.