Générer et stocker des données de mesure

Article
01/06/2025

Important

Tout ou partie de cette fonctionnalité est accessible dans le cadre d’une version préliminaire. Le contenu et la fonctionnalité sont susceptibles d’être modifiés.

Une fois la table d'agrégation générée, vous pouvez exécuter la logique de calcul (agrégation ou calcul) définie dans la définition de métrique au-dessus de la table d'agrégation jeu de données pour générer les données de sortie de la métrique.

La logique de calcul d'une métrique est définie avec :

Power BI mesures: Contient une logique de calcul sous forme de langage de formule Data Analysis Expressions (DAX). Power BI les mesures sont définies dans le modèle sémantique prédéfini DatasetForMetricsMeasures_DTST déployé dans le cadre de la capacité. Pour en savoir plus sur les mesures, accédez à la section Créer des mesures pour l'analyse des données dans la documentation. Power BI Power BI Desktop Power BI
Dimensions : spécifie les dimensions/colonnes requises dans la sortie métrique. Ces dimensions peuvent provenir de tables agrégées ou de tables calculées dans le modèle sémantique DatasetForMetricsMeasures_DTST .
Filtres : spécifie les valeurs des dimensions de la table agrégée qui doivent être filtrées.

un exemple de métrique prédéfinie pour les émissions par catégorie de portée 3 (protocole GES).

Voici la définition métrique de cette métrique à partir du fichier metrics_definitions_config.json :

{
      "metric_name": "Scope 3 GHG emissions by category (GHG Protocol)",
      "measure_name": "Emissions",
      "dimensions": [
        "EmissionsAggregate[EmissionSource]",
        "EmissionsAggregate[UnitOfMeasureName]",
        "EmissionsAggregate[ReportingPeriod]"
      ],
      "filters": {
        "EmissionsAggregate[isRolledUp]": [
          "False"
        ],
        "EmissionsAggregate[Scope]": [
          "Scope 3"
        ],
        "EmissionsAggregate[AccountingMethod]": [
          "Location based",
          null
        ],
        "EmissionsAggregate[UnitOfMeasureName]": [
          "mtCO2e"
        ]
      },
      "sustainability_area": "Climate Change",
      "labels": {
        "Reporting standard": [
          "CSRD"
        ],
        "Disclosure datapoint": [
          "E1-6_04"
        ]
      }
    }

Sur la base de la définition métrique, la sortie métrique se compose de :

Les colonnes spécifiées comme dimensions dans la définition de la métrique
La colonne de valeur qui est calculée en exécutant la logique de calcul spécifiée dans la définition de la métrique

Pour l'exemple de métrique, ces colonnes de sortie sont :

EmissionSource : capture le nom de la catégorie de portée 3.
Nom de l'unité de mesure: Mentionne l'unité de mesure de la valeur d'émission, telle que mtCO2e.
Période de rapport: Spécifie l'année de rapport.
Valeur : capture la valeur d’émission pour une catégorie de portée 3 pour une période de rapport spécifique.

Pour cette mesure, vous devez calculer la somme des CO2eEmissionsUnits où Scope est Scope 3 et AccountingMethod est null ou Location based à la source d'émission et à la période de rapport de la table EmissionsAggregate.

Ce calcul est effectué comme suit par la logique de calcul spécifiée dans la définition de la métrique :

La mesure Émissions effectue la somme des émissions de CO2e de la table EmissionsAggregate et est définie dans le modèle sémantique DatasetForMetricsMeasures_DTST :

Pour afficher les mesures prédéfinies utilisées pour calculer les métriques prédéfinies, procédez comme suit : Power BI
1. Ouvrez DatasetForMetricsMeasures_DTST à partir de l'espace de travail.
2. Sélectionner Ouvrir un modèle de données.
3. Sélectionner Mesures_ESG du panneau latéral Données .
Si Modèle de données ouvert est grisé, accédez à Paramètre de l'espace de travail. Ouvrez Power BI/Général et activez le paramètre Les utilisateurs peuvent modifier les modèles de données dans le Power BI service (version préliminaire) .
La mesure Dimensions effectue l'agrégation aux dimensions spécifiées dans les colonnes de définition de métrique (période de reporting), de source d'émission et d'unité de mesure du tableau d'agrégation. Ces colonnes forment les dimensions de la sortie métrique.
Filtres spécifie les valeurs requises pour les différentes colonnes de la table EmissionsAggregate à additionner par la mesure. Dans cet exemple, les lignes où la portée est la portée 3, la méthode de comptabilité est nulle ou basée sur l'emplacement et l'unité de mesure est mtCO2e.

Pour calculer les données métriques avec des mesures, des dimensions et des filtres, le bloc-notes prédéfini utilise la fonction Power BI evaluate_measure de l'interface Python de la bibliothèque Python de Semantic Link, SemPy .

Conditions préalables à la génération de données métriques

La table agrégée requise pour générer la métrique doit déjà être présente dans le ComputedESGMetrics_LH lakehouse.
Avant d'exécuter la logique de calcul pour une métrique, assurez-vous que les définitions de métriques sont chargées sous forme de tables dans ComputedESGMetrics lakehouse. À moins que vous ne mettiez à jour la définition de la métrique, vous n’avez pas besoin de recharger les définitions. Exécutez le bloc-notes Charger la définition de métrique directement ou exécutez l’activité Charger la définition de métrique du pipeline ExecuteComputationForMetrics .

Générer et stocker les données métriques

Exécutez l’activité Générer une sortie pour les métriques dans le pipeline ExecuteComputationOfMetrics_DTPL ou exécutez directement le bloc-notes GenerateOutputForMetrics_INTB pour exécuter la logique de calcul des métriques sur la table agrégée jeu de données et pour stocker les données de sortie dans la table ComputedESGMetrics dans le ComputedESGMetrics_LH lakehouse.

Vous pouvez spécifier ces paramètres pour générer des sorties pour un ensemble spécifique de métriques. Si vous souhaitez générer une sortie pour toutes les définitions de métriques chargées dans la table MetricsDefinitions , ne spécifiez pas de valeur de paramètre dans le pipeline et définissez-la sur Aucune dans le bloc-notes.

Note

Les valeurs des paramètres sont sensibles à la casse.
- metric_names : spécifiez une liste de noms de métriques. Vous pouvez obtenir le nom des métriques à partir de la bibliothèque de métriques prédéfinies ou interroger la table MetricsDefinitions dans ComputedESGMetrics_LH lakehouse. Par exemple, ["Émissions de GES de portée 3 par catégorie (Protocole GES) », "Consommation totale d’eau"].
- sustainability_areas : Spécifiez une liste de domaines de durabilité. Par exemple, ["Changement climatique", "Ressources en eau et marines"]. Toutes les mesures mappées sur la zone de durabilité spécifiée dans le paramètre sont prises en compte pour le calcul. Vous pouvez trouver la zone de durabilité qui est mappée à la métrique à partir de la bibliothèque de métriques prédéfinies ou interroger la table MetricsDefinitions dans ComputedESGMetrics_LH lakehouse.
Note

Si vous spécifiez à la fois sustainability_areas et metric_names, alors le paramètre metric_names est prioritaire et pris en compte pour le calcul.

Une fois que le bloc-notes ou l’activité du pipeline s’exécute correctement, vous pouvez vérifier les sorties de métriques dans la table ComputedESGMetrics dans le ComputedESGMetrics_LH lakehouse. ComputedESGMetrics est une table unique qui stocke la sortie de toutes les métriques. Ce tableau affiche les détails du schéma de la table.

Nom de colonne	Description
MetricId	L’identifiant unique de la métrique. Désigne la métrique pour laquelle les données sont générées. Il s’agit d’une clé étrangère vers la table MetricsDefinitions .
ReportingPeriod	Indique la période de rapport (année) pour laquelle la valeur métrique est générée.
Nom de l’unité de mesure	Représente l’unité de mesure de la valeur métrique (comme mtCO2e pour les valeurs d’émission).
active	Indique la valeur de la métrique pour la ReportingPeriod et la DimensionValue spécifiques.
Nom de la dimension	Si la sortie de la métrique comporte une autre dimension en dehors de ReportingPeriod, le nom de cette dimension est spécifié dans la colonne DimensionName . La valeur correspondante est dans DimensionValue et le type de données est dans DimensionType.
DimensionValeur	Contient la valeur spécifique pour la dimension spécifiée dans la colonne DimensionName .
Type de dimension	Spécifie le type de données de la dimension dans DimensionName.
Index	Index et MetricId identifient de manière unique une ligne particulière d’une métrique. Cette colonne est utile lors de la récupération d’une sortie de métrique spécifique avec des dimensions sous forme de colonnes distinctes à partir de cette table de sortie de métrique unique.

Si vous souhaitez stocker les données de chaque métrique dans un dataframe ou une table distinct, vous pouvez utiliser la fonction get_metric_output_by_id pour obtenir les données de sortie de la métrique cadre.

Étape suivante

Consommer des données métriques

📄 Page produit
🎓 Formation

✅ Chaîne d’essai gratuite
🎥 YouTube

💻 Communauté
Groupe LinkedIn

Partager via

Générer et stocker des données de mesure

Conditions préalables à la génération de données métriques

Générer et stocker les données métriques

Étape suivante

Ressources supplémentaires