Generar y almacenar datos de métricas
Importante
Algunas o todas estas funciones están disponibles como parte de una versión preliminar. El contenido y la funcionalidad están sujetos a cambios.
Una vez generada la tabla agregada, puede ejecutar la lógica de cálculo (agregación o cálculo) definida en la definición de métrica sobre la tabla agregada conjunto de datos para generar los datos de salida de la métrica.
La lógica de cálculo de una métrica se define con:
Power BI medidas: Contiene lógica de cálculo en forma de lenguaje de fórmulas de Expresiones de análisis de datos (DAX). Power BI Las medidas se definen en el modelo semántico preconstruido DatasetForMetricsMeasures_DTST implementado como parte de la capacidad. Para obtener más información sobre las medidas, vaya a Crear medidas para el análisis de datos en la documentación. Power BI Power BI Desktop Power BI
Dimensiones: especifica las dimensiones/columnas requeridas en la salida métrica. Estas dimensiones pueden ser de tablas agregadas o de tablas calculadas en el modelo semántico DatasetForMetricsMeasures_DTST .
Filtros: especifica los valores de las dimensiones de la tabla agregada que se deben filtrar.
Un ejemplo de métrica prediseñada de emisiones por categoría de alcance 3 (protocolo GEI).
A continuación se muestra la definición métrica de esta métrica del archivo metrics_definitions_config.json:
{
"metric_name": "Scope 3 GHG emissions by category (GHG Protocol)",
"measure_name": "Emissions",
"dimensions": [
"EmissionsAggregate[EmissionSource]",
"EmissionsAggregate[UnitOfMeasureName]",
"EmissionsAggregate[ReportingPeriod]"
],
"filters": {
"EmissionsAggregate[isRolledUp]": [
"False"
],
"EmissionsAggregate[Scope]": [
"Scope 3"
],
"EmissionsAggregate[AccountingMethod]": [
"Location based",
null
],
"EmissionsAggregate[UnitOfMeasureName]": [
"mtCO2e"
]
},
"sustainability_area": "Climate Change",
"labels": {
"Reporting standard": [
"CSRD"
],
"Disclosure datapoint": [
"E1-6_04"
]
}
}
Según la definición de la métrica, la salida de la métrica consta de:
- Las columnas especificadas como dimensiones en la definición de métrica
- La columna de valor que se calcula ejecutando la lógica de cálculo especificada en la definición de métrica
Para la métrica de muestra, estas columnas de salida son:
- EmissionSource: captura el nombre de la categoría de alcance 3.
- Nombre de la unidad de medida: Menciona la unidad de medida del valor de la emisión, como mtCO2e.
- Período del informe: especifica el año del informe.
- Valor: captura el valor de emisión para una categoría de alcance 3 para un período de informe específico.
Para esta métrica, debe calcular la suma de las Unidades de emisiones de CO2e donde el alcance es Alcance 3 y el método contable es nulo o Basado en la ubicación en la fuente de emisión y el período del informe de la tabla EmissionsAggregate.
Este cálculo se realiza de la siguiente manera mediante la lógica de cálculo especificada en la definición de la métrica:
La medida de Emisiones realiza la suma de las emisiones de CO2e de la tabla EmissionsAggregate y se define en el modelo semántico DatasetForMetricsMeasures_DTST:
Para ver las medidas predefinidas que se utilizan para calcular métricas predefinidas, siga estos pasos: Power BI
- Abra DatasetForMetricsMeasures_DTST desde el espacio de trabajo.
- Seleccione Abrir modelo de datos.
- Seleccionar Medidas ESG del panel lateral Datos .
Si el Modelo de datos abiertos está en gris, navegue a la Configuración del espacio de trabajo. Abra Power BI/General y active la configuración Los usuarios pueden editar modelos de datos en el Power BI servicio (versión preliminar) .
La medida Dimensiones realiza la agregación en las dimensiones especificadas en las columnas de definición de métrica (período del informe), fuente de emisión y unidad de medida de la tabla de agregación. Estas columnas de las dimensiones de la salida métrica.
Filtros especifica los valores necesarios para las diferentes columnas de la tabla EmissionsAggregate para sumar según la medida. En este ejemplo, las filas donde el alcance es 3, el método contable es nulo o se basa en la ubicación y la unidad de medida es mtCO2e.
Para calcular los datos de métricas con medidas, dimensiones y filtros, el cuaderno prediseñado utiliza la función Power BI evaluate_measure de la interfaz Python de la biblioteca Python semántica vincular, SemPy .
Requisitos previos para generar datos de métricas
- La tabla agregada necesaria para generar la métrica ya debe estar presente en ComputedESGMetrics_LH almacén de lago de datos.
- Antes de ejecutar la lógica de cálculo para una métrica, asegúrese de que las definiciones de métricas estén cargadas como tablas en ComputedESGMetrics almacén de lago de datos. A menos que actualice la definición de la métrica, no es necesario volver a cargar las definiciones. Ejecute el cuaderno Cargar definición de métrica directamente, o ejecute la actividad Cargar definición de métrica del pipeline ExecuteComputationForMetrics .
Generar y almacenar los datos de métricas
Ejecute la actividad Generar salida para métricas en el pipeline ExecuteComputationOfMetrics_DTPL o ejecute directamente el cuaderno GenerateOutputForMetrics_INTB para ejecutar la lógica de cálculo de métricas en la tabla agregada conjunto de datos y para almacenar los datos de salida en la tabla ComputedESGMetrics en ComputedESGMetrics_LH almacén de lago de datos.
Puede especificar estos parámetros para generar resultados para un conjunto específico de métricas. Si desea generar resultados para todas las definiciones de métricas cargadas en la tabla MetricsDefinitions , no especifique un valor de parámetro en la canalización y configúrelo como Ninguno en el cuaderno.
Nota
Los valores de los parámetros distinguen entre mayúsculas y minúsculas.
metric_names: especifica una lista de nombres de métricas. Puede obtener el nombre de las métricas de la biblioteca de métricas preconstruidas o consultar la tabla MetricsDefinitions en ComputedESGMetrics_LH almacén de lago de datos. Por ejemplo, ["Emisiones de GEI de alcance 3 por categoría (Protocolo GEI)", "Consumo total de agua"].
sustainability_areas: especifica una lista de áreas de sostenibilidad. Por ejemplo, [“Cambio climático”, “Agua y recursos marinos”]. Para el cálculo se consideran todas las métricas asignadas al área de sostenibilidad especificada en el parámetro. Puede encontrar el área de sostenibilidad asignada a la métrica en la biblioteca de métricas preconstruidas o consultar la tabla MetricsDefinitions en ComputedESGMetrics_LH almacén de lago de datos.
Nota
Si especifica tanto sustainability_areas como metric_names, entonces el parámetro metric_names tiene prioridad y se considera para el cálculo.
Una vez que la actividad del cuaderno o de la canalización se ejecuta correctamente, puede verificar las salidas de las métricas en la tabla ComputedESGMetrics en ComputedESGMetrics_LH almacén de lago de datos. ComputedESGMetrics es una única tabla que almacena la salida de todas las métricas. Esta tabla muestra los detalles del esquema para la tabla.
Nombre de la columna Description MetricId El identificador único de la métrica. Indica la métrica para la que se generan los datos. Es una clave externa a la tabla MetricsDefinitions . ReportingPeriod Indica el período de informe (año) para el cual se genera el valor de la métrica. NombreDeUnidadDeMedida Representa la unidad de medida del valor métrico (como mtCO2e para valores de emisión). valor Indica el valor de la métrica para el ReportingPeriod y el DimensionValue específicos. Nombre de dimensión Si la salida de la métrica tiene otra dimensión además de ReportingPeriod, este nombre de dimensión se especifica en la columna DimensionName . El valor correspondiente está en DimensionValue, y el tipo de datos está en DimensionType. Valor de dimensión Contiene el valor específico para la dimensión especificada en la columna DimensionName . Tipo de dimensión Especifica el tipo de datos de la dimensión en DimensionName. Index El índice y el MetricId identifican de forma única una fila particular de una métrica. Esta columna es útil para recuperar una salida métrica específica con dimensiones como columnas separadas de esta única tabla de salida métrica. Si desea almacenar los datos de cada métrica como una tabla o marco de datos independiente, puede utilizar la función get_metric_output_by_id para obtener los datos de salida de la métrica marco.