Gerar e armazenar dados de métricas
Importante
Algumas ou todas estas funcionalidades estão disponíveis como parte de uma versão de pré-visualização. O conteúdo e a funcionalidade estão sujeitos a alterações.
Depois que a tabela agregada gera, você pode executar a lógica de computação (agregação ou cálculo) definida na definição de métrica sobre a tabela agregada conjunto de dados gerar os dados de saída da métrica.
A lógica computacional de uma métrica é definida com:
Power BI medidas: Contém lógica computacional na forma de linguagem de fórmula DAX (Data Analysis Expressions). Power BI As medidas são definidas no modelo semântico DatasetForMetricsMeasures_DTST pré-construído implantado como parte da capacidade. Para saber mais sobre Power BI medidas, vá para Criar medidas para análise de dados na Power BI Desktop Power BI documentação.
Dimensões: Especifica as dimensões/colunas necessárias na saída métrica. Essas dimensões podem ser de tabelas agregadas ou das tabelas calculadas no modelo semântico DatasetForMetricsMeasures_DTST .
Filtros: Especifica os valores das dimensões da tabela agregada que precisam ser filtrados.
Uma amostra métrica pré-construída de emissões por categoria Escopo 3 (GHG protocol).
A seguir está a definição de métrica dessa métrica do arquivo metrics_definitions_config.json:
{
"metric_name": "Scope 3 GHG emissions by category (GHG Protocol)",
"measure_name": "Emissions",
"dimensions": [
"EmissionsAggregate[EmissionSource]",
"EmissionsAggregate[UnitOfMeasureName]",
"EmissionsAggregate[ReportingPeriod]"
],
"filters": {
"EmissionsAggregate[isRolledUp]": [
"False"
],
"EmissionsAggregate[Scope]": [
"Scope 3"
],
"EmissionsAggregate[AccountingMethod]": [
"Location based",
null
],
"EmissionsAggregate[UnitOfMeasureName]": [
"mtCO2e"
]
},
"sustainability_area": "Climate Change",
"labels": {
"Reporting standard": [
"CSRD"
],
"Disclosure datapoint": [
"E1-6_04"
]
}
}
Com base na definição da métrica, a saída métrica consiste em:
- As colunas especificadas como dimensões na definição métrica
- A coluna de valor que é calculada executando a lógica de cálculo especificada na definição métrica
Para a métrica de exemplo, estas colunas de saída são:
- EmissionSource: Captura o nome da categoria do escopo 3.
- Nome da unidade de medida: Menciona a unidade de medida do valor da emissão, como mtCO2e.
- Período de relato: Especifica o ano de relato.
- Valor: Captura o valor das emissões para uma categoria de âmbito 3 para um período de informação específico.
Para essa métrica, você precisa calcular a soma das Unidades de Emissões de CO22 em que Escopo é Escopo 3 e AccountingMethod é nulo ou Local baseado em Fonte de emissão e Período de relatório da tabela EmissionsAggregate.
Este cálculo é realizado da seguinte forma pela lógica computacional especificada na definição métrica:
A medida Emissions executa a soma das emissões de CO2eEmissions da tabela EmissionsAggregate e é definida no modelo semântico DatasetForMetricsMeasures_DTST:
Para exibir as medidas pré-criadas Power BI que são usadas para calcular métricas pré-criadas, siga estas etapas:
- Abra DatasetForMetricsMeasures_DTST a partir da área de trabalho.
- Selecionar Abrir modelo de dados.
- Selecione ESG_measures no painel Lado Dados .
Se o modelo de dados abertos estiver acinzentado, navegue até a configuração Espaço de trabalho. Abrir Power BI/Geral e ativar o Os usuários podem editar modelos de dados na configuração de Power BI serviço (pré-visualização ).
A medida Dimensões executa a agregação nas dimensões especificadas na definição métrica (período de relato), fonte de emissão e colunas de unidade de medida do quadro agregado. Estas colunas a partir das dimensões da saída métrica.
Filters especifica os valores necessários para diferentes colunas da tabela EmissionsAggregate a serem somados pela medida. Neste exemplo, as linhas em que o escopo é o escopo 3, o método de contabilidade é nulo ou baseado no local e a unidade de medida é mtCO2e.
Para calcular os dados de métricas com Power BI medidas, dimensões e filtros, o computador portátil pré-construído usa a função evaluate_measure da interface Python da biblioteca Python do link semântico, SemPy.
Pré-requisitos para gerar dados de métricas
- A tabela agregada necessária para gerar a métrica já deve estar presente no ComputedESGMetrics_LH lakehouse.
- Antes de executar a lógica de computação para uma métrica, verifique se as definições de métrica estão carregadas como tabelas no ComputedESGMetrics lakehouse. A menos que você atualize a definição de métrica, não será necessário recarregá-las. Execute o bloco de anotações de definição de métrica Load diretamente ou execute a atividade de definição de métrica Load do pipeline ExecuteComputationForMetrics .
Gerar e armazenar os dados de métricas
Execute a atividade Gerar saída para métricas no pipeline de ExecuteComputationOfMetrics_DTPL ou execute diretamente o bloco de anotações GenerateOutputForMetrics_INTB para executar a lógica de computação métrica na tabela agregada conjunto de dados e para armazenar os dados de saída na tabela ComputedESGMetrics no ComputedESGMetrics_LH lakehouse.
Você pode especificar esses parâmetros para gerar saídas para um conjunto específico de métricas. Se você quiser gerar saída para todas as definições de métrica carregadas na tabela MetricsDefinitions , não especifique um valor de parâmetro no pipeline e defina-o como Nenhum no bloco de anotações.
Nota
Os valores dos parâmetros diferenciam maiúsculas de minúsculas.
metric_names: Especifique uma lista de nomes de métricas. Você pode obter o nome das métricas na biblioteca de métricas pré-criadas ou consultar a tabela MetricsDefinitions no ComputedESGMetrics_LH # lakehouse. Por exemplo, ["Emissões de GEE de âmbito 3 por categoria (GHG Protocol)","Consumo total de água"].
sustainability_areas: Especifique uma lista de áreas de sustentabilidade. Por exemplo, mudança de Climage ou Recursos hídricos e marinhos. Todas as métricas mapeadas para a área de sustentabilidade especificada no parâmetro são consideradas para cálculo. Você pode encontrar a área de sustentabilidade mapeada para a métrica na biblioteca de métricas pré-construídas ou consultar a tabela MetricsDefinitions no ComputedESGMetrics_LH lakehouse.
Nota
Se você especificar sustainability_areas e metric_names, o parâmetro metric_names terá prioridade e será considerado para computação.
Depois que a atividade do bloco de anotações ou do pipeline for executada com êxito, você poderá verificar as saídas métricas na tabela ComputedESGMetrics no ComputedESGMetrics_LH lakehouse. ComputedESGMetrics é uma única tabela que armazena a saída para todas as métricas. Esta tabela mostra os detalhes do esquema para a tabela.
Nome da coluna Description MetricId O identificador exclusivo da métrica. Indica a métrica para a qual os dados são gerados. É uma chave estrangeira para a tabela MetricsDefinitions . ReportingPeriod Indica o período de relatório (ano) para o qual o valor métrico é gerado. UnitOfMeasureName Representa a unidade de medida para o valor métrico (como mtCO2e para valores de emissão). valor Indica o valor da métrica para ReportingPeriod e DimensionValue específicos. Nome da dimensão Se a saída da métrica tiver outra dimensão além de ReportingPeriod, esse nome de dimensão será especificado na coluna DimensionName . O valor correspondente está em DimensionValue e o tipo de dados está em DimensionType. ValorDimensão Contém o valor específico para a dimensão especificada na coluna DimensionName . Tipo de dimensão Especifica o tipo de dados da dimensão em DimensionName. Index Index e MetricId identificam exclusivamente uma linha específica de uma métrica. Esta coluna é útil ao recuperar uma saída métrica específica com dimensões como colunas separadas desta tabela de saída de métrica única. Se quiser armazenar os dados de cada métrica como um quadro de dados ou tabela separados, você pode usar a função get_metric_output_by_id para obter o quadro de dados de saída da métrica.