Delen via


opgerolde_waarden_toevoegen

Microsoft Cloud for Sustainability Techtop november 2024.

Belangrijk

Een gedeelte van of alle functionaliteit is beschikbaar als onderdeel van een preview-release. De inhoud en functionaliteit zijn aan verandering onderhevig.

Voeg samengevoegde waarden voor de opgegeven partij-ID's toe aan het DataFrame. Met deze functie kunt u gegevens uit de tabellen WaterUtilizationAggregate, WasteQuantityAggregate, EmissionsAggregate en NetRevenueAggregate optellen ten opzichte van de hiërarchie van een organisatie, waarbij de hiërarchie de vorm heeft van een eenvoudige bovenliggend onderliggend-relatie. Raadpleeg de documentatie over ESG-data-estate voor meer informatie over het instellen van een eenvoudige bovenliggend onderliggend-hiërarchie.

Vereisten

  • De hiërarchiegegevens worden opgeslagen in de tabel RelatedParty met behulp van een RelatedPartyRelationshipTypeName, bijvoorbeeld 'Parent-child'.

  • De geaggregeerde tabel (bijv. WaterUtilizationAggregate) is succesvol gegenereerd.

U kunt deze functie nu gebruiken om WaterUtilizationUnits samen te voegen tot een specifiek knooppunt in de hiërarchie en een bijgewerkt dataframe te verkrijgen waarin de WaterUtilizationAggregate wordt bijgewerkt met samengevoegde rijen voor de opgegeven partyid. Vervolgens kunt u het geretourneerde dataframe opslaan in ComputedESGMetrics lakehouse met behulp van de overschrijfmodus, zodat de bijgewerkte WaterUtilizationAggregate als de bijgewerkte aggregatietabel fungeert.

Vernieuw het semantische model 'DatasetForMetricsMeasures'. Vervolgens kunt u een aangepaste metriek definiëren, waarbij u kunt filteren op de samengevoegde gegevens in uw metriekberekening.

Parameters:

  • party_ids (list): Lijst met bovenliggend-partij-ID's waarvan de samengevoegde waarden moeten worden berekend.
  • df (DataFrame): Invoer samengevoegde DataFrame.
  • party_id_column (str): Kolomnaam die de partij-ID vertegenwoordigt ('PartyId' of 'SecondaryPartyId')
  • value_columns (list): Lijst met waardekolommen om te aggregeren.
  • relationship_type (str): Relatietype om te overwegen voor hiërarchie.

Retourneren:

  • DataFrame: DataFrame met toegevoegde rijen voor samengevoegde waarden.

Verhogingen:

  • ValueError: Als de kolom Relatietype of Partij-ID ongeldig is.

Voorbeeldgebruik:

water_aggregate_df = spark.read.table("WaterUtilizationAggregate")
updated_water_aggregate_df = append_rolled_up_values([1, 3], water_aggregate_df, 'PartyId', ['WaterUtilizationUnits'], 'Parent-child')
print(updated_water_aggregate_df)