Opret en genvej til Dataverse miljøet
Følg trinnene i denne artikel for at oprette og bruge en Dataverse genvej til at integrere Microsoft Sustainability Manager data i dit Fabric-arbejdsområde. Disse trin forbereder også dataene til transformation til ESG-datamodelskemaet (Environmental, Social and Governance).
Forudsætninger
- Udrul funktionen Miljødata og indsigt i Fabric-arbejdsområdet.
- Sørg for, at Sustainability Manager er installeret og konfigureret i dit Dataverse miljø.
- Sørg for, at du har Dataverse systemet administrator sikkerhedsrolle.
- Sørg for, at du er administrator af Fabric-arbejdsområdet.
- Aktivér sammenkædning til Fabric fra Dataverse miljøet.
Trin 1: Opret en Dataverse genvej
I denne trin skal du oprette en genvej til det Dataverse miljø, hvor Sustainability Manager data findes fra IngestedRawData søhus.
Åbn arbejdsområdet i Fabric, hvor du implementerede bæredygtighedsløsningen. Vælg løsningen fra listevisningen for at åbne løsningen. Hvis du vil gå til siden med administrerede funktioner, skal du vælge ESG-dataegenskabsfunktionen i listevisningen Administrer udrullede funktioner .
På siden ESG-dataejendomsadministreret funktionalitet skal du vælge IngestedRawData søhus.
- Vælg Hent data i søhus, og vælg derefter Ny genvej.
Vælg Dataverse som genvejstype.
Der vises en guide, der konfigurerer dine legitimationsoplysninger for forbindelsen Dataverse . Vælg Opret ny forbindelse , og angiv URL-adressen til miljøet og legitimationsoplysningerne med systemtilladelser administrator. Fabric bruger disse legitimationsoplysninger til at konfigurere forbindelsen til Dataverse miljøet og få sikker adgang til dataene.
- Vælg alle Sustainability Manager-tabellerne på listen, og vælg derefter Næste. Se efter de tabeller, der begynder med præfikset msdyn_.
- Listen over valgte Sustainability Manager-tabeller og deres genvejsnavne vises.
Hver genvej oprettes med suffikset _partitioned. Hvis du vil fjerne suffikset fra alle tabelnavnene, kan du oprette en notesbog, føje IngestedRawData søhus til notesbogen og derefter køre følgende logik. Erstat "[LAKEHOUSE_NAME]" med navnet søhus, der indeholder Dataverse tabelgenvejene. For eksempel SDS_ESGDE_test_IngestedRawData_LH.
TARGET_DB = "[LAKEHOUSE_NAME]"
DATAVERSE_SHORTCUT_SUFFIX = "_partitioned"
for table in spark.catalog.listTables(TARGET_DB):
if table.name.endswith(DATAVERSE_SHORTCUT_SUFFIX):
updated_table_name = table.name.removesuffix(DATAVERSE_SHORTCUT_SUFFIX)
try:
spark.sql(f"ALTER TABLE {TARGET_DB}.{table.name} RENAME TO {TARGET_DB}.{updated_table_name}")
print(f"Successfully renamed table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
except Exception as e:
print(f"Failed renaming table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
Tabellerne er nu tilgængelige i IngestedRawData søhus og er klar til at blive transformeret til ESG-datamodellen.
Trin 2: Transformer data
Når Sustainability Manager-dataene er integreret i IngestedRawData søhus, skal du samle og harmonisere dataene ved at transformere dem til ESG-datamodelskemaet . Funktionalitetsudrulningen oprettede ProcessedESGData søhus i arbejdsområdet til lagring af de harmoniserede data.
ESG-datamodelskemaet knytter ESG-dataenhederne til andre dataenheder, der beskriver andre funktionsområder i en virksomhed, f.eks. HR, IT eller finansproduktion.
Til transformering af Sustainability Manager-data til ESG-datamodelskemaet indeholder funktionen notesbøger og datapipelines, der bruger færdigbyggede transformations- og orkestreringsteknologier ved hjælp af biblioteker, der er gemt i ConfigAndDemoData søhus i dit arbejdsområde.
Kør LoadReferenceTables_INTB-notesbogen for at indlæse og transformere Sustainability Manager-dataene til ESG-datamodelskemaet i ProcessedESGData søhus.
Datapipelinen kører disse trin:
Den første trin er som standard deaktiveret og er ikke påkrævet for denne metode, fordi dataene fra Sustainability Manager allerede er indlæst som søhus-tabeller.
Transformationen af Sustainability Manager-dataene til ESG-datamodelskemaet er en proces i to faser:
- Først transformerer den TransformMSMDataToProcessedESGData_INTB Microsoft Sustainability Manager notesbog dataene til de mellemliggende importtabeller for rådata.
- Derefter transformerer den TransformRawImportESGDataToProcessedESGData_INTB notesbog dataene fra importtabeller for rådata til ESG-datamodelskemaet .