Opprette en snarvei til Dataverse miljøet
Følg fremgangsmåten i denne artikkelen for å opprette og bruke en Dataverse snarvei for å integrere Microsoft Sustainability Manager data i Fabric-arbeidsområdet. Disse trinnene klargjør også dataene for transformasjon til ESG-datamodellskjemaet (Environmental, Social, and Governance).
Forutsetning
- Distribuer funksjonen for miljødata og innsikt i Fabric-arbeidsområdet.
- Kontroller at Sustainability Manager er installert og konfigurert i miljøet ditt Dataverse .
- Sørg for at du har Dataverse systemet administrator sikkerhetsrolle.
- Kontroller at du er administrator for Fabric-arbeidsområdet.
- Aktiver opprette en kobling til Fabric fra Dataverse miljøet.
Trinn 1: Opprett en Dataverse snarvei
I denne trinn oppretter du en snarvei til Dataverse miljøet der Sustainability Manager data finnes fra IngestedRawData sjøhus.
Åpne arbeidsområdet i Fabric der du implementerte Sustainability-løsningen. Velg løsningen fra listevisningen for å åpne løsningen. Hvis du vil gå til siden for administrert funksjonalitet, Velg ESG-dataegenskapsfunksjonen fra listevisningen Administrer distribuerte funksjoner .
Fra siden for administrert funksjonalitet for ESG-dataeiendom Velg du IngestedRawData sjøhus.
- Fra sjøhus, Velg Hent data, og deretter Velg Ny snarvei.
Velgsom Dataverse snarveistype.
Det vises en veiviser for å konfigurere tilkoblingslegitimasjonen Dataverse for miljøet. Velg Opprett ny tilkobling og oppgi URL-adressen for miljøet og legitimasjonen med systemtillatelser administrator. Fabric bruker denne legitimasjonen til å konfigurere tilkoblingen Dataverse til miljøet og få sikker tilgang til dataene.
- Velg alle tabellene Sustainability Manager fra listen, og deretter Velg Neste. Se etter tabellene som begynner med prefikset msdyn_.
- Listen over valgte Sustainability Manager-tabeller og deres snarveisnavn vises.
Hver snarvei opprettes med suffikset _partitioned. Hvis du vil fjerne suffikset fra alle tabellnavnene, kan du opprette en notatblokk, legge til IngestedRawData sjøhus i notatblokken og deretter kjøre følgende logikk. Erstatt «[LAKEHOUSE_NAME]» med sjøhus-navnet som inneholder Dataverse tabellsnarveiene. For eksempel,SDS_ESGDE_test_IngestedRawData_LH .
TARGET_DB = "[LAKEHOUSE_NAME]"
DATAVERSE_SHORTCUT_SUFFIX = "_partitioned"
for table in spark.catalog.listTables(TARGET_DB):
if table.name.endswith(DATAVERSE_SHORTCUT_SUFFIX):
updated_table_name = table.name.removesuffix(DATAVERSE_SHORTCUT_SUFFIX)
try:
spark.sql(f"ALTER TABLE {TARGET_DB}.{table.name} RENAME TO {TARGET_DB}.{updated_table_name}")
print(f"Successfully renamed table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
except Exception as e:
print(f"Failed renaming table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
Tabellene er nå tilgjengelige i IngestedRawData sjøhus og er klare til å transformeres til ESG-datamodellen.
Trinn 2: Transformer data
Når Sustainability Manager dataene er integrert i IngestedRawData sjøhus, må du forene og harmonisere dataene ved å transformere dem til ESG-datamodellskjemaet . Funksjonalitetsdistribusjonen opprettet ProcessedESGData sjøhus i arbeidsområdet for lagring av de harmoniserte dataene.
ESG-datamodellskjemaet kobler ESG-dataenhetene til andre dataenheter som beskriver andre funksjonsområder i et selskap, for eksempel HR, IT eller finansproduksjon.
For å transformere Sustainability Manager-data til ESG-datamodellskjemaet gir funksjonen notatblokker og datasamlebånd som bruker forhåndsbygde transformasjons- og orkestreringsteknologier ved hjelp av biblioteker som er lagret i ConfigAndDemoData sjøhus i arbeidsområdet.
Kjør LoadReferenceTables_INTB-notatblokken for å laste inn og transformere Sustainability Manager-dataene til ESG-datamodellskjemaet i ProcessedESGData sjøhus.
Datasamlebåndet kjører disse trinnene:
Den første trinn er deaktivert som standard og er ikke nødvendig for denne metoden, fordi dataene fra Sustainability Manager allerede er lastet inn som sjøhus-tabeller.
Transformasjonen av Sustainability Manager-dataene til ESG-datamodellskjemaet er en to-trinns prosess:
- Først transformerer den TransformMSMDataToProcessedESGData_INTB notatblokken Microsoft Sustainability Manager dataene til de mellomliggende importtabellene for rådata.
- Deretter transformerer TransformRawImportESGDataToProcessedESGData_INTB-notatblokken dataene fra importtabeller for rådata til ESG-datamodellskjemaet .