Udostępnij za pośrednictwem


Tworzenie skrótu do Dataverse środowiska

Microsoft Cloud for Sustainability Tech Summit w listopadzie 2024 r.

Wykonaj czynności opisane w tym artykule, aby utworzyć skrót do integrowania Dataverse danych z obszarem roboczym sieci szkieletowej Microsoft Sustainability Manager i używać go. Te kroki przygotowują również dane do przekształcenia w schemat modelu danych ESG (Environmental, Social, and Governance).

Wymagania wstępne

  • Wdróż funkcję Dane środowiskowe i szczegółowe informacje w obszarze roboczym sieci szkieletowej.
  • Upewnij się, że Sustainability Manager jest zainstalowany i skonfigurowany w Twoim Dataverse środowisku.
  • Upewnij się, że system jest Dataverse Administrator rola zabezpieczeń.
  • Upewnij się, że jesteś administratorem obszaru roboczego sieci szkieletowej.
  • Włącz połączenie z siecią szkieletową Dataverse ze środowiska.

Krok 1: Utwórz Dataverse skrót

W tym kroku utworzysz skrót do Dataverse środowiska, w którym znajdują się dane Menedżera zrównoważonego rozwoju z magazynu lakehouse IngestedRawData .

  1. Otwórz obszar roboczy w Fabric, w którym wdrożono rozwiązanie Sustainability. Otwórz rozwiązanie, wybierz je z widoku listy. Aby przejść do strony możliwości zarządzanych, wybierz funkcję ESG Data Estate (Zasób danych ESG) z widoku listy Zarządzanie wdrożonymi możliwościami .

  2. Na stronie Zarządzana infrastruktura danych ESG wybierz magazyn lakehouse IngestedRawData .

Zrzut ekranu przedstawiający wybieranie magazynu lakehouse IngestedRawData.

  1. W magazyn lakehouse wybierz pozycję Pobierz dane, a następnie wybierz pozycję Nowy skrót.

Zrzut ekranu przedstawiający tworzenie nowego skrótu.

  1. Wybierz Dataverse jako typ skrótu.

  2. Zostanie wyświetlony kreator w celu skonfigurowania poświadczeń połączenia dla Dataverse środowiska. Wybierz pozycję Utwórz nowe połączenie i podaj adres URL środowiska oraz poświadczenia z uprawnieniami administratora systemu. Sieć szkieletowa używa tych poświadczeń do skonfigurowania połączenia ze Dataverse środowiskiem i bezpiecznego uzyskiwania dostępu do danych.

Zrzut ekranu kreatora połączeń.

  1. Wybierz z listy wszystkie tabele Menedżer zrównoważonego rozwoju, a następnie wybierz przycisk Dalej. Poszukaj tabel rozpoczynających się od prefiksu msdyn_.

Zrzut ekranu przedstawiający wyszukiwanie msdyn.

  1. Zostanie wyświetlona lista wybranych tabel Menedżera zrównoważonego rozwoju wraz z nazwami skrótów.

Każdy skrót jest tworzony z sufiksem _partitioned. Aby usunąć sufiks ze wszystkich nazw tabel, możesz utworzyć notes, dodać magazyn lakehouse IngestedRawData ) do notesu, a następnie uruchomić następującą logikę. Zastąp ciąg "[LAKEHOUSE_NAME]" nazwą magazyn lakehouse, która zawiera skróty do tabel. Dataverse Na przykład SDS_ESGDE_test_IngestedRawData_LH.

TARGET_DB = "[LAKEHOUSE_NAME]"
DATAVERSE_SHORTCUT_SUFFIX = "_partitioned"

for table in spark.catalog.listTables(TARGET_DB):
    if table.name.endswith(DATAVERSE_SHORTCUT_SUFFIX):
        updated_table_name = table.name.removesuffix(DATAVERSE_SHORTCUT_SUFFIX)
        try:
            spark.sql(f"ALTER TABLE {TARGET_DB}.{table.name} RENAME TO {TARGET_DB}.{updated_table_name}")
            print(f"Successfully renamed table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
        except Exception as e:
            print(f"Failed renaming table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")      

Tabele są teraz dostępne w magazynie lakehouse IngestedRawData i są gotowe do przekształcenia w model danych ESG.

Krok 2: Przekształć dane

Po zintegrowaniu danych Menedżera ds. zrównoważonego rozwoju z magazyn lakehouse IngestedRawData należy ujednolicić i zharmonizować dane, przekształcając je w schemat modelu danych ESG. Wdrożenie funkcji utworzyło magazyn lakehouse ProcessedESGData w przestrzeni roboczej do przechowywania zharmonizowanych danych.

Schemat modelu danych ESG łączy jednostki danych ESG z innymi jednostkami danych, które opisują inne obszary funkcjonalne firmy, takie jak HR, IT lub produkcja finansowa.

W celu przekształcenia danych Menedżera zrównoważonego rozwoju do schematu modelu danych ESG funkcja zapewnia notesy i potoki danych, które korzystają ze wstępnie utworzonych technologii transformacji i orkiestracji przy użyciu bibliotek przechowywanych w magazynie lakehouse ConfigAndDemoData w obszarze roboczym.

Uruchom notes LoadReferenceTables_INTB , aby załadować i przekształcić dane Menedżera ds. zrównoważonego rozwoju do schematu modelu danych ESG w ProcessedESGData magazyn lakehouse.

Zrzut ekranu przedstawiający uruchamianie potoku.

Potok danych uruchamia następujące kroki:

  1. Pierwszy krok jest domyślnie dezaktywowany i nie jest wymagany dla tej metody, ponieważ dane z Sustainability Manager są już załadowane jako tabele magazynu lakehouse.

  2. Transformacja danych Sustainability Managera do schematu modelu danych ESG jest procesem dwuetapowym:

  • Najpierw notes TransformMSMDataToProcessedESGData_INTB przekształca Microsoft Sustainability Manager dane w pośrednie tabele importu danych pierwotnych.
  • Następnie notes TransformRawImportESGDataToProcessedESGData_INTB przekształca dane z tabel importu danych pierwotnych do schematu modelu danych ESG.