Поделиться через


Создать ярлык для Dataverse окружения

Следуйте инструкциям в этой статье, чтобы создать и использовать Dataverse ярлык для интеграции Microsoft Sustainability Manager данных в рабочую область Fabric. Эти шаги также подготавливают данные для преобразования в схему модели данных по окружающей среде, социальной сфере и управлению (ESG).

Предварительные требования

  • Разверните возможности экологических данных и аналитики в рабочей области Fabric.
  • Убедитесь, что Sustainability Manager установлен и настроен в вашей Dataverse среде.
  • Убедитесь, что у вас есть Dataverse система Администратор роль безопасности.
  • Убедитесь, что вы являетесь Администратор рабочего пространства Fabric.
  • Включите ссылку на Fabric из Dataverse среды.

шаг 1: Создать Dataverse ярлык

В этом шаг вы создаете ярлык для Dataverse среды, в которой присутствуют данные Sustainability Manager из IngestedRawData хранилище и озеро данных.

  1. Откройте рабочую область в Fabric, в которой вы развернули решение для экологической устойчивости. Чтобы открыть решение, выберите его в представлении списка. Чтобы перейти на страницу управляемых возможностей, выберите возможность управления данными ESG в списке Управление развернутыми возможностями .

  2. На странице возможностей управления данными ESG выберите IngestedRawData хранилище и озеро данных.

Скриншот выбора IngestedRawData хранилище и озеро данных.

  1. В хранилище и озеро данных выберите Получить данные, а затем выберите Новый ярлык.

Скриншот создания нового ярлыка.

  1. Выберите Dataverse в качестве типа сочетания клавиш.

  2. Появится мастер для настройки учетных данных подключения для Dataverse среды. Выберите Создать новое подключение и укажите URL-адрес среды и учетные данные с системными разрешениями Администратор. Fabric использует эти учетные данные для настройки подключения к Dataverse среде и безопасного доступа к данным.

Скриншот мастера подключения.

  1. Выберите все таблицы Sustainability Manager из списка, а затем нажмите Далее. Найдите таблицы, начинающиеся с префикса msdyn_.

Скриншот поиска msdyn.

  1. Появится список выбранных таблиц Sustainability Manager и их ярлыков.

Каждый ярлык создается с суффиксом _partitioned. Чтобы удалить суффикс из всех имен таблиц, можно создать блокнот, добавить в него IngestedRawData хранилище и озеро данных, а затем выполнить следующую логику. Замените «[LAKEHOUSE_NAME]» на имя хранилище и озеро данных, содержащее Dataverse сочетания клавиш для таблицы. Например, SDS_ESGDE_test_IngestedRawData_LH.

TARGET_DB = "[LAKEHOUSE_NAME]"
DATAVERSE_SHORTCUT_SUFFIX = "_partitioned"

for table in spark.catalog.listTables(TARGET_DB):
    if table.name.endswith(DATAVERSE_SHORTCUT_SUFFIX):
        updated_table_name = table.name.removesuffix(DATAVERSE_SHORTCUT_SUFFIX)
        try:
            spark.sql(f"ALTER TABLE {TARGET_DB}.{table.name} RENAME TO {TARGET_DB}.{updated_table_name}")
            print(f"Successfully renamed table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
        except Exception as e:
            print(f"Failed renaming table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")      

Таблицы теперь доступны в IngestedRawData хранилище и озеро данных и готовы к преобразованию в модель данных ESG.

Шаг 2. Преобразование данных

После интеграции данных Sustainability Manager в IngestedRawData хранилище и озеро данных необходимо унифицировать и гармонизировать данные, преобразовав их в схему модели данных ESG . Развертывание возможностей создало ProcessedESGData хранилище и озеро данных в рабочей области для хранения согласованных данных.

Схема модели данных ESG связывает сущности данных ESG с другими сущностями данных, которые описывают другие функциональные области компании, такие как HR, IT или финансовое производство.

Для преобразования данных Sustainability Manager в схему модели данных ESG эта возможность предоставляет блокноты и конвейеры данных, которые используют готовые технологии преобразования и оркестровки с использованием библиотек, хранящихся в ConfigAndDemoData хранилище и озеро данных в вашей рабочей области.

Запустите блокнот LoadReferenceTables_INTB , чтобы загрузить и преобразовать данные Sustainability Manager в схему модели данных ESG в ProcessedESGData хранилище и озеро данных.

Скриншот работы конвейера.

Конвейер данных выполняет следующие шаги:

  1. Первый шаг по умолчанию деактивирован и не требуется для этого метода, поскольку данные из Sustainability Manager уже загружены как таблицы хранилище и озеро данных.

  2. Преобразование данных Sustainability Manager в схему модели данных ESG представляет собой двухэтапный процесс:

  • Сначала блокнот TransformMSMDataToProcessedESGData_INTB преобразует Microsoft Sustainability Manager данные в промежуточные таблицы импорта необработанных данных.
  • Затем блокнот TransformRawImportESGDataToProcessedESGData_INTB преобразует данные из таблиц импорта необработанных данных в схему модели данных ESG .