Crear un acceso directo al entorno Dataverse
Siga los pasos de este artículo para crear y utilizar un acceso directo para integrar datos en su espacio de trabajo de Fabric. Dataverse Microsoft Sustainability Manager Estos pasos también preparan los datos para su transformación en el esquema del modelo de datos ambientales, sociales y de gobernanza (ESG).
Requisitos previos
- Implemente la capacidad de información y datos ambientales en el espacio de trabajo de Fabric.
- Asegúrese de que Sustainability Manager esté instalado y configurado en su entorno. Dataverse
- Asegúrese de tener el rol de seguridad de administrador del sistema. Dataverse
- Asegúrese de ser administrador del espacio de trabajo de Fabric.
- Habilitar enlace a Fabric desde el entorno Dataverse .
- Asegúrese de que el entorno y el espacio de trabajo de Fabric estén en la misma geografía. Dataverse
Paso 1: Crea un acceso directo Dataverse
En este paso, creará un acceso directo al entorno en el que se encuentran los datos de Sustainability Manager desde el lago Dataverse IngestedRawData .
Abra el espacio de trabajo en Fabric en el que implementó la solución Sustainability. Para abrir la solución, selecciónela de la vista de lista. Para acceder a la página de capacidad administrada, seleccione la capacidad de patrimonio de datos ESG en la vista de lista Administrar capacidades implementadas .
Desde la página de capacidad administrada del patrimonio de datos de ESG, seleccione el lago IngestedRawData .
- Desde la casa del lago, seleccione Obtener datos y luego seleccione Nuevo acceso directo.
Seleccione Dataverse como tipo de acceso directo.
Aparecerá un asistente para configurar sus credenciales de conexión para el entorno. Dataverse Seleccione Crear nueva conexión y proporcione la URL del entorno y las credenciales con permisos de administrador del sistema. Fabric utiliza estas credenciales para configurar la conexión al entorno y acceder de forma segura a los datos. Dataverse
- Seleccione todas las tablas de Sustainability Manager de la lista y luego seleccione Siguiente. Busque las tablas que comiencen con el prefijo msdyn_.
- Aparece la lista de tablas de Sustainability Manager seleccionadas y sus nombres de acceso directo.
Cada acceso directo se crea con el sufijo _partitioned. Para eliminar el sufijo de todos los nombres de tabla, puede crear un cuaderno, agregar IngestedRawData lakehouse al cuaderno y luego ejecutar la siguiente lógica. Reemplace "[LAKEHOUSE_NAME]" con el nombre de la casa del lago que contiene los accesos directos de la tabla. Dataverse Por ejemplo, SDS_ESGDE_test_IngestedRawData_LH.
TARGET_DB = "[LAKEHOUSE_NAME]"
DATAVERSE_SHORTCUT_SUFFIX = "_partitioned"
for table in spark.catalog.listTables(TARGET_DB):
if table.name.endswith(DATAVERSE_SHORTCUT_SUFFIX):
updated_table_name = table.name.removesuffix(DATAVERSE_SHORTCUT_SUFFIX)
try:
spark.sql(f"ALTER TABLE {TARGET_DB}.{table.name} RENAME TO {TARGET_DB}.{updated_table_name}")
print(f"Successfully renamed table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
except Exception as e:
print(f"Failed renaming table from '{table.name}' to '{updated_table_name}' in Lakehouse '{TARGET_DB}'")
Las tablas ahora están disponibles en el lago IngestedRawData y están listas para transformarse en el modelo de datos ESG.
Paso 2: Transformar datos
Una vez que los datos de Sustainability Manager se integran en el lago de datos brutos ingeridos, es necesario unificarlos y armonizarlos transformándolos en el esquema del modelo de datos ESG. ... La implementación de la capacidad creó el lago ProcessedESGData en el espacio de trabajo para almacenar los datos armonizados.
El esquema del modelo de datos ESG vincula las entidades de datos ESG con otras entidades de datos que describen otras áreas funcionales de una empresa, como RR.HH., TI o producción financiera.
Para transformar los datos de Sustainability Manager al esquema del modelo de datos ESG, la capacidad proporciona cuadernos y canales de datos que utilizan tecnologías de orquestación y transformación prediseñadas mediante bibliotecas almacenadas en el lago ConfigAndDemoData en su espacio de trabajo. ...
Ejecute el cuaderno LoadReferenceTables_INTB para cargar y transformar los datos de Sustainability Manager al esquema del modelo de datos ESG en el lakehouse ProcessedESGData .
La canalización de datos ejecuta estos pasos:
El primer paso está desactivado de forma predeterminada y no es necesario para este método, porque los datos de Sustainability Manager ya están cargados como tablas de lakehouse.
La transformación de los datos de Sustainability Manager al esquema del modelo de datos ESG es un proceso de dos etapas: ...
- En primer lugar, el cuaderno TransformMSMDataToProcessedESGData_INTB transforma los Microsoft Sustainability Manager datos en las tablas de importación de datos sin procesar intermedias.
- Luego, el cuaderno TransformRawImportESGDataToProcessedESGData_INTB transforma los datos de las tablas de importación de datos sin procesar al esquema del modelo de datos ESG .