Calidad de los datos de las bases de datos reflejadas de Microsoft Fabric
Como solución de replicación de datos, la creación de reflejo en Fabric es una solución de bajo costo y baja latencia para unir los datos de varios sistemas en una única plataforma de análisis. Puede replicar continuamente el patrimonio de datos existente directamente en OneLake de Fabric, incluidos los datos de Azure SQL Database, Azure Cosmos DB y Snowflake.
La creación de reflejo en Fabric permite a los usuarios disfrutar de un producto de un extremo a otro diseñado para simplificar sus necesidades de análisis. Creado para la apertura y la colaboración entre Microsoft y las soluciones tecnológicas que pueden leer el formato de tabla delta lake de código abierto, la creación de reflejo es una solución de bajo costo y baja latencia que le permite crear una réplica de los datos en OneLake, que se puede usar para todas sus necesidades analíticas. Para obtener más información sobre la creación de reflejo de Fabric, consulte la documentación de Fabric.
Configuración de la calidad de los datos para una base de datos reflejada de Fabric
Habilite la creación de reflejo en el inquilino de Fabric. Los administradores de Power BI pueden habilitar o deshabilitar la creación de reflejo para toda la organización o para grupos de seguridad específicos, mediante la configuración que se encuentra en el portal de administración de Power BI. La creación de reflejo se habilita mediante la creación de una conexión segura al origen de datos operativo. Elija si desea replicar una base de datos completa o tablas individuales y la creación de reflejo mantendrá automáticamente los datos sincronizados. Una vez configurados, los datos se replicarán continuamente en OneLake para el consumo de análisis.
Después de habilitar la creación de reflejo y la replicación iniciada, confirme que la replicación de creación de reflejo se completa correctamente.
En la pestaña Informes , seleccione Actualizar automáticamente el modelo semántico.
Vaya a Mapa de datos de Microsoft Purview y examine el origen de datos. Use la autenticación de la entidad de servicio.
Una vez completado el examen, asocie los nuevos recursos de datos a un producto de datos en Catálogo unificado de Microsoft Purview para su conservación y evaluación de la calidad de los datos.
En el producto de datos, seleccione la base de datos reflejada (no tablas individuales) del catálogo. Debe estar disponible como un conjunto de datos de Power BI.
Todas las tablas dentro de la base de datos reflejada se deben agregar automáticamente al producto de datos como tablas delta de OneLake.
En el área De calidad de datos de Heath management in Catálogo unificado, ejecute un examen de calidad de datos o genere un perfil de sus datos como de costumbre.
Importante
- Use entidades de servicio para los exámenes de mapa de datos y una identidad administrada para los exámenes de calidad de datos.
- Seleccione la base de datos reflejada en lugar de tablas individuales.
- Actualice el modelo semántico cada vez.
- Si las tablas de base de datos reflejadas no están disponibles en Fabric Lakehouse, póngase en contacto con el soporte técnico de Fabric.
- El análisis de calidad de datos solo se admite para el formato de archivos delta, iceberg y parquet de Lakehouse.
- Existe una dependencia del equipo de Fabric para diferenciar los elementos de acceso directo de los elementos nativos del SDK de OneLake para subartifacts de Lakehouse. Por ahora, todos los elementos de acceso directo (tablas y archivos) se considerarán elementos nativos en el examen.