Microsoft Fabric 镜像数据库的数据质量
作为一种数据复制解决方案,Fabric 中的镜像是一种低成本、低延迟的解决方案,用于将各种系统中的数据汇集到单个分析平台中。 可以连续将现有数据资产直接复制到 Fabric 的 OneLake 中,包括来自 Azure SQL Database、Azure Cosmos DB 和 Snowflake 的数据。
Fabric 中的镜像允许用户享受旨在简化分析需求的端到端产品。 为Microsoft和技术解决方案之间的开放性和协作而构建,可以读取开源 delta Lake 表格式,镜像是一种低成本、低延迟的解决方案,可用于在 OneLake 中创建数据副本 (replica) ,该解决方案可用于满足所有分析需求。 有关 Fabric 镜像的更多详细信息 ,请查看 Fabric 文档。
配置 Fabric 镜像数据库的数据质量
在 Fabric 租户中启用镜像。 Power BI 管理员可以使用 Power BI 管理门户中的设置为整个组织或特定安全组启用或禁用镜像。 通过创建与作数据源的安全连接来启用镜像。 选择是复制整个数据库还是单个表,镜像会自动使数据保持同步。设置后,数据将持续复制到 OneLake 中以供分析使用。
启用镜像并启动复制后,确认镜像复制成功完成。
在“ 报告 ”选项卡上,选择“ 自动更新语义模型”。
转到Microsoft Purview 数据映射并扫描数据源。 使用服务主体身份验证。
扫描完成后,将新数据资产与Microsoft Purview 统一目录中的数据产品相关联,以进行策展和数据质量评估。
在 数据产品中,选择镜像数据库 (而不是从目录中) 的单个表。 它应作为 Power BI 数据集提供。
镜像数据库中的所有表都应作为 OneLake 增量表自动添加到数据产品中。
重要
- 使用服务主体进行数据映射扫描,使用托管标识进行数据质量扫描。
- 选择镜像数据库,而不是单个表。
- 每次更新语义模型。
- 如果镜像数据库表在 Fabric Lakehouse 中不可用,请联系 Fabric 支持人员。
- 仅 Lakehouse delta、iceberg 和 parquet 文件格式支持数据质量扫描。
- 在 OneLake SDK for Lakehouse 子主题中,需要依赖于 Fabric 团队来区分快捷项和本机项。 目前, (表和文件) 的所有快捷项都将被视为扫描中的本机项。