Microsoft Fabric 镜像数据库的数据质量
注意
Microsoft Purview 数据目录将其名称更改为 Microsoft Purview 统一目录。 所有功能将保持不变。 当新的 Microsoft Purview 数据治理体验在你的区域中正式发布时,你将看到名称更改。 检查你所在的区域的名称。
作为一种数据复制解决方案,Fabric 中的镜像是一种低成本、低延迟的解决方案,用于将各种系统中的数据汇集到单个分析平台中。 可以连续将现有数据资产直接复制到 Fabric 的 OneLake 中,包括来自 Azure SQL Database、Azure Cosmos DB 和 Snowflake 的数据。
Fabric 中的镜像允许用户享受旨在简化分析需求的端到端产品。 为Microsoft和技术解决方案之间的开放性和协作而构建,可以读取开源 delta Lake 表格式,镜像是一种低成本、低延迟的解决方案,可用于在 OneLake 中创建数据副本 (replica) ,该解决方案可用于满足所有分析需求。 有关 Fabric 镜像的更多详细信息 ,请查看 Fabric 文档。
配置 Fabric 镜像数据库的数据质量
在 Fabric 租户中启用镜像。 Power BI 管理员可以使用 Power BI 管理门户中的设置为整个组织或特定安全组启用或禁用镜像。 通过创建与操作数据源的安全连接来启用镜像。 选择是复制整个数据库还是单个表,镜像会自动使数据保持同步。设置后,数据将持续复制到 OneLake 中以供分析使用。
启用镜像并启动复制后,确认镜像复制成功完成。
在此页中,转到“报告”选项卡,然后选择“ 自动更新语义模型”。
转到“Microsoft Purview 数据映射”页并扫描数据源。 使用服务主体身份验证。
扫描完成后,将新的数据资产与数据产品相关联 ,以便进行管理和数据质量评估。
打开Microsoft Purview 数据质量解决方案,并像往常一样运行数据质量扫描或分析数据。
重要
- 使用服务主体进行数据映射扫描,使用托管标识进行数据质量扫描。
- 如果镜像数据库表在 Fabric Lakehouse 中不可用,请联系 Fabric 支持人员。
- 仅 Lakehouse 增量表和 parquet 文件支持数据质量扫描。
- Purview for Fabric Lakehouse 子修订中的元数据收获是基于 2023 年 12 月发布的 Fabric 元数据收获的增强功能。 此功能处于 个人预览 阶段。
- 在 OneLake SDK for Lakehouse 子结构中,需要依赖于 Fabric 团队来区分快捷项和本机项。 目前, (表和文件) 的所有快捷项都将被视为扫描中的本机项。 需要将租户列入允许列表,才能启用 fabric lakehouse 数据 DQ 评估。