Microsoft Fabric 镜像数据库的数据质量

注意

Microsoft Purview 数据目录将其名称更改为 Microsoft Purview 统一目录。 所有功能将保持不变。 当新的 Microsoft Purview 数据治理体验在你的区域中正式发布时,你将看到名称更改。 检查你所在的区域的名称

作为一种数据复制解决方案,Fabric 中的镜像是一种低成本、低延迟的解决方案,用于将各种系统中的数据汇集到单个分析平台中。 可以连续将现有数据资产直接复制到 Fabric 的 OneLake 中,包括来自 Azure SQL Database、Azure Cosmos DB 和 Snowflake 的数据。

Fabric 中的镜像允许用户享受旨在简化分析需求的端到端产品。 为Microsoft和技术解决方案之间的开放性和协作而构建,可以读取开源 delta Lake 表格式,镜像是一种低成本、低延迟的解决方案,可用于在 OneLake 中创建数据副本 (replica) ,该解决方案可用于满足所有分析需求。 有关 Fabric 镜像的更多详细信息 ,请查看 Fabric 文档

配置 Fabric 镜像数据库的数据质量

  1. 在 Fabric 租户中启用镜像。 Power BI 管理员可以使用 Power BI 管理门户中的设置为整个组织或特定安全组启用或禁用镜像。 通过创建与操作数据源的安全连接来启用镜像。 选择是复制整个数据库还是单个表,镜像会自动使数据保持同步。设置后,数据将持续复制到 OneLake 中以供分析使用。

  2. 启用镜像并启动复制后,确认镜像复制成功完成。

  3. 打开 SQL 分析终结点

    用于导航 sql 终结点的屏幕截图。

  4. 在此页中,转到“报告”选项卡,然后选择“ 自动更新语义模型”。

    自动更新语义模型。

  5. 转到“Microsoft Purview 数据映射”页并扫描数据源。 使用服务主体身份验证。

    使用服务主体进行数据映射扫描。

  6. 扫描完成后,将新的数据资产与数据产品相关联 ,以便进行管理和数据质量评估。

  7. 打开Microsoft Purview 数据质量解决方案,并像往常一样运行数据质量扫描分析数据

重要

  • 使用服务主体进行数据映射扫描,使用托管标识进行数据质量扫描。
  • 如果镜像数据库表在 Fabric Lakehouse 中不可用,请联系 Fabric 支持人员。
  • 仅 Lakehouse 增量表和 parquet 文件支持数据质量扫描。
  • Purview for Fabric Lakehouse 子修订中的元数据收获是基于 2023 年 12 月发布的 Fabric 元数据收获的增强功能。 此功能处于 个人预览 阶段。
  • 在 OneLake SDK for Lakehouse 子结构中,需要依赖于 Fabric 团队来区分快捷项和本机项。 目前, (表和文件) 的所有快捷项都将被视为扫描中的本机项。 需要将租户列入允许列表,才能启用 fabric lakehouse 数据 DQ 评估。