自助服务分析和见解 (预览版)
注意
Microsoft Purview 数据目录将其名称更改为 Microsoft Purview 统一目录。 所有功能将保持不变。 当新的 Microsoft Purview 数据治理体验在你的区域中正式发布时,你将看到名称更改。 检查你所在的区域的名称。
自助服务分析和见解是指数据、工具和平台,使业务用户可以独立访问、分析和生成见解。 Purview 数据治理应用程序将元数据和元数据模型的域和维度模型发布到 OneLake 中,允许客户通过引入自己的工具和计算来分析和生成见解。 数据管理元数据的自助分析对于推动客户数据资产运行状况管理的持续改进以及通过实现数据资产见解和运行状况管理的民主化,在整个组织中促进数据驱动文化非常有用。
关键组件
- 数据模型: 包含域和维度详细信息的 3NF 模型
-
元数据: 数据治理元数据,包括:
- 治理域
- 数据产品
- 数据资产
- 术语表术语
- 订阅请求
- 数据质量规则
- 尺寸
- 数据质量分数等即将推出。
优点
- 授权: 使数据从业者、数据产品所有者、数据专员和分析师能够浏览数据治理元数据,并链接来自各种源的元数据来获取见解。
- 灵活性和效率: 除了在运行状况管理中现成的报告外,客户还可以创建自定义报告。
- 敏捷: 允许客户组织更快速地响应运行状况管理问题和修正。
- 经济高效: 减少了设置平台和生成工具的需求。 OneLake 中提供了所有数据,客户可以使用 OneLake 中的可用工具 (Fabric 语义模型、PBI 报告、数据流和笔记本) 。
当前可用的报表 (现)
下面是可用的现装报表。 这些报表不可自定义。
- 经典资产 - 按类型和集合及其策展状态概述资产。
- 经典目录采用 - 一目了然地了解数据目录的使用方式。 术语表,提供术语及其状态快照。
- 经典分类 - 分类的资产和分类类型的概述。
- 经典数据管理 - 分类资产和分类类型的概述。
- 经典术语表 - 术语表术语的运行状况和使用。
- 经典敏感度标签 - 已应用敏感度标签的资产和应用的标签类型的概述。
- 数据治理 - 数据治理运行状况报告允许团队一目了然地跟踪运行状况进度,并确定需要更多工作的领域。
- 数据质量运行状况 - 数据质量维度和数据质量规则性能报告。
订阅 Microsoft Purview 目录元数据
可以订阅 Microsoft Purview 的数据治理元数据进行分析和派生见解。 若要订阅,请按照下面列出的步骤操作:
从左窗格中选择 “设置” ,选择“ 数据目录”,然后选择“解决方案集成”。
选择“编辑”。
添加 存储类型。
添加 位置 URL
在 URL 末尾添加文件夹名称 - 示例:/DEH (请参阅屏幕截图)
向参与者访问构造工作区的 Microsoft Purview 管理服务标识 (MSI) 。
测试连接。
自助分析元数据的数据模型
3NF 域模型是关系数据库设计中的规范化过程的一部分,可确保数据库没有冗余和更新异常。 如果数据库架构满足第一个和第二正常Forms的要求,并且其所有属性在功能上仅依赖于主键,则数据库架构将采用第三常规形式。 3NF 域模型的用途用于以最大程度地减少重复并确保数据完整性的方式构造数据。 它侧重于将数据分解为较小的相关表,其中每个信息片段仅存储一次。
特性:
- 消除可传递依赖项:非键属性不应依赖于其他非键属性。
- 逻辑分组:数据根据其功能或含义在逻辑上分组到域中。
- Entity-Relationship (ERD) 的关系图:通常用于表示 3NF 域模型,显示实体彼此之间的关系。
表格名称 | 说明 | 关系键 |
---|---|---|
访问策略预配状态 | 有关预配状态的信息存储在此表中。 | ProvisioningStateId |
访问策略资源类型 | 访问 porlich 资源信息存储在此表中。 | ResourceTypeId |
访问策略集 | 此表中存储了有关访问策略、策略用例详细信息以及策略应用位置等的总体信息。 | AccessPolicySetId、ResourceTypeId、ProvisioningStateId |
分类 | 数据资产分类信息存储在此表中。 | ClassificationId |
自定义访问用例 | 访问用例信息存储在此表中。 | AccessPolicySetId |
数据资产 | 数据资产名称、说明和源信息存储在此表中。 | DataAssetId、AccountId、DataAssetTypeId |
数据资产列 | 数据资产列名、列说明和引用存储在此表中。 | DataAssetId、ColumnId、DataAssetTypeId、DataTypeId、AccountId |
数据资产列分类分配 | 此表中存储了与数据分类分配相关的引用键。 | DataAssetId、ColumnId、ClassificationId |
数据资产域分配 | 此表中提供了与数据资产治理域分配相关的信息。 | DataAssetId、BusinessDomainId |
数据资产所有者 | 此表中存储的数据资产所有者信息。 | DataAssetOwnerId |
数据资产所有者分配 | 数据资产所有者分配信息存储在此表中。 | DataAssetId、DataAssetOwnerId |
数据资产类型数据类型 | 数据资产类型信息存储在此表中。 | DataTypeId、DataAssetTypeId |
数据产品 | 此表中存储的数据产品名称、说明、用例、状态和其他相关信息。 | DataProductId、DataProductTypeId、AccountId |
数据产品资产分配 | 数据产品和数据资产分配信息存储在此表中。 | DataProductId、DataAssetId |
数据产品治理域分配 | 此表中存储了数据产品和治理域分配信息。 | DataProductId、BusinessDomainId |
数据产品文档 | 数据产品文档参考信息存储在此表中。 | DataProductId、DocumentationId |
数据产品所有者 | 数据产品所有者信息存储在此表中。 | DataProductId、DataProductOwnerId |
数据产品状态 | 数据产品状态 (,例如此表中存储的已发布或草稿) 相关信息。 | DataProductStatusId |
数据产品使用条款 | 此表中存储了数据产品使用条款信息。 | DataProductId、TermOfUsedId、DataAssetId |
数据产品类型 | 此表中存储了有关数据产品类型(主控、参考、操作等)的信息。 | DataProductTypeId |
数据产品更新频率 | 此表中存储了有关此数据产品数据更新频率的信息。 | UpdateFrequencyId |
数据质量资产规则执行 | 此表中存储的数据质量扫描结果 | RuleId、DataAssetId、JobExecutionId |
数据质量作业执行 | 此表中存储了数据质量作业执行状态。 | JobExecutionId |
数据质量规则 | 有关数据质量规则的信息存储在此表中。 | RuleId、RuleTypeId、BusinessDomainId、DataProductId、DataAssetId |
数据质量规则列执行 | 此表中存储了有关数据质量规则通过和失败计数、列级别的数据质量分数以及包括数据质量作业执行详细信息的信息。 | RuleId、DataAssetId、ColumnId |
数据质量规则类型 | 此表中存储了数据质量规则类型和关联的维度。 | RuleTypeId |
数据订阅请求 | 有关此表中存储的数据订阅服务器、策略、订阅请求状态和其他相关信息的信息。 | SubscriberRequestId |
术语表术语 | 有关术语表术语、说明和术语表术语总体状态的信息存储在此表中。 | GlossaryTermId、ParentGlossaryTermId、AccountId |
术语表术语治理域分配 | 有关术语表治理域分配和状态的信息存储在此表中。 | GlossaryTermId、BusinessDomainId |
术语表术语数据产品分配 | 有关术语表数据产品分配的信息存储在此表中。 | GlossaryTermId、DataProductId |
策略集审批者 | 策略集和审批者信息存储在此表中。 | SubscriberRequestId、AccessPolicySetId |
关系 | 有关源类型和目标信息的信息存储在此表中。 | AccountId、SourceId、TargetId |
创建语义模型
数据和分析上下文中的语义模型是指定义特定域中的含义、关系和规则的结构化数据表示形式。 它提供了一个抽象层,通过使复杂数据更加直观和可访问,帮助用户理解复杂数据并与之交互,尤其是在商业智能 (BI) 和分析平台的上下文中。 在生成任何报表之前,始终需要语义模型。 在仓库中,用户可以将仓库对象 (表或视图)添加到其默认 Power BI 语义模型。 它们还可以添加其他语义建模属性,例如层次结构和说明。 然后,这些属性用于创建 Power BI 语义模型的表。 用户还可以从默认 Power BI 语义模型中删除对象。
若要从 Microsoft Purview 数据治理元数据域和维度模型中重新创建语义模型,请执行以下操作:
在 Fabric 工作区中打开仓库。
将域和维度模型文件发布到增量表
- 选择省略号按钮 (...)
- 选择“加载到表 > ”“新建表”
- 新表名已预填充
- 选择“文件类型 parquet”
还可以使用 快捷方式 从 OneLake 和 OneLake 中对域和维度模型进行快捷方式
- 选择省略号按钮 (...) 表
- 选择“ 新建快捷方式 ”,然后从“新建快捷方式源”页中选择“ Microsoft OneLake ”。
- 选择要快捷方式的域和维度模型表
手动或通过快捷方式将所有文件发布到增量表后,可以将增量表添加到语义模型。
- 从 Lakehouse 页切换到 SQL 分析终结点页。
- 从“SQL 分析终结点”页左上角选择“报告”。
- 选择 “管理默认语义模型”。
- 从 dbo > Tables 选择要添加到语义模型的表,以便进行报告。
若要将对象(如表或视图)添加到默认 Power BI 语义模型,请选择“ 自动更新语义模型”。
创建 Power BI 报表
Power BI 原生集成到整个 Fabric 体验中。 此本机集成包括一种称为 DirectLake 的唯一模式,用于访问来自 lakehouse 的数据,以提供最高性能的查询和报告体验。 DirectLake 是一项开创性的新功能,可用于在 Power BI 中分析非常大的语义模型。 使用 DirectLake,可以直接从数据湖加载 parquet 格式的文件,而无需查询数据仓库或 lakehouse 终结点,也无需将数据导入或复制到 Power BI 语义模型中。 DirectLake 是将数据从数据湖直接加载到 Power BI 引擎的快速路径,可供分析。
在传统的 DirectQuery 模式下,Power BI 引擎直接从源中查询每个查询执行的数据,查询性能取决于数据检索速度。 DirectQuery 无需复制数据,确保源中的任何更改都会立即反映在查询结果中。
有关更多详细信息 ,请遵循以下指南:如何在 Microsoft Fabric 中创建 Power BI 报表。
重要
- 默认刷新周期为每 24 小时一次。
- Purview MSI 需要参与者对 Fabric 工作区的访问权限。
- Fabric OneLake 支持以公共预览版提供。 可以从任何受支持的 Azure 区域 订阅 purview 元数据,以发布到 Fabric 工作区进行自助分析。
- ADLSg2 支持以 个人预览版提供。 若要订阅 ADLSg2 存储的 Purview 元数据,请联系Microsoft帐户团队或客户支持团队以允许列出租户。 需要提供以下信息才能列入允许列表: 租户 ID、组织名称、Purview 帐户名称、Purview 帐户 ID、Azure 区域和 Azure 订阅 ID。
即将推出
- ADLSg2 支持目前为个人预览版,公共预览版计划于 2024 年 11 月 30 日提供。
- 尚不支持计划数据刷新作业。 此功能的暂定 ETA 为 11 月 30 日。