Microsoft Purview 中的数据产品

数据产品是一组数据资产, (表、文件、PBI 报表等 ) ,这是一种打包产品/服务,它为企业提供了一个用例,供数据使用者共享。

在 Microsoft Purview 中,数据治理不仅是一种确保数据安全且合规的方法,也是加速数据业务价值的工具。 对资产中的数据进行编目可以更好地管理数据以便正确使用,但也提供了数据环境的完整图景。 现在,每个可用数据资产都有一个列表,用户不再需要依赖网络或团队知识来查找所需的内容:他们可以自行搜索目录。 但是,为每个用户提供所有可用数据的原始列表是压倒一切的,在本质上并无用处。 即使有很好的说明、标记和术语表术语,也很难知道你要查找的内容。 为了获得完整的数据可视化效果,可能需要多个数据资产,而不仅仅是一个数据资产。 随着数据目录的增长,上下文需要随之增长,以便用户能够更轻松地查找和请求对所需数据的访问权限。

为了提供可缩放的数据上下文和访问管理,Microsoft Purview 引入了数据产品。

什么是数据产品?

数据产品是一种业务概念,其中包含名称、说明、所有者,最重要的是包含关联数据资产的列表。 数据产品为这些资产提供上下文,并将其分组到数据使用者的用例下。 治理域可以容纳许多数据产品,但数据产品由单个 治理域 管理,并且可以跨多个域发现。

成功的数据产品使数据使用者能够使用其日常语言轻松识别有价值的数据,同时简化了这些数据资产的所有权责任。 让我们来了解一下它的外观。

可缩放的数据上下文

例如,数据科学家创建一组数据资产供其数据模型使用,并希望其他人能够使用相同的数据集。

如果没有数据产品,数据科学家可以使用数据目录向所有相关数据资产添加术语表术语。 用户可能不知道要搜索哪个术语表术语,因此最好向每个数据资产添加说明,使其在搜索类似信息时更具相关性。 但是,这两个添加并不保证其他用户将看到所有相关的数据资产。 他们可能会分组到其他不相关的资产中,或者错过一个关键数据片段,并花时间重复原始数据科学家已经进行的研究。

借助数据产品,数据科学家可以创建一个数据产品,其中列出了用于创建其数据模型的所有资产。 说明提供了完整的用例,以及有关如何使用数据的示例或建议。 数据科学家现在是数据产品所有者,他们通过帮助他们获取此数据产品中所需的一切,改善了数据使用者的搜索体验。

可缩放的数据治理

数据产品也简化了数据资产的治理。 使用创建一组数据资产的数据科学家的同一示例:

如果没有数据产品,如果用户想要访问数据集的数据资产,则必须单独请求访问每个数据资产。 数据所有者可能知道这些资产正用于机器学习模型,但如果对其安全性和用例的策略进行了任何更改,数据所有者必须单独访问每个资产才能进行这些更新。

使用数据产品,用户可以找到数据产品,他们可以请求访问数据产品,这将在批准) 所有相关数据资产后为其提供访问 (。 如果围绕机器学习数据集实施更多审批或数据使用策略,则数据所有者只需将新策略应用于数据产品,它们将自动流向资产。

数据产品还与业务运行状况控制和 OKR 相关联。 这些控制使数据所有者能够评估数据运行状况,确定需要关注的资产的优先级,并评估哪些数据资产提供业务价值。 这不仅支持在资产中实现完整的数据治理,而且还鼓励从数据中开发业务价值。 资产不再抽象,而是与团队可以关注的实际用例和业务目标相关联。

数据访问策略

数据安全性和访问是成功进行数据治理的核心租户。 但是,若要实现数据治理并成功推动数据使用 (因此价值) ,数据访问过程需要安全、方便且可自定义,以便针对数据资产中的所有方案进行自定义。 某些数据应可广泛使用且可访问,有些数据需要经过严格的审批和监视,以确保正确使用。

每个数据产品都有一个访问策略,用于确定用户如何请求访问权限、数据的使用条款以及谁应批准对数据的访问权限。 这些访问策略中的每一个都可以自定义以供适当使用,并且将来将发展为涵盖更多用例。 所有用户都需要在数据产品中选择 “请求访问” ,他们将自动完成同意使用条款并得到正确方批准的过程。

有关数据产品访问权限的详细信息,请参阅 有关在 Microsoft Purview 中管理数据目录访问策略的文章。

后续步骤