Microsoft Purview 术语表
本文内容
本术语表简要介绍了Microsoft Purview 解决方案和体验的重要术语和概念。
A
Term
描述
高级资源集
在 Microsoft Purview 实例级别激活的一组功能,启用后,通过计算元数据上的额外聚合来丰富资源集资产,以提供分区计数、总大小和架构计数等信息。 还包括资源集模式规则。
Annotation
与Microsoft Purview 数据映射中的数据资产关联的信息,例如术语表术语和分类。 应用注释后,可以在搜索中使用注释来帮助发现数据资产。
已批准
被有权更改请求状态的指定个人或团体接受为满意的任何请求的国家。
资产
存储在Microsoft Purview 统一目录中的任何单个对象。 注意:目录中的单个对象可能表示存储中的许多对象,例如,资源集是资产,但它由存储中的多个分区文件组成。
Azure 信息保护
一种云解决方案,支持对文档和电子邮件进行标记,以便对信息进行分类和保护。 标记的项可以通过加密进行保护、使用水印标记,或者仅限于特定操作或用户,并且绑定到该项目。 此基于云的解决方案依赖于 Azure Rights Management Service (RMS) 来实施限制。
B
Term
描述
商业术语表
组织用于描述关键业务词及其定义的专用术语的可搜索列表。 使用业务术语表可以在整个组织内提供一致的数据使用。
C
Term
描述
容量单位
数据映射使用情况的度量值。 默认情况下,所有Microsoft Purview 数据映射都包含一个容量单位,该容量单位提供高达 10 GB 的元数据存储,吞吐量为每秒 25 个数据映射操作。
分类报告
显示有关扫描数据的关键分类详细信息的报告。
分类规则
一组条件,用于确定当内容与指定模式匹配时,应如何对扫描数据进行分类。
已分类资产
Microsoft Purview 在自动扫描期间提取架构并应用分类的资产。 扫描规则集确定对哪些资产进行分类。 如果资产被视为分类候选项,并且扫描期间未应用任何分类,则资产仍被视为分类资产。
分类器
用于识别、分类、分类和标记数据的技术。 Microsoft Purview 提供了多个分类器,包括敏感信息类型、可训练分类器和精确数据匹配 (EDM) 分类器。
集合
组织定义的资产、术语、注释和源分组。 通过集合,可以更轻松地对统一目录中的资产进行精细访问控制和可发现性。
集合管理员
可在 Purview 治理门户中分配Microsoft角色的角色。 集合管理员可以将用户添加到其管理员所在的集合上的角色。 他们还可以编辑集合及其详细信息,并添加子集合。
列模式
分类规则中包含的正则表达式,表示要匹配的列名。
联系人
与 统一目录 中的实体关联的个人。
控制平面操作
管理订阅中的资源的操作,例如发送到 Azure 资源管理器终结点的基于角色的访问控制和 Azure 策略。 控制平面操作还可以应用于 Azure 外部的资源,跨本地、多云和 SaaS 源。
Credential
验证访问控制系统中使用的标识或工具。 凭据可用于对个人或组进行身份验证,以授予对数据资产的访问权限。
D
Term
描述
数据策展人
一个角色,提供对统一目录的访问权限,以管理资产、配置自定义分类、设置术语表术语和查看见解。 数据策展人可以创建、读取、修改、移动和删除资产。 它们还可以将注释应用于资产。
数据字典
数据库列及其相应数据类型的规范名称列表。 通常用于描述数据库的格式和结构及其元素之间的关系。
数据资产见解
Microsoft Purview 治理门户的一个区域,提供有关数据资产的最新报告和可操作见解。
数据映射
一个元数据存储库,它是 Microsoft Purview 治理门户的基础。 数据映射是一个图形,用于描述数据资产中的资产,并通过扫描和其他数据引入过程进行填充。 此图通过提供资产的丰富描述、表示数据世系、分类资产、存储资产之间的关系以及技术和语义层的信息,帮助组织了解和管理其数据。 数据映射是一个开放平台,可与 Apache Atlas API 或 Microsoft Purview 治理门户进行交互和访问。
数据映射操作
对数据映射中的实体执行的创建、读取、更新或删除操作。 例如,在数据映射中创建资产被视为数据映射操作。
数据所有者
负责管理数据资产的个人或组。
数据模式
表示存储在数据字段中的数据的正则表达式。 例如,员工 ID 的数据模式可以是 Employee{GUID}。
数据平面操作
特定 Microsoft Purview 实例中的操作,例如编辑资产或创建术语表术语。 每个实例都有预定义的角色,例如“数据读取者”和“数据策展人”,用于控制用户可以执行哪些数据平面操作。
数据读取器
提供对数据资产、分类、分类规则、集合、术语表术语和见解的只读访问权限的角色。
Data Share 参与者
一个角色,该角色可以在组织内部以及使用 Microsoft Purview 中的数据共享功能与其他组织共享数据。 数据共享参与者可以查看、创建、更新和删除已发送和接收的共享。
数据共享
Microsoft Purview 数据共享是 Microsoft Purview 中的一组功能,可用于跨组织安全地共享数据。
数据源管理员
可以管理数据源和扫描的角色。 具有数据源管理员角色的用户无权访问 Microsoft Purview 治理门户。 将此角色与任何集合范围内的数据读取者或数据策展人角色相结合可提供Microsoft Purview 治理门户访问权限。
数据专员
负责维护相关对象的命名法、数据质量标准、安全控制、合规性要求和规则的个人或组。
发现的资产
扫描过程中Microsoft Purview 数据映射在数据源中标识的资产。 发现的资产数包括资源组分组之前的所有文件或表。
非重复匹配阈值
扫描程序对其运行数据模式之前,需要在列中找到的非重复数据值的总数。 例如,如果员工 ID 的不同匹配阈值为 8,则要求在与员工 ID 的数据模式集匹配的列中的采样值中至少有 8 个唯一数据值。
E
Term
描述
专家
组织中了解数据资产或术语表术语的完整上下文的个人。
F
Term
描述
完全扫描
处理数据源所选范围内所有资产的扫描。
完全限定的名称 (FQN)
定义资产在其数据源中的位置的路径。
G
Term
描述
术语表术语
业务术语表中的一个条目,用于定义特定于组织的概念。 术语表术语可以包含有关同义词、首字母缩略词和相关术语的信息。
I
Term
描述
增量扫描
一种扫描,用于检测和处理自上一次成功扫描以来已创建、修改或删除的资产。 若要运行增量扫描,必须在源上至少完成一次完整扫描。
引入的资产
已扫描、分类 ((如果适用) )并添加到Microsoft Purview 数据映射的资产。 通过自动扫描或外部连接(例如Azure 数据工厂和Azure Synapse)可在统一目录内发现和消耗引入的资产。
见解读取器
提供对 Data Estate Insights 报表的只读访问权限的角色。 见解读取者必须至少具有对集合的数据读取者角色访问权限,才能查看有关该特定集合的报告。
集成运行时
用于在数据源中扫描的计算基础结构。
项目
存储在Microsoft Purview 数据映射中的任何单个对象。
L
Term
描述
世系沿袭
数据从源移动到目标时如何转换和流动。 了解跨数据资产的此流可帮助组织查看其数据的历史记录,并有助于进行故障排除或影响分析。
M
Term
描述
管理
Microsoft Purview 治理门户中的一个区域,可在其中管理连接、用户、角色和凭据。 也称为“管理中心”。
Microsoft Fabric
Microsoft的统一分析解决方案,它通过普遍的数据治理为企业级数据基础上的所有分析工作负载和用户提供集成和简化的体验。
Microsoft Purview 实例
单个Microsoft Purview (以前是 Azure Purview) 帐户。
最小匹配阈值
扫描程序必须找到的列中不同数据值之间的最小匹配百分比,以便应用分类。 例如,员工 ID 的最小匹配阈值为 60%,要求列中采样数据中所有非重复值中的 60% 与员工 ID 的数据模式集匹配。 如果扫描程序对列中的 128 个值进行采样,并在该列中发现 60 个非重复值,则至少有 36 个非重复值 (60%) 必须与要应用的分类的员工 ID 数据模式匹配。
O
Term
描述
对象类型
基于常见数据结构的资产分类。 例如,Azure SQL服务器表和 Oracle 数据库表的对象类型均为表。
本地数据
数据位于由客户控制的数据中心(例如,不在云或软件即服务中), (SaaS) 。
Owner
负责管理数据资产的个人或组。
P
Term
描述
模式规则
一种配置,它覆盖Microsoft Purview 数据映射如何将资产分组为资源集并在目录中显示它们。
物理资产
表示物理数据对象的资产。 物理资产与业务资产不同,因为它们表示真实数据。 例如,数据库是物理资产。
策略
控制应如何授权对数据和数据源的访问的语句或语句集合。
R
Term
描述
已注册的源
已添加到 Microsoft Purview 实例的源,现在作为统一目录的一部分进行管理。
相关术语
链接到组织内其他术语的术语表术语。
资源集
表示存储中许多已分区文件或对象的单个资产。 例如,Microsoft Purview 数据映射将分区的 Apache Spark 输出存储为单个资源集,而不是每个文件的唯一资产。
角色
分配给 Microsoft Purview 实例中的用户的权限。 Microsoft Purview 数据策展人或 Microsoft Purview 数据读取者等角色确定可在产品中执行的操作。
根集合
系统生成的集合,其友好名称与 Microsoft Purview 帐户相同。 默认情况下,所有资产都属于根集合。
S
Term
描述
扫描
一个Microsoft Purview 数据映射过程,用于发现和检查源或源集中的元数据以填充数据映射。 扫描会自动连接到源、提取元数据、捕获世系并应用分类。 扫描可以手动运行,也可以按计划运行。
扫描规则集
一组规则,用于定义扫描引入目录的数据类型和分类。
扫描触发器
一个计划,用于确定扫描运行时的重复周期。
架构分类
应用于资产架构中的列之一的分类。
搜索
允许用户通过在一组关键字中输入来查找统一目录中的项的功能。
搜索相关性
确定搜索结果返回顺序的数据资产的评分。 多个因素决定了资产的相关性分数。
自托管集成运行时
集成运行时安装在本地计算机或专用网络内的虚拟机上,用于连接到本地或专用网络中的数据。
敏感信息类型 (SIT)
一种基于模式的分类器,可帮助检测项中的敏感信息,例如信用卡数字。
敏感度标签
Microsoft Purview 门户中管理的标签,用于定义项目的机密程度。 可将敏感度标签配置为应用关联的保护设置,帮助用户保持符合组织信息保护策略的要求。
敏感度标签报表
描述跨数据资产应用哪些敏感度标签的摘要。
服务
提供独立功能并按订阅或许可证提供给客户的产品。
共享
作为单个实体共享的一组资产。
Source
存储数据的系统。 源可以托管在各种位置,例如云或本地。 注册并扫描源,以便在 Microsoft Purview 治理门户中管理它们。
源类型
Microsoft Purview 中使用的已注册源的分类;例如,Microsoft 365、Azure SQL Database、Azure Blob 存储、Amazon S3、Google Cloud 或 SAP ECC。
管家
定义术语表术语标准的个人。 他们负责维护所分配实体的质量标准、命名法和规则。
T
Term
描述
术语模板
术语表术语中包含的属性的定义。 用户可以使用系统定义的术语模板,也可以创建自己的术语模板来包含自定义属性。
可训练分类器
一种分类器,可帮助识别和分类手动或自动模式匹配方法不容易识别的内容。 与敏感信息类型不同,这种分类方法根据项目 ((例如简历) )来标识项目,而不只是由项目中包含的元素 (模式匹配) 。 可训练的分类器可以包含在多个Microsoft Purview 解决方案中,以检测、保护和治理敏感数据。
U
Term
描述
统一目录
资产及其关联元数据的可搜索清单,允许用户跨数据资产查找和策展数据。 统一目录还包括一个业务术语表,主题专家可以在其中提供术语和定义,以将业务上下文添加到项目。
W
Term
描述
工作流
协调目录实体的创建和修改(包括验证和审批)的自动化过程。 工作流定义可重复的业务流程,以实现组织中的高质量数据、策略合规性和用户协作。