数据映射中的数据分类
Microsoft Purview 数据映射 中的数据分类是通过向数据资产分配唯一的逻辑标记或类来对数据资产进行分类的一种方法。 分类基于数据的业务上下文。 例如,可以按 护照号码、 驾照编号、 信用卡号、 SWIFT 代码、 人员姓名等对资产进行分类。
对数据资产进行分类时,可以使其更易于理解、搜索和管理。 对数据资产进行分类还有助于了解与其相关的风险。 这反过来又有助于实施措施,防止敏感数据或重要数据不受管理扩散和跨数据资产的未经授权的访问。
扫描数据源时,数据映射提供自动分类功能。 你将获得超过 200 个内置系统分类,并能够为数据创建自定义分类。 可以在资产作为配置扫描的一部分引入资产时自动对其进行分类,也可以在扫描和引入资产后在 Microsoft Purview 治理门户中手动对其进行编辑。
分类的用法
分类是将数据组织为 逻辑类别 的过程,使数据易于检索、排序和识别以供将来使用。 这一点对于数据治理非常重要。 除其他原因外,对数据资产进行分类非常重要,因为它可以帮助你:
- 缩小对感兴趣的数据资产的搜索范围。
- 组织和了解组织中重要的各种数据类及其存储位置。
- 了解与最重要的数据资产相关的风险,然后采取适当措施缓解这些风险。
下图显示了扫描 Azure SQL 数据库中的 Customer 表时应用的分类。
分类类型
Microsoft Purview 治理门户支持系统和自定义分类。
系统分类:支持 200 多个系统分类。 请参阅 可用系统分类的完整列表。
在上图的示例中, 人员名称 是系统分类。 系统分类具有 Thunderbolt 图标以及分类名称。 将鼠标悬停在分类本身上可提供有关分类类型的更多详细信息,以及有关如何应用分类的更多详细信息
自定义分类:如果要根据无法作为系统分类的模式或特定列名称对资产进行分类,则可以创建自定义分类。 自定义分类规则可以基于 正则表达式 模式或 字典。
假设 员工 ID 列遵循 EMPLOYEE{GUID} 模式 (例如 EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55) 。 可以使用正则表达式(例如
\^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$
)创建自己的自定义分类。
注意
敏感度标签不同于分类。 敏感度标签在数据安全和隐私的上下文中对资产进行分类,例如 高度机密、 受限、 公共等。 若要在Microsoft Purview 数据映射中使用敏感度标签,需要在与Microsoft Purview 数据映射相同的Microsoft Entra租户中至少有一个 Microsoft 365 许可证或帐户。 有关敏感度标签与分类之间的差异的详细信息,请参阅 Microsoft Purview 治理门户常见问题解答中的敏感度标签。