在 Microsoft Purview 中连接到 Azure Cosmos DB for SQL API

本文概述了在 Microsoft Purview 中注册和扫描 Azure Cosmos DB for SQL API 实例的过程,包括对 Azure Cosmos DB 数据库源进行身份验证和交互的说明

支持的功能

元数据提取 完整扫描 增量扫描 作用域扫描 分类 标记 访问策略 世系沿袭 数据共享 实时视图
不**

** 如果在数据工厂中将数据集用作源/接收器,则支持沿袭复制活动

先决条件

注册

本部分将允许注册 Azure Cosmos DB for SQL API 实例并设置适当的身份验证机制,以确保成功扫描数据源。

注册步骤

在设置数据源扫描之前,请务必在 Microsoft Purview 中注册数据源。

  1. 通过以下方式打开 Microsoft Purview 治理门户:

  2. 导航到 数据映射 --> 集合

    导航到数据映射中的“源”链接的屏幕截图

  3. 使用“ 集合 ”菜单创建 “集合” 层次结构,并根据需要向各个子集合分配权限

    显示用于创建集合层次结构的集合菜单的屏幕截图

  4. 导航到“ ”菜单下的相应集合,然后选择“ 注册 ”图标以注册新的 Azure Cosmos DB 数据库

    显示用于注册数据源的集合的屏幕截图

  5. 选择 Azure Cosmos DB for SQL API 数据源,然后选择“继续

    允许选择数据源的屏幕截图

  6. 为数据源提供合适的名称,选择相关的 Azure 订阅Cosmos DB 帐户名称和集合,然后选择“应用

    显示为了注册数据源而输入的详细信息的屏幕截图

  7. Azure Cosmos DB 数据库存储帐户将显示在所选集合下

    显示映射到集合以启动扫描的数据源的屏幕截图

扫描

扫描身份验证

若要有权扫描数据源,需要在 Azure Cosmos DB 数据库存储帐户中配置身份验证方法。

只有一种方法可以设置 Azure Cosmos DB 数据库的身份验证:

帐户密钥 - 可在 Azure 密钥保管库中创建机密以存储凭据,以便允许 Microsoft Purview 访问,以使用机密安全地扫描数据源。 机密可以是存储帐户密钥、SQL 登录密码或密码。

注意

需要在订阅中部署 Azure 密钥保管库 资源,并分配 Microsoft Purview 帐户的 MSI,该 MSI 具有对 Azure 密钥保管库内机密的所需访问权限。

使用帐户密钥进行扫描

需要获取访问密钥并将其存储在密钥保管库中:

  1. 导航到 Azure Cosmos DB 数据库存储帐户

  2. 选择“设置键”>

    显示存储帐户中的访问密钥的屏幕截图

  3. 复制 密钥 并单独保存,以便执行后续步骤

    显示要复制的访问密钥的屏幕截图

  4. 导航到密钥保管库

    显示密钥保管库的屏幕截图

  5. 选择“设置>机密”,然后选择“+ 生成/导入

    显示用于生成机密的密钥保管库选项的屏幕截图

  6. 输入 “名称”“值 ”作为存储帐户中的 密钥 ,然后选择“ 创建 ”以完成

    显示用于输入机密值的密钥保管库选项的屏幕截图

  7. 如果密钥保管库尚未连接到 Microsoft Purview,则需要 创建新的密钥保管库连接

  8. 最后,使用 密钥 创建新凭据 来设置扫描。

创建扫描

  1. 打开 Microsoft Purview 帐户 ,然后选择 “打开Microsoft Purview 治理门户

  2. 导航到 数据映射 --> 以查看集合层次结构

  3. 选择之前注册的 Azure Cosmos 数据库下的“新建扫描”图标

    显示创建新扫描的屏幕的屏幕截图

  4. 提供扫描 的名称

  5. 如果源可公开访问,请选择 Azure 集成运行时;使用 托管虚拟网络时选择托管虚拟网络集成运行时 ;如果源位于专用虚拟网络中,则选择自承载集成运行时。 有关要使用的集成运行时的详细信息,请参阅 选择正确的集成运行时配置一文。

  6. 为扫描选择适当的集合,然后在“凭据”下选择“+ 新建

    显示用于扫描的“帐户密钥”选项的屏幕截图

  7. 选择相应的密钥保管库连接和创建帐户密钥时使用的机密名称。 选择“身份验证方法”作为“帐户密钥”

    显示帐户密钥选项的屏幕截图

  8. 选择“ 测试连接”。 成功连接后,选择“继续

    显示测试连接成功的屏幕截图

确定扫描范围并运行扫描

  1. 可以通过在列表中选择相应的项目,将扫描范围限定为特定的文件夹和子文件夹。

    确定扫描范围

  2. 然后选择扫描规则集。 可以在系统默认规则集和现有自定义规则集之间进行选择,也可以内联创建新的规则集。

    扫描规则集

    新建扫描规则

  3. 可以选择要包含在扫描 规则中的分类 规则

    扫描规则集分类规则

    扫描规则集选择

  4. 选择扫描触发器。 可以设置计划或运行扫描一次。

    扫描触发器

  5. 查看扫描并选择“ 保存并运行”。

    审阅扫描

查看扫描

  1. 导航到集合中的数据源,然后选择“查看详细信息”以检查扫描状态

    查看扫描

  2. 扫描详细信息指示上次运行状态中的扫描进度,以及扫描分类的资产数

    查看扫描详细信息

  3. “上次运行”状态将更新为“正在进行”,并在整个扫描成功运行后更新为“已完成”

    查看正在进行扫描

    查看扫描已完成

管理扫描

可以管理扫描,也可以在完成后再次运行。

  1. 选择 “扫描名称 ”以管理扫描

    管理扫描

  2. 可以再次 运行扫描编辑扫描删除扫描

    管理扫描选项

  3. 可以再次运行完全扫描

    完全扫描

后续步骤

注册源后,请按照以下指南详细了解Microsoft Purview 和数据。