在 Microsoft Purview 中连接到 Amazon Redshift

重要

此功能目前处于预览阶段。 Microsoft Azure 预览版的补充使用条款包括适用于 Beta 版、预览版或其他尚未正式发布的 Azure 功能的其他法律条款。

本文档介绍在 Microsoft Purview 中扫描 Amazon Redshift 的预览版。

支持的功能

元数据提取 完整扫描 增量扫描 作用域扫描 分类 标记 访问策略 世系沿袭 数据共享 实时视图

扫描 Amazon Redshift 时,Microsoft Purview 支持提取技术元数据,包括:

  • 服务器
  • Databases
  • Schemas
  • 包含列、外键和唯一约束的表
  • 包含列的视图
  • 包括参数数据集的存储过程
  • 包含参数数据集的函数

设置扫描时,可以选择扫描整个 Amazon Redshift 数据库,或将扫描范围限定为与给定名称 () 或名称模式 () 匹配的架构子集。

已知限制

  • 从数据源中删除对象时,当前后续扫描不会自动删除 Microsoft Purview 中的相应资产。

先决条件

注册

本部分将允许注册 Amazon Redshift 数据源,以便在 Purview 中进行扫描和数据共享。

注册的先决条件

  • 你需要是数据源管理员,并且是其他 Purview 角色之一, (例如,数据读取者或Data Share参与者) 才能在 Microsoft Purview 治理门户中注册和管理源。 有关详细信息 ,请参阅我们的 Microsoft Purview 权限页

注册步骤

在设置数据源扫描之前,请务必在 Microsoft Purview 中注册数据源。

  1. 通过以下方式转到 Microsoft Purview 治理门户:

  2. 导航到 数据映射 --> 源

    显示用于打开 Purview 治理门户Microsoft链接的屏幕截图

    导航到数据映射中的“源”链接的屏幕截图

  3. 导航到“ ”菜单下的相应集合,然后选择“ 注册 ”图标以注册新的 Amazon Redshift 数据源。

  4. 选择 Amazon Redshift 数据源,然后选择“ 继续”。

  5. 为数据源提供合适的 名称 ,并提供以下详细信息:

    1. 终结点 - Amazon Redshift 群集的终结点。 例如:examplecluster.abc123xyz789.us-west-2.redshift.amazonaws.com
    2. 端口 - 启动群集时指定的端口号。 默认值为 5439。

    显示 Amazon Redshift 的注册菜单的屏幕截图。

  6. Amazon Redshift 群集显示在所选集合下

扫描

提示

若要排查扫描的任何问题,请:

  1. 确认已正确设置 用于扫描的身份验证
  2. 查看 扫描故障排除文档

扫描身份验证

Microsoft Purview 支持基本身份验证 (用户名和密码) 扫描 Amazon Redshift。

用户应为每个单独的系统表授予 SELECT 权限,以便Microsoft Purview 从以下项查询元数据:

  • svv_external_tables
  • svv_external_columns
  • svv_table_info
  • information_schema.routines
  • information_schema.parameters
  • pg_views
  • pg_database
  • pg_description

用户应为 Microsoft Purview 的系统函数授予 EXECUTE 权限,以便从以下项查询元数据:

  • pg_get_late_binding_view_cols

创建凭据

Microsoft Purview 使用 Azure 密钥保管库 安全地存储用于向源进行身份验证的凭据。

创建扫描

  1. 打开 Microsoft Purview 帐户 ,然后选择 “打开Microsoft Purview 治理门户

  2. 导航到 数据映射 --> 以查看集合层次结构

  3. 选择之前注册的 Amazon Redshift 数据源下的“新建扫描”图标。

  4. 选择集成运行时。

  5. 提供以下详细信息:

    1. 名称 - 扫描的名称
    2. 凭据 - 选择 之前创建的凭据
    3. 数据库 - 要扫描的数据库实例的名称
    4. 架构 - 要导入的架构子集,以分号分隔的架构列表表示。 例如:“schema1;schema2”。 如果该列表为空,则导入所有用户架构。 默认情况下,将忽略所有系统架构和对象。 可接受的架构名称模式可以是静态名称,也可以包含通配符 %。 例如:“A%;%B;%C%;D":
      • 从 A 或 开始
      • 以 B 或 结尾
      • 包含 C 或
      • 等于 D

    显示 Amazon Redshift 的扫描菜单的屏幕截图。

  6. 选择“ 测试连接 ”以验证设置。

  7. 选择 继续

  8. 对于 “扫描”触发器 ,选择是设置计划还是运行扫描一次。

  9. 查看扫描并选择“ 保存并运行”。

查看扫描和扫描运行

查看现有扫描:

  1. 转到 Microsoft Purview 门户。 在左窗格中,选择“ 数据映射”。
  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描
  3. 选择要查看的结果的扫描。 窗格显示之前的所有扫描运行,以及每个扫描运行的状态和指标。
  4. 选择运行 ID 以检查扫描运行详细信息

管理扫描

若要编辑、取消或删除扫描,请执行以下操作:

  1. 转到 Microsoft Purview 门户。 在左窗格中,选择“ 数据映射”。

  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描

  3. 选择要管理的扫描。 然后,可以:

    • 通过选择“编辑扫描 ”来编辑扫描
    • 选择“取消扫描运行”, 取消正在进行的扫描
    • 通过选择“删除扫描” 来删除扫描

注意

  • 删除扫描不会删除从以前的扫描创建的目录资产。

浏览、搜索和查看资产

成功扫描 Amazon Redshift 群集后,可以 浏览数据目录搜索数据目录 以查看资产详细信息。

后续步骤

按照以下指南详细了解Microsoft Purview 和数据。