在 Azure 数据目录中从 Azure Data Lake Storage Gen1 注册数据

本文介绍如何将 Azure Data Lake Storage Gen1 与 Azure 数据目录集成,以便通过将其与数据目录集成,使数据在组织内可发现。 了解对数据进行分类的详细信息,请参阅 Azure 数据目录。 若要了解可以在其中使用数据目录的方案,请参阅 Azure 数据目录常见方案

先决条件

在开始阅读本教程前,必须具有:

将 Data Lake Storage Gen1 注册为数据目录的源

  1. 转到 https://azure.microsoft.com/services/data-catalog,并单击“开始使用”

  2. 登录到 Azure 数据目录门户,并单击“发布数据”

    注册数据源

  3. 在下一页上,单击“启动应用程序”。 这会在计算机上下载应用程序清单文件。 双击此清单文件以启动应用程序。

  4. 在“欢迎”页上,单击“登录”并输入凭据。

    欢迎屏幕

  5. 在“选择数据源”页上,选择“Azure Data Lake Store”,并单击“下一步”

    选择数据源

  6. 在下一页上,提供要在数据目录中注册的 Data Lake Storage Gen1 帐户名。 其他选项保留为默认值,并单击“连接”

    连接到数据源

  7. 下一个页面可以分为以下几部分。

    a. “服务器层次结构”框表示 Data Lake Storage Gen1 帐户文件夹结构。 “$Root”表示 Data Lake Storage Gen1 帐户的根,而“AmbulanceData”表示 Data Lake Storage Gen1 帐户的根中创建的文件夹

    b. 可用对象框中列出 AmbulanceData 文件夹下的文件和文件夹。

    c. “要注册的对象”框中列出要在 Azure 数据目录中注册的文件和文件夹。

    “Microsoft Azure 数据目录 - 存储帐户”对话框的屏幕截图。

  8. 在本教程中,应在目录中注册所有文件。 为此,请单击(移动对象)按钮将所有文件移到“要注册的对象”框。

    由于数据会在组织范围内的数据目录中注册,因此建议添加一些元数据,稍后可以使用这些元数据快速查找数据。 例如,可以为数据所有者添加电子邮件地址(例如,上传数据的用户)或添加标签以标识数据。 下面的屏幕截图显示了添加到数据的标记。

    “Microsoft Azure 数据目录 - 存储帐户”对话框的屏幕截图,其中框出了已添加到数据中的标记。

    单击“注册”。

  9. 以下屏幕截图表示数据已成功注册到数据目录中。

    注册完成

  10. 单击“查看门户”返回到数据目录门户并验证现在是否可以从门户访问注册的数据。 若要搜索数据,可以使用注册数据时使用的标记。

    在目录中搜索数据

  11. 现在可以执行向数据添加批注和文档等操作。 有关详细信息,请参阅以下链接。

另请参阅