你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
使用 Azure Blob 存储导入 DAG
注意
此功能目前以公共预览版提供。 工作流编排管理器由 Apache Airflow 提供支持。
本文介绍了如何使用 Azure Blob 存储将有向无环图 (DAG) 导入工作流编排管理器的分步说明。
先决条件
- Azure 订阅:如果还没有 Azure 订阅,可以在开始前创建一个免费 Azure 帐户。
- Azure 数据工厂:在支持工作流编排管理器预览版的区域中创建一个数据工厂实例或选择现有的数据工厂实例。
- Azure 存储帐户:如果没有存储帐户,请参阅创建 Azure 存储帐户来了解创建步骤。 确保存储帐户仅允许来自选定的网络的访问。
预览版期间不支持虚拟网络后面的 Blob 存储。 storageLinkedServices
中的 Azure Key Vault 配置不支持导入 DAG。
导入 DAG
根据设置的 Airflow 环境复制示例 Apache Airflow v2.x DAG 或示例 Apache Airflow v1.10 DAG。 将内容粘贴到名为 tutorial.py 的新文件中。
将 tutorial.py 文件上传到 Blob 存储。 有关详细信息,请参阅将文件上传到 blob。
注意
需要从包含 dags 和 plugins 文件夹的 Blob 存储帐户中选择一个目录路径,以将其导入 Airflow 环境。 插件不是必需的。 还可以有一个名为 dags 的容器,并上传其中的所有 Airflow 文件。
在“管理中心”下,选择“Apache Airflow”。 然后,将鼠标悬停在先前创建的“Airflow”环境上并选择“导入文件”以将所有 DAG 和依赖项导入 Airflow 环境。
为先决条件中提到的可访问存储帐户新建一个链接服务。 如果已有自己的 DAG,也可以使用现有 DAG。
使用上传 DAG 的存储帐户。 (查看“先决条件”部分。)测试连接,然后选择“创建”。
如果使用示例 SAS URL,请浏览并选择“airflow”。 还可以选择包含 DAG 文件的 dags 文件夹所在的文件夹。
注意
可以通过此接口导入 DAG 及其依赖项。 需要从包含 dags 和 plugins 文件夹的 Blob 存储帐户中选择一个目录路径,以将其导入 Airflow 环境。 插件不是必需的。
选择“导入”以导入文件。
在预览版期间导入 DAG 可能需要几分钟时间。 可以使用通知中心(数据工厂 UI 中的钟形图标)跟踪导入状态更新。