使用 Azure 门户管理 Azure Data Lake Analytics
重要
除非订阅已启用,否则无法再创建新的 Azure Data Lake Analytics 帐户。 如果需要启用订阅,请联系支持人员并提供业务方案。
如果已在使用 Azure Data Lake Analytics,则需要在 2024 年 2 月 29 日前为组织创建迁移到 Azure Synapse Analytics 的计划。
本文介绍如何使用 Azure 门户管理 Azure Data Lake Analytics 帐户、数据源、用户和作业。
管理 Data Lake Analytics 帐户
创建帐户
- 登录 Azure 门户。
- 选择“创建资源”并搜索“Data Lake Analytics”。
- 为以下项选择值:
- 名称:Data Lake Analytics 帐户的名称。
- 订阅:用于帐户的 Azure 订阅。
- 资源组:要在其中创建帐户的 Azure 资源组。
- 位置:Data Lake Analytics 帐户的 Azure 数据中心。
- Data Lake Store:要用于 Data Lake Analytics 帐户的默认存储。 Azure Data Lake Store 帐户和 Data Lake Analytics 帐户必须位于同一位置。
- 选择“创建” 。
删除 Data Lake Analytics 帐户
删除 Data Lake Analytics 帐户前,先删除其默认 Data Lake Store 帐户。
- 在 Azure 门户中转到 Data Lake Analytics 帐户。
- 选择“删除” 。
- 键入帐户名称。
- 选择“删除” 。
管理数据源
Data Lake Analytics 支持以下数据源:
- Data Lake Store
- Azure 存储
可使用数据资源管理器来浏览数据源和执行基本文件管理操作。
添加数据源
在 Azure 门户中转到 Data Lake Analytics 帐户。
选择“数据资源管理器”。
选择“添加数据源”。
- 若要添加 Data Lake Store 帐户,需要帐户名称和此帐户的访问权限才能对其进行查询。
- 若要添加 Azure Blob 存储,需要存储帐户和帐户密钥。 若要找到它们,请在门户中转到存储帐户,然后选择“访问密钥”。
设置防火墙规则
可使用 Data Lake Analytics 进一步在网络级别锁定访问 Data Lake Analytics 帐户的权限。 可启用防火墙、指定 IP 地址或定义受信任客户端的 IP 地址范围。 启用这些度量值后,只有具有定义范围内的 IP 地址的客户端才可连接到 Azure Data Lake Store。
如果其他 Azure 服务(如 Azure 数据工厂或 VM)连接到 Data Lake Analytics 帐户,请确保将“允许 Azure 服务”切换为“启用”。
设置防火墙规则。
- 在 Azure 门户中转到 Data Lake Analytics 帐户。
- 在左侧菜单中选择“防火墙”。
添加新用户
可以使用 “添加用户向导” 轻松创建新的 Data Lake 用户。
- 在 Azure 门户中转到 Data Lake Analytics 帐户。
- 在左侧的“入门”下,单击“添加用户向导”。
- 选择一名用户,然后选择“选择”。
- 选择一个角色,然后选择“选择”。 若要设置要使用 Azure Data Lake 的新的开发人员,请选择“Data Lake Analytics 开发人员”角色。
- 选择 U-SQL 数据库的访问控制列表 (ACL)。 如果对所选内容满意,请选择“选择”。
- 选择文件的 ACL。 对于默认存储,不要更改根文件夹“/”和 /system 文件夹的 ACL。 选择“选择”。
- 查看所选的所有更改,然后选择“运行”。
- 完成向导后,选择“完成”。
管理 Azure 基于角色的访问控制
与其他 Azure 服务一样,你可使用 Azure 基于角色的访问控制 (Azure RBAC) 来控制用户与服务交互的方式。
标准 Azure 角色具有以下功能:
- 所有者:可提交作业、监视作业、从任何用户取消作业以及配置帐户。
- 参与者:可提交作业、监视作业、从任何用户取消作业以及配置帐户。
- 读者:可监视作业。
使用 Data Lake Analytics 开发人员角色使 U-SQL 开发人员能够使用 Data Lake Analytics 服务。 可使用 Data Lake Analytics 开发人员角色执行以下操作:
- 提交作业。
- 监视作业状态以及任何用户提交的作业进度。
- 查看任何用户提交的作业中的 U-SQL 脚本。
- 只取消自己的作业。
将用户或安全组添加到 Data Lake Analytics 帐户
在 Azure 门户中转到 Data Lake Analytics 帐户。
选择“访问控制 (IAM)”。
选择“添加”>“添加角色分配”,打开“添加角色分配”页面 。
向用户分配角色。 有关详细步骤,请参阅使用 Azure 门户分配 Azure 角色。
注意
如果用户或安全组需要提交作业,还需要对存储帐户的权限。 有关详细信息,请参阅保护 Data Lake Store 中存储的数据。
管理作业
提交作业
在 Azure 门户中转到 Data Lake Analytics 帐户。
选择“新建作业”。 对每个作业配置以下各项:
- 作业名称:作业的名称。
- 优先级:该项位于“更多选项”下。 数字越小,优先级越高。 如果队列有两个作业,将先运行优先级值低的作业。
- AU:为此作业保留的最大分析单位数或计算进程数。
- 运行时:也位于“更多选项”下。 除非收到了自定义运行时,否则请选择“默认运行时”。
添加脚本。
选择“提交作业”。
监视作业
- 在 Azure 门户中转到 Data Lake Analytics 帐户。
- 选择页面顶部的“查看所有作业”。 将显示帐户中所有活动作业和最近已完成作业的列表。
- 根据需要选择“筛选器”,帮助按“时间范围”、“状态”、“作业名称”、“作业 ID”、“管道名称”或“管道 ID”、“重复名称”或“重复 ID”和“作者”值查找作业。
监视管道作业
管道中包含的作业通常按顺序一起工作,以完成特定方案。 例如,可使用一个管道来清理、提取、转换和聚合使用情况,获取客户见解。 提交作业时,使用“Pipeline”属性标识管道作业。 使用 ADF V2 计划的作业会自动填充此属性。
查看管道中包含的 U-SQL 作业的列表:
- 在 Azure 门户中,转到 Data Lake Analytics 帐户。
- 选择“作业见解”。 默认显示“所有作业”选项卡,即显示正在运行的作业、排队的作业以及已结束作业的列表。
- 选择“管道作业”选项卡。管道作业列表将随每个管道的聚合统计信息一起显示。
监视定期作业
定期作业是指具有相同的业务逻辑,但每次运行时均使用不同输入数据的作业。 理想情况下,定期作业应始终成功,并具有相对稳定的执行时间;监视这些行为有助于确保作业处于正常状态。 定期作业是使用“Recurrence”属性标识的。 使用 ADF V2 计划的作业会自动填充此属性。
查看定期 U-SQL 作业的列表:
- 在 Azure 门户中,转到 Data Lake Analytics 帐户。
- 选择“作业见解”。 默认显示“所有作业”选项卡,即显示正在运行的作业、排队的作业以及已结束作业的列表。
- 选择“定期作业”选项卡。定期作业列表将随每个定期作业的聚合统计信息一起显示。