创建群集期间的脚本操作

重要

AKS 上的 Azure HDInsight 已于 2025 年 1 月 31 日停用。 了解此公告的详细信息

需要将工作负荷迁移到 Microsoft Fabric 或等效的 Azure 产品,以避免工作负荷突然终止。

重要

此功能目前以预览版提供。 Microsoft Azure 预览版补充使用条款 包括适用于 beta 版、预览版或尚未正式发布的 Azure 功能的更多法律条款。 有关此特定预览版的信息,请参阅 AKS 预览版信息的 Azure HDInsight。 有关问题或功能建议,请在 AskHDInsight 上提交请求,并提供详细信息,关注我们以获取 Azure HDInsight 社区 的更多更新。

在 AKS 上,Azure HDInsight 提供了一种称为 脚本操作 的机制,用于调用自定义脚本来定制群集。 这些脚本用于安装其他组件并更改配置设置。 只能在创建群集时配置脚本操作。 创建群集后,脚本操作是路线图中的一部分。 本文介绍如何在创建 AKS 群集上的 HDInsight 时预配脚本操作。

在 Azure 门户中创建群集时使用脚本操作

  1. ADLS/WASB 存储中上传脚本操作,并且这不必是主群集存储。 在此示例中,我们考虑 ADLS 存储。 若要将脚本上传到存储中,请导航到目标存储以及要在其中上传脚本的容器。

    显示如何选择容器的屏幕截图。

  2. 若要将脚本上传到存储中,请导航到目标存储和容器。 单击“上传”按钮,然后从本地驱动器中选择脚本。 上传脚本后,应能够在容器中看到该脚本(如下图所示)。

    显示如何上传脚本的屏幕截图。

  3. 如此处 所述创建新群集。

  4. 在“配置”选项卡中,选择“+ 添加脚本动作”

    显示 Azure 门户中“添加脚本”操作按钮的“新建群集”页的屏幕截图。

    此操作将打开“脚本操作”窗口。 提供以下详细信息:

    屏幕截图显示如何在 Azure 门户中打开“添加脚本操作”窗口。

    财产 描述
    脚本动作名称 脚本动作的唯一名称。
    Bash 脚本 URL 存储脚本的位置。 例如 - abfs://<CONTAINER>@<DATALAKESTOREACCOUNTNAME>.dfs.core.windows.net/<file_path>,更新 Data Lake 存储名称和文件路径。
    服务业 选择要在其中运行脚本作的特定服务组件。
    参数 为脚本指定参数(如有必要)。
    TimeOutInMinutes 为每个脚本选择超时

    显示需要应用脚本动作的服务列表的屏幕截图。

    注意

    • 所有脚本操作已保存。
    • 脚本操作仅适用于 Apache Spark 集群类型。
  5. 选择“确定”保存脚本。

  6. 然后,可以再次使用 + 添加脚本动作,以便根据需要添加另一个脚本。

    显示集成选项卡中的“查看脚本”部分的屏幕截图。

  7. 完成创建群集的剩余步骤。

    重要

    • 无法自动撤消脚本作所做的更改。
    • 脚本操作必须在 40 分钟内完成,否则会导致集群创建失败。
    • 在群集预配期间,脚本与其他安装和配置进程同时运行。
    • CPU 时间或网络带宽等资源的争用可能会导致脚本花费更长的时间才能完成。
    • 若要最大程度地减少运行脚本所需的时间,请避免从源下载和编译应用程序等任务。 预编译应用程序和将二进制文件存储在 Azure Data Lake Store Gen2 中。

查看脚本操作列表

  1. 可以在“配置”选项卡中查看脚本操作列表。

    显示“创建以保存脚本操作”页面的屏幕截图。