在 Azure 门户中创建 Trino 群集(预览版)

重要

AKS 上的 Azure HDInsight 已于 2025 年 1 月 31 日停用。 通过此公告 了解更多

需要将工作负荷迁移到 Microsoft Fabric 或等效的 Azure 产品,以避免工作负荷突然终止。

重要

此功能目前以预览版提供。 Microsoft Azure 预览补充使用条款 包括适用于 beta 阶段、预览阶段或其他尚未正式发布的 Azure 功能的更多法律条款。 有关此特定预览的信息,请参阅 AKS 上的 Azure HDInsight 预览信息。 有关问题或功能建议,请在 AskHDInsight 上提交请求并提供详细信息。关注我们以获取 Azure HDInsight 社区 的更多更新。

本文介绍使用 Azure 门户在 AKS 上使用 HDInsight 创建 Trino 群集的步骤。

先决条件

完成以下部分中的先决条件:

重要

若要在新的群集池中创建群集,请将 AKS agentpool MSI“托管标识操作员”角色分配给作为资源先决条件的一部分创建的用户分配托管标识。

AKS 代理池托管标识在集群池创建时被创建。 可以通过 (群集池名称)-agentpool来标识 AKS 代理池托管标识。 按照以下步骤 分配角色

创建 Trino 群集

群集池部署完成后,继续使用 Azure 门户创建 Trino 群集。

  1. 在 Azure 门户中,键入 HDInsight 群集池/HDInsight,然后选择 Azure HDInsight on AKS 群集池,以进入群集池页面。 在 HDInsight on AKS 群集池页面中,选择要添加新 Trino 集群的群集池。

    显示 Azure 门户中搜索栏的屏幕截图。

  2. 在特定的群集池页上,单击左上角 + 新建群集,然后提供以下信息:

    屏幕截图,其中显示了创建 Trino 群集的基本选项卡的更多详细信息。

    财产 描述
    订阅 此字段会自动填入为群集池注册的 Azure 订阅。
    资源组 此字段会自动填充,并显示群集池上的资源组。
    地区 此字段会自动填充,并显示群集池上选定的区域。
    群集池 此字段会自动填充,并显示正在创建群集的群集池名称。 若要在不同的池中创建群集,请在门户中找到该群集池,然后单击 + 新建群集
    群集池版本 此字段会自动填充,显示用于当前正在创建的群集的群集池版本。
    AKS 版本的 HDInsight 在新群集的 AKS 上选择 HDInsight 的次要版本或修补程序版本。 有关详细信息,请参阅 版本
    群集类型 从下拉列表中,选择群集类型作为 Trino。
    群集名称 输入新群集的名称。
    用户分配的托管标识 从下拉列表中,选择要用于群集的托管标识。 如果你是托管服务标识(MSI)的所有者,但 MSI 在群集上没有托管标识操作员角色,请单击框下方的链接,以便从 AKS 代理池 MSI 中授予所需的权限。 如果 MSI 已具有正确的权限,则不显示任何链接。 有关 MSI 所需的其他角色分配,请参阅 先决条件
    虚拟网络(VNet) 群集的虚拟网络。 它源自集群池。
    子网 群集的虚拟子网。 它派生自集群资源池。

    对于 Hive 目录,请提供以下信息:

    显示创建 Trino Hive 目录的基本选项卡的屏幕截图。

    财产 描述
    使用 Hive 目录 启用此选项以使用外部 Hive 元存储。
    Hive 目录名称 输入要添加到 Trino 目录的 Hive 目录的名称。
    用于Hive的SQL数据库 从下拉列表中,选择要在其中添加 hive 元存储表的 SQL 数据库。 有关 SQL 数据库的其他要求,请参阅 资源先决条件
    SQL 管理员用户名 输入 SQL Server 管理员用户名。 此帐户由元存储用来与 SQL 数据库通信。
    密钥保管库 从下拉列表中选择 Key Vault,其中包含具有 SQL Server 管理员用户名密码的机密。 有关 Key Vault 的其他要求,请参阅 资源先决条件
    SQL 密码密钥名称 输入存储 SQL 数据库密码的 Key Vault 中的机密名称。
    Hive 目录的默认存储 从下拉列表中,选择要用于 Hive 目录的默认存储帐户。
    容器 选择默认存储帐户中的现有容器来存储数据和日志或创建新容器。

    注意

    • 目前,我们支持 Azure SQL 数据库作为内置元存储。
    • 由于 Hive 限制,不支持元存储数据库名称中的“-”(连字符)字符。

    有关详细信息,请参阅 hive Metastore

    若要 存储查询事件,请提供以下信息:

    显示创建 Trino 存储查询事件的基本选项卡的屏幕截图。

    财产 描述
    事件的容器 选择默认存储帐户中容器的名称以写入查询事件。
    容器中的路径 在容器中提供完全限定的路径以写入查询事件。
    Hive 目录架构 输入架构的名称,以创建表和视图以读取此 hive 目录中的查询事件。
    分区保留天数 输入查询事件分区的保留期(以天为单位)。

    有关详细信息,请参阅 查询事件日志

    单击 下一步:配置 继续。

  3. 配置 页上,提供以下信息:

    显示“创建 Trino 配置”选项卡的基本详细信息的屏幕截图。

    财产 描述
    头节点大小 此值与工作器节点大小相同。
    头节点数 此值默认基于群集类型设置。
    工作器节点大小 从下拉列表中,选择建议的 SKU,也可以通过单击 选择 VM 大小来选择订阅中可用的 SKU。
    工作器节点数 选择群集所需的工作器节点数。

    对于 自动扩展和 SSH,请提供以下信息:

    显示自动缩放选项的屏幕截图。

    显示“启用 ssh”选项的屏幕截图。

    财产 描述
    自动缩放 选择后,您可以选择基于计划的自动缩放功能,并为缩放操作配置计划。
    启用 SSH 选择后,可以选择所需的 SSH 节点总数,这些节点是使用安全外壳的 Trino CLI 的接入点。 允许的最大 SSH 节点为 5。

    单击“下一步 集成”以继续。

  4. 集成功能 页上,提供以下信息:

    显示集成选项的 屏幕截图。

    财产 描述
    日志分析 仅当群集池具有关联的 Log Analytics 工作区时,此功能才可用,一旦启用要收集的日志即可被选中。
    Azure Prometheus 此功能是通过将指标和日志发送到 Azure Monitor 工作区,直接在群集中查看见解和日志。

    单击下一步:标记 继续。

  5. 标记 页上,输入要分配给群集的标记(可选)。

    显示标记选项的屏幕截图。

    财产 描述
    名字 输入一个名称(密钥),帮助你根据与组织相关的设置识别资源。 例如,“环境”用于跟踪资源的部署环境。
    价值 输入有助于与资源相关的值。 例如,“生产环境”用于识别部署到生产环境的资源。
    资源 选择适用的资源类型。

    选择 下一步:查看 + 创建 以继续。

  6. 审阅 + 创建 页上,查找页面顶部的 验证成功 消息,然后单击 创建

    显示群集审阅和创建选项卡的屏幕截图。

    部署正在进行中,正在显示 页面,其中群集正在创建。 创建群集需要 5-10 分钟。 创建群集后,会显示“部署完成” 消息。

    显示自定义部署完成的 屏幕截图。

    如果离开页面,可以通过单击“通知”图标来检查部署的状态。

    提示

    若要排查任何部署错误,可参阅此