你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

在 Azure 门户预览中创建 Trino 群集(预览版)

注意

我们将于 2025 年 1 月 31 日停用 Azure HDInsight on AKS。 在 2025 年 1 月 31 日之前,你需要将工作负荷迁移到 Microsoft Fabric 或同等的 Azure 产品,以避免工作负荷突然终止。 订阅上的剩余群集会被停止并从主机中移除。

在停用日期之前,仅提供基本支持。

重要

此功能目前以预览版提供。 Microsoft Azure 预览版的补充使用条款包含适用于 beta 版、预览版或其他尚未正式发布的 Azure 功能的更多法律条款。 有关此特定预览版的信息,请参阅 Azure HDInsight on AKS 预览版信息。 如有疑问或功能建议,请在 AskHDInsight 上提交请求并附上详细信息,并关注我们以获取 Azure HDInsight Community 的更多更新。

本文介绍通过 Azure 门户使用 HDInsight on AKS 创建 Trino 群集的步骤。

先决条件

请完成以下部分中的先决条件:

重要

若要在新群集池中创建群集,请在作为资源先决条件的一部分创建的用户分配的托管标识上,将 AKS agentpool MSI 分配为“Managed Identity Operator”角色。

AKS agentpool 托管标识是在群集池创建期间创建的。 可以通过(你的群集池名称)-agentpool 来标识 AKS agentpool 托管标识。 若要分配角色,请执行以下步骤。

创建 Trino 群集

群集池部署完成后,继续使用 Azure 门户创建 Trino 群集。

  1. 在 Azure 门户中,键入“HDInsight 群集池/HDInsight”,然后选择“Azure HDInsight on AKS 群集池”以转到群集池页面。 在“HDInsight on AKS 群集池”页,选择要添加新 Trino 群集的群集池。

    屏幕截图显示 Azure 门户中的搜索栏。

  2. 在特定的群集池页上,单击左上角“+ 新建群集”,然后提供以下信息:

    屏幕截图显示创建 Trino 群集时使用的“基本信息”选项卡的更多详细信息。

    properties 说明
    订阅 此字段会自动填充已注册到群集池的 Azure 订阅。
    资源组 此字段会自动填充,并显示群集池上的资源组。
    区域 此字段会自动填充,并显示群集池上选定的区域。
    群集池 此字段会自动填充,并显示群集池名称,此时会在其中创建群集。 若要在不同的池中创建群集,请在门户中找到该群集池,然后单击“+ 新建群集“。
    群集池版本 此字段会自动填充,并显示此时创建的群集的群集池版本。
    HDInsight on AKS 版本 选择新群集的 HDInsight on AKS 次要版本或修补程序版本。 有关详细信息,请参阅版本
    群集类型 从下拉列表中,选择群集类型作为 Trino。
    群集名称 输入新群集的名称。
    用户分配的托管标识 从下拉列表中,选择要用于群集的托管标识。 如果你是托管服务标识 (MSI) 的所有者,并且 MSI 在群集上没有托管标识操作员角色,请单击框下方的链接以分配 AKS 代理池 MSI 所需的权限。 如果 MSI 已具有正确的权限,则不显示任何链接。 有关 MSI 所需的其他角色分配,请参阅先决条件
    虚拟网络 (VNet) 群集的虚拟网络。 它派生自群集池。
    子网 群集的虚拟子网。 它派生自群集池。

    对于 Hive 目录,请提供以下信息:

    屏幕截图显示创建 Trino 配置单元目录时使用的“基本信息”选项卡。

    properties 说明
    使用 Hive 目录 启用此选项以使用外部 Hive 元存储。
    Hive 目录名称 输入要添加到 Trino 目录的 Hive 目录的名称。
    适用于 Hive 的 SQL 数据库 从下拉列表中,选择要在其中添加 hive 元存储表的 SQL 数据库。 有关 SQL 数据库的其他要求,请参阅资源先决条件
    SQL 管理员用户名 输入 SQL Server 管理员用户名。 此帐户由元存储用来与 SQL 数据库通信。
    密钥保管库 从下拉列表中选择密钥保管库,其中包含具有 SQL 服务器管理员用户名密码的机密。 有关 Key Vault 的其他要求,请参阅资源先决条件
    SQL 密码机密名称 从存储 SQL 数据库密码的密钥保管库中输入机密名称。
    Hive 目录的默认存储 从下拉列表中,选择要用于 Hive 目录的默认存储帐户。
    容器 选择默认存储帐户中的现有容器来存储数据和日志或创建新容器。

    注意

    • 目前,我们支持使用 Azure SQL 数据库作为内置元存储。
    • 由于 Hive 的限制,不支持在元存储数据库名称中包含“-”字符(连字符)。

    有关详细信息,请参阅 Hive 元存储

    对于存储查询事件,请提供以下信息:

    屏幕截图显示创建 Trino 存储查询事件时使用的“基本信息”选项卡。

    properties 说明
    事件的容器 选择默认存储帐户中容器的名称以写入查询事件。
    容器中的路径 在容器中提供完全限定的路径以写入查询事件。
    Hive 目录架构 输入架构的名称以创建表和视图,以读取此 hive 目录中的查询事件。
    分区保留天数 输入查询事件分区的保留期(以天为单位)。

    有关详细信息,请参阅查询事件日志记录

    单击“下一步:配置”以继续。

  3. 在“配置”页上,提供以下信息:

    屏幕截图显示“创建 Trino 配置”选项卡的基本详细信息。

    properties 说明
    头节点大小 此值与工作器节点大小相同。
    头节点数 此值默认基于群集类型而设置。
    工作节点大小 从下拉列表中选择建议的 SKU,也可以通过单击“选择 VM 大小”选择订阅中的可用 SKU。
    工作器节点数 选择群集所需的工作器节点数。

    对于自动缩放和 SSH,请提供以下信息:

    屏幕截图显示自动缩放选项。

    屏幕截图显示“启用 SSH”选项。

    properties 说明
    自动扩展 选择后,将能够选择基于计划的自动缩放来配置缩放操作的计划。
    启用 SSH 选择后,可以选择所需的 SSH 节点总数,这些节点是使用安全外壳的 Trino CLI 的接入点。 允许的最大 SSH 节点为 5。

    单击“下一步:集成”以继续。

  4. 在“集成”页中提供以下信息

    屏幕截图显示集成选项。

    properties 说明
    Log Analytics 仅当群集池具有关联的 Log Analytics 工作区时,此功能才可用,一旦启用,即可选中要收集的日志。
    Azure Prometheus 此功能为通过将指标和日志发送到 Azure Monitor 工作区,直接在群集中查看见解和日志。

    单击“下一步:标记”以继续。

  5. 在“标记”页上,输入要分配给群集的标记(可选)。

    屏幕截图显示标记选项。

    properties 说明
    Name 输入名称(键),可帮助你根据与组织相关的设置来识别资源。 例如,“Environment”用于跟踪资源的部署环境。
    输入有助于与资源关联的值。 例如,“Production”用于标识部署到生产的资源。
    资源 选择适用的资源类型。

    选择“下一步: 查看 + 创建”以继续。

  6. 在“审阅 + 创建”页面,查找页面顶部的“验证成功”消息,然后单击“创建”。

    屏幕截图显示群集的“查看并创建”选项卡。

    显示“部署正在处理”页面,其中创建了群集。 创建群集需要 5-10 分钟。 创建群集后,会显示消息“部署完成”

    屏幕截图显示自定义部署已完成。

    如果离开该页面,可通过单击“通知”图表来查看部署的状态。

    提示

    若要排查任何部署错误,可参考此页面