什么是 Trino? (预览版)
重要
AKS 上的 Azure HDInsight 已于 2025 年 1 月 31 日停用。 了解此公告的详细信息。
需要将工作负荷迁移到 Microsoft Fabric 或等效的 Azure 产品,以避免工作负荷突然终止。
重要
此功能目前以预览版提供。 Microsoft Azure 客户预览版补充使用条款 包括适用于 beta 版、预览版或尚未正式发布的 Azure 功能的更多法律条款。 有关此特定预览的信息,请参阅 Azure HDInsight on AKS 预览信息。 有关问题或功能建议,请在 AskHDInsight 上提交请求,并提供详细信息,并关注我们以获取有关 Azure HDInsight 社区的更多更新。
Trino(前 PrestoSQL)是一个开源分布式 SQL 查询引擎,用于针对异类数据源进行联合和交互式分析。 它可以从多个源大规模查询数据(千兆字节到 PB),以启用企业范围的分析。
Trino 用于各种分析用例,是交互式和即席查询的极佳选择。
Trino 提供的一些关键功能 -
- 自适应多租户系统,能够同时运行数百个内存、I/O 和 CPU 密集型查询,并扩展到数千个工作器节点,同时有效利用群集资源。
- 可扩展和联合设计,以减少集成多个系统的复杂性。
- 高性能,具有多个关键相关功能和优化。
- 与 Hadoop 生态系统完全兼容。
有两种类型的 Trino 服务器:协调器和辅助角色。
协调者
Trino 协调器是负责分析语句、规划查询和管理 Trino 工作器节点的服务器。 它是 Trino 安装的“大脑”,也是客户端连接到提交语句以供执行的节点。 协调器跟踪每个工作节点的活动状态,并协调查询的执行。 协调器创建查询的逻辑模型,该模型涉及一系列阶段,这些阶段转换为一系列连接任务,这些任务在 Trino 辅助角色群集上运行。
工人
Trino 辅助角色是 Trino 安装中的服务器,负责执行任务和处理数据。 工作器节点从连接器提取数据,并相互交换中间数据。 协调器负责从工作者中提取结果,并将最终结果返回给客户端。
显示 Trino 体系结构的