你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
什么是 Trino? (预览版)
注意
我们将于 2025 年 1 月 31 日停用 Azure HDInsight on AKS。 在 2025 年 1 月 31 日之前,你需要将工作负荷迁移到 Microsoft Fabric 或同等的 Azure 产品,以避免工作负荷突然终止。 订阅上的剩余群集会被停止并从主机中移除。
在停用日期之前,仅提供基本支持。
重要
此功能目前以预览版提供。 Microsoft Azure 预览版的补充使用条款包含适用于 beta 版、预览版或其他尚未正式发布的 Azure 功能的更多法律条款。 有关此特定预览版的信息,请参阅 Azure HDInsight on AKS 预览版信息。 如有疑问或功能建议,请在 AskHDInsight 上提交请求并附上详细信息,并关注我们以获取 Azure HDInsight Community 的更多更新。
Trino(前 PrestoSQL)是开源分布式 SQL 查询引擎,用于针对异类数据源进行联合和交互式分析。 它可以从多个源大规模查询数据(GB 到 PB),以启用企业范围的分析。
Trino 用于各种分析用例,是交互式和即席查询的极佳选择。
Trino 提供的一些关键功能 -
- 自适应多租户系统,能够同时运行数百个内存、I/O 和 CPU 密集型查询,并扩展到数千个工作器节点,同时有效利用群集资源。
- 可扩展联合设计,减少了集成多个系统的复杂性。
- 高性能,具有多个关键相关功能和优化。
- 与 Hadoop 生态系统完全兼容。
有两种类型的 Trino 服务器:协调器和辅助角色。
Coordinator
Trino 协调器是负责分析语句、规划查询和管理 Trino 工作器节点的服务器。 它是 Trino 安装的“大脑”,也是客户端与之连接以提交语句供执行的节点。 协调器跟踪每个辅助角色上的活动,并协调查询的执行。 协调器创建查询的逻辑模型,该模型涉及一系列阶段,这些阶段转换为一系列连接任务,这些任务在 Trino 辅助角色群集上运行。
工作人员
Trino 辅助角色是 Trino 安装中的服务器,负责执行任务和处理数据。 工作器节点从连接器中提取数据,并相互交换中间数据。 协调器负责从辅助角色中提取结果,并将最终结果返回到客户端。