什麼是 Trino? (預覽)
重要
AKS 上的 Azure HDInsight 於 2025 年 1 月 31 日淘汰。 透過此公告 深入瞭解。
您必須將工作負載移轉至 Microsoft Fabric 或對等 Azure 產品,以避免突然終止工作負載。
重要
這項功能目前為預覽狀態。 Microsoft Azure 預覽版的補充使用規定 包含適用於 Beta 版、預覽版或尚未正式發行之 Azure 功能的更合法條款。 如需關於此特定預覽的資訊,請參閱 AKS 預覽資訊上的 Azure HDInsight。 如需問題或功能建議,請提交要求至 AskHDInsight,並關注我們以獲取 Azure HDInsight 社群的最新資訊。
Trino (先前稱為 PrestoSQL) 是一個開放原始碼分散式 SQL 查詢引擎,可用於針對異質數據源進行同盟和互動式分析。 它可以從多個來源大規模查詢數據(GB 到 PB),以啟用全企業分析。
Trino 用於各種分析使用案例,是互動式和臨機作查詢的絕佳選擇。
Trino 提供的一些主要功能 -
- 具有調適能力的多租戶系統,能夠同時執行數百個記憶體、I/O 和 CPU 密集型查詢,並可擴展至數千個工作節點,有效利用叢集資源。
- 可延伸和同盟設計,以減少整合多個系統的複雜性。
- 高效能,具有數個主要相關功能和優化。
- 與 Hadoop 生態系統完全相容。
Trino 伺服器有兩種類型:協調器和工作節點。
協調者
Trino 協調器是負責剖析語句、規劃查詢和管理 Trino 背景工作節點的伺服器。 這是 Trino 安裝的「大腦」,也是用戶端連接以提交語句來執行的節點。 協調器會追蹤每個工作者的活動,並協調查詢的執行。 協調器會建立查詢的邏輯模型,其中包含一系列階段,這些階段被轉換為一系列互相連接的任務,並在 Trino 工作叢集上運行。
工人
Trino 工作節點是 Trino 安裝中的一個伺服器,負責執行任務和處理資料。 工作節點會從連接器擷取數據,並彼此交換中間數據。 協調器負責從工作者擷取結果,並將最終結果傳回客戶端。