Что такое Trino? (предварительная версия)
Важный
Azure HDInsight на AKS прекращено 31 января 2025 г. Узнайте больше из этого объявления.
Необходимо перенести рабочие нагрузки в Microsoft Fabric или эквивалентный продукт Azure, чтобы избежать резкого завершения рабочих нагрузок.
Важный
Эта функция сейчас доступна в предварительной версии. Дополнительные условия использования для предварительных версий Microsoft Azure включают дополнительные юридические термины, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или в противном случае еще не выпущены в общую доступность. Сведения об этой конкретной предварительной версии см. в разделе Информация о предварительной версии Azure HDInsight на AKS. Для вопросов или предложений функций оставьте запрос в AskHDInsight с уточнением деталей и подписывайтесь на обновления в Azure HDInsight Community.
Trino (ранее PrestoSQL) — это модуль запросов с открытым исходным кодом для федеративной и интерактивной аналитики для разнородных источников данных. Он может запрашивать данные в масштабе (гигабайты к петабайтам) из нескольких источников, чтобы обеспечить корпоративную аналитику.
Trino используется для широкого спектра вариантов аналитического использования и является отличным выбором для интерактивного и нерегламентированного запроса.
Некоторые ключевые функции, которые предлагает Trino -
- Адаптивная мультитенантная система, способная одновременно выполнять сотни запросов, интенсивных по использованию памяти, ввода-вывода и ЦП, а также масштабироваться до тысяч рабочих узлов, эффективно используя ресурсы кластера.
- Расширяемый и федеративный дизайн, чтобы снизить сложность интеграции нескольких систем.
- Высокая производительность с несколькими ключевыми связанными функциями и оптимизацией.
- Полностью совместим с экосистемой Hadoop.
Существует два типа серверов Trino: координаторы и работники.
Согласующий
Координатор Trino — это сервер, отвечающий за анализ инструкций, планирование запросов и управление рабочими узлами Trino. Это "мозг" установки Trino, а также узел, к которому клиент подключается для отправки инструкций для выполнения. Координатор отслеживает работу каждого работника и координирует выполнение запроса. Координатор создает логическую модель запроса, которая включает в себя серию этапов и преобразуется в ряд взаимосвязанных задач, выполняемых в кластере рабочих узлов Trino.
Рабочий
Рабочий узел Trino — это сервер в системe Trino, который отвечает за выполнение задач и обработку данных. Рабочие узлы извлекаются данные из соединителей и обмениваются промежуточными данными друг с другом. Координатор отвечает за получение результатов от работников и возвращение конечных результатов клиенту.
схема