Поделиться через


Что такое Trino? (предварительная версия)

Важный

Azure HDInsight на AKS прекращено 31 января 2025 г. Узнайте больше из этого объявления.

Необходимо перенести рабочие нагрузки в Microsoft Fabric или эквивалентный продукт Azure, чтобы избежать резкого завершения рабочих нагрузок.

Важный

Эта функция сейчас доступна в предварительной версии. Дополнительные условия использования для предварительных версий Microsoft Azure включают дополнительные юридические термины, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или в противном случае еще не выпущены в общую доступность. Сведения об этой конкретной предварительной версии см. в разделе Информация о предварительной версии Azure HDInsight на AKS. Для вопросов или предложений функций оставьте запрос в AskHDInsight с уточнением деталей и подписывайтесь на обновления в Azure HDInsight Community.

Trino (ранее PrestoSQL) — это модуль запросов с открытым исходным кодом для федеративной и интерактивной аналитики для разнородных источников данных. Он может запрашивать данные в масштабе (гигабайты к петабайтам) из нескольких источников, чтобы обеспечить корпоративную аналитику.

Trino используется для широкого спектра вариантов аналитического использования и является отличным выбором для интерактивного и нерегламентированного запроса.

Некоторые ключевые функции, которые предлагает Trino -

  • Адаптивная мультитенантная система, способная одновременно выполнять сотни запросов, интенсивных по использованию памяти, ввода-вывода и ЦП, а также масштабироваться до тысяч рабочих узлов, эффективно используя ресурсы кластера.
  • Расширяемый и федеративный дизайн, чтобы снизить сложность интеграции нескольких систем.
  • Высокая производительность с несколькими ключевыми связанными функциями и оптимизацией.
  • Полностью совместим с экосистемой Hadoop.

Существует два типа серверов Trino: координаторы и работники.

Согласующий

Координатор Trino — это сервер, отвечающий за анализ инструкций, планирование запросов и управление рабочими узлами Trino. Это "мозг" установки Trino, а также узел, к которому клиент подключается для отправки инструкций для выполнения. Координатор отслеживает работу каждого работника и координирует выполнение запроса. Координатор создает логическую модель запроса, которая включает в себя серию этапов и преобразуется в ряд взаимосвязанных задач, выполняемых в кластере рабочих узлов Trino.

Рабочий

Рабочий узел Trino — это сервер в системe Trino, который отвечает за выполнение задач и обработку данных. Рабочие узлы извлекаются данные из соединителей и обмениваются промежуточными данными друг с другом. Координатор отвечает за получение результатов от работников и возвращение конечных результатов клиенту.

схема с архитектурой Trino.