Partager via


Qu’est-ce que Trino ? (Préversion)

Important

Azure HDInsight sur AKS a été mis hors service le 31 janvier 2025. En savoir plus grâce à cette annonce.

Vous devez migrer vos charges de travail vers Microsoft Fabric ou un produit Azure équivalent pour éviter l’arrêt brusque de vos charges de travail.

Important

Cette fonctionnalité est actuellement en préversion. Les Conditions d’utilisation supplémentaires pour les préversions Microsoft Azure incluent des termes juridiques supplémentaires qui s’appliquent aux fonctionnalités Azure en version bêta, en préversion ou qui ne sont pas encore publiées en disponibilité générale. Pour des informations sur cette préversion particulière, consultez les informations de préversion d'Azure HDInsight sur AKS . Pour des questions ou des suggestions de fonctionnalités, envoyez une demande sur AskHDInsight avec les détails et suivez-nous pour plus de mises à jour sur Communauté Azure HDInsight.

Trino (anciennement PrestoSQL) est un moteur de requête SQL distribué open source pour l’analytique fédérée et interactive sur des sources de données hétérogènes. Il peut interroger des données à grande échelle (gigaoctets à pétaoctets) à partir de plusieurs sources pour activer l’analytique à l’échelle de l’entreprise.

Trino est utilisé pour un large éventail de cas d’usage analytiques et constitue un excellent choix pour l’interrogation interactive et ad hoc.

Certaines des principales fonctionnalités proposées par Trino -

  • Un système multilocataire adaptatif capable d’exécuter simultanément des centaines de requêtes gourmandes en mémoire, en E/S et en processeur, et de s'adapter à des milliers de nœuds de travail tout en utilisant efficacement les ressources du cluster.
  • Conception extensible et fédérée pour réduire la complexité de l’intégration de plusieurs systèmes.
  • Hautes performances, avec plusieurs fonctionnalités et optimisations clés associées.
  • Entièrement compatible avec l’écosystème Hadoop.

Il existe deux types de serveurs Trino : les coordinateurs et les travailleurs.

Coordinateur

Le coordinateur Trino est le serveur responsable de l’analyse des instructions, de la planification des requêtes et de la gestion des nœuds Worker Trino. Il s’agit du « cerveau » d’une installation Trino et est également le nœud auquel un client se connecte pour envoyer des instructions pour l’exécution. Le coordinateur effectue le suivi de l’activité sur chaque worker et coordonne l’exécution d’une requête. Le coordinateur crée un modèle logique d’une requête, qui implique une série d’étapes, qui est traduite en une série de tâches connectées s’exécute sur un cluster de workers Trino.

Travailleur

Un worker Trino est un serveur dans une installation trino, qui est responsable de l’exécution de tâches et de traitement des données. Les nœuds Worker récupèrent des données à partir de connecteurs et échangent des données intermédiaires entre eux. Le coordinateur est chargé d’extraire les résultats des travailleurs et de retourner les résultats finaux au client.

Diagramme montrant l’architecture Trino.