¿Qué es Trino? (Versión preliminar)
Importante
Azure HDInsight en AKS se retiró el 31 de enero de 2025. Descubre más en este anuncio.
Debe migrar las cargas de trabajo a microsoft Fabric o un producto equivalente de Azure para evitar la terminación repentina de las cargas de trabajo.
Importante
Esta característica está actualmente en versión preliminar. Los Términos de uso complementarios para las versiones preliminares de Microsoft Azure incluyen más términos legales que se aplican a las características de Azure que se encuentran en versión beta, en versión preliminar o, de lo contrario, aún no se han publicado en disponibilidad general. Para obtener información sobre esta versión preliminar específica, consulte información de la versión preliminar de Azure HDInsight en AKS. Para preguntas o sugerencias de características, envíe una solicitud en AskHDInsight con los detalles y siganos para obtener más actualizaciones sobre comunidad de Azure HDInsight.
Trino (anteriormente PrestoSQL) es un motor de consultas SQL distribuido de código abierto para análisis federados e interactivos en orígenes de datos heterogéneos. Puede consultar datos a escala (gigabytes a petabytes) desde varios orígenes para permitir el análisis en toda la empresa.
Trino se usa para una amplia gama de casos de uso analíticos y es una excelente opción para consultas interactivas y ad hoc.
Algunas de las características clave que ofrece Trino:
- Un sistema multiinquilino adaptable capaz de ejecutar simultáneamente cientos de consultas de memoria, E/S y uso intensivo de CPU, y escalar a miles de nodos de trabajo, a la vez que usa recursos de clúster de forma eficaz.
- Diseño extensible y federado para reducir la complejidad de la integración de varios sistemas.
- Alto rendimiento, con varias características y optimizaciones clave relacionadas.
- Totalmente compatible con el ecosistema de Hadoop.
Hay dos tipos de servidores de Trino: coordinadores y trabajadores.
Coordinador
El coordinador de Trino es el servidor responsable de analizar instrucciones, planear consultas y administrar nodos de trabajo de Trino. Es el "cerebro" de una instalación de Trino y también es el nodo al que un cliente se conecta para enviar instrucciones para su ejecución. El coordinador realiza un seguimiento de la actividad de cada trabajador y coordina la ejecución de una consulta. El coordinador crea un modelo lógico de una consulta, que implica una serie de fases, que se traduce en una serie de tareas conectadas que se ejecutan en un clúster de trabajos de Trino.
Trabajador
Un trabajador de Trino es un servidor en una instalación de Trino, que es responsable de ejecutar tareas y procesar datos. Los nodos de trabajo capturan datos de conectores e intercambian datos intermedios entre sí. El coordinador es responsable de recoger los resultados de los trabajadores y devolver los resultados finales al cliente.