O que é Trino? (Versão prévia)
Importante
O Azure HDInsight no AKS se aposentou em 31 de janeiro de 2025. Saiba mais sobre com este anúncio.
Você precisa migrar suas cargas de trabalho para microsoft fabric ou um produto equivalente do Azure para evitar o encerramento abrupto de suas cargas de trabalho.
Importante
Esse recurso está atualmente em versão prévia. Os termos de uso complementares para o Microsoft Azure Previews incluem mais termos legais que se aplicam aos recursos do Azure que estão em versão beta, em versão prévia ou ainda não lançados em disponibilidade geral. Para obter informações sobre essa versão prévia específica, consulte Azure HDInsight em informações de visualização do AKS. Para perguntas ou sugestões de recursos, envie uma solicitação em AskHDInsight com os detalhes e siga-nos para mais atualizações na Comunidade do Azure HDInsight .
do Trino (anteriormente PrestoSQL) é um mecanismo de consulta SQL distribuído de software livre para análise federada e interativa contra fontes de dados heterogêneas. Ele pode consultar dados em escala (gigabytes a petabytes) de várias fontes para permitir a análise empresarial abrangente.
O Trino é usado para uma ampla gama de casos de uso analítico e é uma excelente opção para consultas interativas e ad hoc.
Alguns dos principais recursos que o Trino oferece –
- Um sistema multilocatário adaptável capaz de executar simultaneamente centenas de consultas intensivas em memória, E/S e CPU e capaz de dimensionar para milhares de nós de trabalho, utilizando eficientemente os recursos do cluster.
- Design extensível e federado para reduzir a complexidade da integração de vários sistemas.
- Alto desempenho, com vários importantes recursos e otimizações relacionados.
- Totalmente compatível com o ecossistema do Hadoop.
Há dois tipos de servidores Trino: coordenadores e trabalhadores.
Coordenador
O coordenador do Trino é o servidor responsável por analisar instruções, planejar consultas e gerenciar nós de trabalho do Trino. É o "cérebro" de uma instalação do Trino e também é o nó ao qual um cliente se conecta para enviar instruções para execução. O coordenador acompanha a atividade de cada trabalhador e coordena a execução de uma consulta. O coordenador cria um modelo lógico de uma consulta, que envolve uma série de estágios, que é convertido em uma série de tarefas conectadas executadas em um cluster de trabalhos do Trino.
Trabalhador
Um trabalhador do Trino é um servidor em uma instalação do Trino, que é responsável por executar tarefas e processar dados. Nodos de trabalho buscam dados de conectores de dados e trocam dados intermediários entre si. O coordenador é responsável por coletar os resultados dos trabalhadores e retornar os resultados finais ao cliente.