Compartilhar via


O que é o Trino? (Visualização)

Observação

Desativaremos o Microsoft Azure HDInsight no AKS em 31 de janeiro de 2025. Para evitar o encerramento abrupto das suas cargas de trabalho, você precisará migrá-las para o Microsoft Fabric ou para um produto equivalente do Azure antes de 31 de janeiro de 2025. Os clusters restantes em sua assinatura serão interrompidos e removidos do host.

Somente o suporte básico estará disponível até a data de desativação.

Importante

Esse recurso está atualmente na visualização. Os Termos de uso complementares para versões prévias do Microsoft Azure incluem mais termos legais que se aplicam aos recursos do Azure que estão em versão beta, em versão prévia ou ainda não lançados em disponibilidade geral. Para obter informações sobre essa versão prévia específica, confira Informações sobre a versão prévia do Azure HDInsight no AKS. Caso tenha perguntas ou sugestões de recursos, envie uma solicitação no AskHDInsight com os detalhes e siga-nos para ver mais atualizações sobre a Comunidade do Azure HDInsight.

O Trino (anteriormente PrestoSQL) é um mecanismo de consulta SQL distribuído de software livre para análise federada e interativa em fontes de dados heterogêneas. Ele pode consultar dados em escala (gigabytes a petabytes) de várias fontes para habilitar a análise em toda a empresa.

O Trino é usado para uma ampla gama de casos de uso analítico e é uma excelente opção para consultas interativas e consultas ad hoc.

Alguns dos principais recursos que o Trino oferece –

  • Um sistema multilocatário adaptável capaz de executar simultaneamente centenas de consultas de memória, E/S e CPU intensivas e dimensionar para milhares de nós de trabalho, utilizando com eficiência os recursos do cluster.
  • Design extensível e federado para reduzir a complexidade da integração de vários sistemas.
  • Alto desempenho, com vários recursos e otimizações relacionados importantes.
  • Totalmente compatível com o ecossistema do Hadoop.

Há dois tipos de servidores do Trino: coordenadores e de trabalho.

Coordenador

O coordenador do Trino é o servidor responsável por analisar instruções, planejar consultas e gerenciar nós de trabalho do Trino. Ele é o "cérebro" de uma instalação do Trino e também é o nó ao qual um cliente se conecta para enviar instruções para execução. O coordenador controla a atividade em cada trabalho e coordena a execução de uma consulta. O coordenador cria um modelo lógico de uma consulta, que envolve uma série de estágios e é convertido em uma série de tarefas conectadas executadas em um cluster de trabalho do Trino.

Trabalho

Um servidor de trabalho do Trino é um servidor em uma instalação do Trino, que é responsável por executar tarefas e processar dados. Nós de trabalho buscam dados de conectores e trocam dados intermediários entre si. O coordenador é responsável por buscar resultados dos trabalhos e retornar os resultados finais para o cliente.

Diagrama mostrando a arquitetura do Trino.