Che cos'è Trino? (Anteprima)
Importante
Azure HDInsight nel servizio Azure Kubernetes è stato ritirato il 31 gennaio 2025. Scopri di più con questo annuncio.
È necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare la chiusura brusca dei carichi di lavoro.
Importante
Questa funzionalità è attualmente in anteprima. Le condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure in versione beta, in anteprima o altrimenti non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguici per altri aggiornamenti su Community di Azure HDInsight.
Trino (in precedenza PrestoSQL) è un motore di query SQL distribuito open source per l'analisi federata e interattiva su origini dati eterogenee. Può interrogare dati a partire da più origini su larga scala (da gigabyte a petabyte) per consentire l'analisi a livello aziendale.
Trino viene usato per un'ampia gamma di casi d'uso analitici ed è un'ottima scelta per l'esecuzione di query interattive e ad hoc.
Alcune delle principali funzionalità offerte da Trino -
- Un sistema multi-tenant adattivo in grado di eseguire simultaneamente centinaia di query di memoria, I/O e con utilizzo intensivo della CPU e scalabilità in migliaia di nodi di lavoro usando in modo efficiente le risorse del cluster.
- Progettazione estendibile e federata per ridurre la complessità dell'integrazione di più sistemi.
- Prestazioni elevate, con diverse funzionalità e ottimizzazioni correlate chiave.
- Completamente compatibile con l'ecosistema Hadoop.
Esistono due tipi di server Trino: coordinatori e lavoratori.
Coordinatore
Il coordinatore Trino è il server responsabile dell'analisi delle istruzioni, della pianificazione delle query e della gestione dei nodi di lavoro Trino. È il "cervello" di un'installazione di Trino ed è anche il nodo a cui un client si connette per inviare istruzioni per l'esecuzione. Il coordinatore tiene traccia dell'attività di ciascun lavoratore e coordina l'esecuzione di una query. Il coordinatore crea un modello logico di una query, che comprende una serie di fasi e viene tradotto in una serie di attività connesse eseguite su un cluster di lavoratori Trino.
Lavoratore
Un worker Trino è un server in un'installazione di Trino, responsabile dell'esecuzione di attività e dell'elaborazione dei dati. I nodi di lavoro recuperano i dati dai connettori e scambiano dati intermedi tra loro. Il coordinatore è responsabile del recupero dei risultati dai lavoratori e della restituzione dei risultati finali al cliente.