Co to jest Trino? (Wersja zapoznawcza)
Ważny
Usługa Azure HDInsight w usłudze AKS została wycofana 31 stycznia 2025 r. Dowiedz się więcej dzięki tej informacji.
Aby uniknąć nagłego kończenia obciążeń, należy przeprowadzić migrację obciążeń do usługi Microsoft Fabric lub równoważnego produktu platformy Azure.
Ważny
Ta funkcja jest obecnie dostępna w wersji zapoznawczej. Dodatkowe warunki użytkowania dla wersji zapoznawczych Microsoft Azure zawierają więcej warunków prawnych dotyczących funkcji Azure, które są w wersji beta, w wersji zapoznawczej lub nie są jeszcze dostępne ogólnie. Aby uzyskać informacje o tej konkretnej wersji zapoznawczej, zobacz sekcję Azure HDInsight na AKS w informacjach o wersji zapoznawczej. W przypadku pytań lub sugestii dotyczących funkcji, prześlij żądanie na AskHDInsight z szczegółami i śledź nas, aby uzyskać więcej aktualizacji na społeczności Azure HDInsight.
Trino (dawniej PrestoSQL) to rozproszony aparat zapytań SQL typu open source do analizy federacyjnej i interaktywnej dla heterogenicznych źródeł danych. Umożliwia wykonywanie zapytań dotyczących danych na dużą skalę (gigabajtów do petabajtów) z wielu źródeł w celu umożliwienia analizy w całym przedsiębiorstwie.
Trino jest używany do szerokiej gamy analitycznych przypadków użycia i jest doskonałym wyborem do interakcyjnych i ad hoc zapytań.
Niektóre z kluczowych funkcji oferowanych przez Trino —
- Adaptacyjny system wielodostępny zdolny do równoczesnego uruchamiania setek zapytań intensywnie korzystających z pamięci, operacji we/wy oraz z procesora CPU, który może skalować się do tysięcy węzłów roboczych, jednocześnie zapewniając wydajne wykorzystanie zasobów klastra.
- Rozszerzalny i federacyjny projekt, aby zmniejszyć złożoność integrowania wielu systemów.
- Wysoka wydajność z kilkoma kluczowymi funkcjami i optymalizacjami.
- W pełni zgodne z ekosystemem usługi Hadoop.
Istnieją dwa typy serwerów Trino: koordynatorzy i pracownicy.
Koordynator
Koordynator Trino jest serwerem odpowiedzialnym za analizowanie instrukcji, planowanie zapytań i zarządzanie węzłami procesu roboczego Trino. Jest to "mózg" instalacji Trino, a także węzeł, z którym klient łączy się z przesyłaniem instrukcji do wykonania. Koordynator śledzi aktywność każdego pracownika i koordynuje proces wykonywania zapytania. Koordynator tworzy logiczny model zapytania, który obejmuje szereg etapów, które są tłumaczone na serię połączonych zadań uruchamianych w klastrze procesów roboczych Trino.
Robotnik
Element roboczy Trino to serwer w instalacji Trino, który jest odpowiedzialny za wykonywanie zadań i przetwarzanie danych. Węzły robocze pobierają dane z łączników i wymieniają ze sobą dane pośrednie. Koordynator jest odpowiedzialny za pobieranie wyników od pracowników i zwracanie końcowych wyników do klienta.