Erstellen eines Trino-Clusters im Azure-Portal (Vorschau)
Wichtig
Azure HDInsight auf AKS wurde am 31. Januar 2025 eingestellt. Erfahren Sie mit dieser Ankündigung mehr über.
Sie müssen Ihre Workloads zu Microsoft Fabric oder ein gleichwertiges Azure-Produkt migrieren, um eine abrupte Beendigung Ihrer Workloads zu vermeiden.
Wichtig
Dieses Feature befindet sich derzeit in der Vorschau. Die zusätzlichen Nutzungsbedingungen für Microsoft Azure Previews weitere rechtliche Bestimmungen enthalten, die für Azure-Features gelten, die in der Betaversion, in der Vorschau oder auf andere Weise noch nicht in die allgemeine Verfügbarkeit veröffentlicht werden. Informationen zu dieser spezifischen Vorschau finden Sie unter Azure HDInsight auf AKS-Vorschauinformationen. Für Fragen oder Featurevorschläge, reichen Sie bitte eine Anfrage auf AskHDInsight mit den Details ein und folgen Sie uns für weitere Updates zur Azure HDInsight Community.
In diesem Artikel werden die Schritte zum Erstellen eines Trino-Clusters mit HDInsight auf AKS mithilfe des Azure-Portals beschrieben.
Voraussetzungen
Füllen Sie die Voraussetzungen in den folgenden Abschnitten aus:
Wichtig
Um einen Cluster in einem neuen Clusterpool zu erstellen, weisen Sie der AKS-Agentpool-MSI die Rolle des "Managed Identity Operator" auf der vom Benutzer zugewiesenen verwalteten Identität zu, die als Teil der Ressourcenvoraussetzungen erstellt wurde.
Die verwaltete Identität des AKS-Agentpools wird während der Erstellung des Clusterpools erstellt. Sie können die verwaltete Identität des AKS-Agentpools identifizieren. Dies geschieht über (Ihr Clusterpoolname)-agentpool. Führen Sie die folgenden Schritte aus, um die Rollezuzuweisen.
Erstellen eines Trino-Clusters
Nachdem die Bereitstellung des Clusterpools abgeschlossen ist, verwenden Sie weiterhin das Azure-Portal, um einen Trino-Cluster zu erstellen.
Geben Sie im Azure-Portal HDInsight-Clusterpools/HDInsight- ein, und wählen Sie Azure HDInsight für AKS-Clusterpools aus,, um zur Seite "Clusterpools" zu wechseln. Wählen Sie auf der Seite "HDInsight auf AKS-Clusterpools" den Clusterpool aus, in dem Sie einen neuen Trino-Cluster hinzufügen möchten.
Klicken Sie auf der Seite für einen bestimmten Clusterpool auf + Neuer Cluster oben links, und geben Sie dann die folgenden Informationen an:
Eigentum Beschreibung Abonnement Dieses Feld wird automatisch mit dem Azure-Abonnement aufgefüllt, das für den Clusterpool registriert wurde. Ressourcengruppe Dieses Feld wird automatisch aufgefüllt und zeigt die Ressourcengruppe im Clusterpool an. Region Dieses Feld wird automatisch aufgefüllt und zeigt die region an, die im Clusterpool ausgewählt ist. Clusterpool Dieses Feld wird automatisch aufgefüllt und zeigt den Namen des Clusterpools an, in dem der Cluster jetzt erstellt wird. Um einen Cluster in einem anderen Pool zu erstellen, suchen Sie diesen Clusterpool im Portal, und klicken Sie auf + Neuer Cluster. Cluster-Pool-Version Dieses Feld wird automatisch aufgefüllt und zeigt die Clusterpoolversion an, auf der der Cluster jetzt erstellt wird. HDInsight auf der AKS-Version Wählen Sie die Neben- oder Patchversion des HDInsight auf AKS des neuen Clusters aus. Weitere Informationen finden Sie in den Versionen . Clustertyp Wählen Sie in der Dropdownliste den Clustertyp als Trino aus. Clustername Geben Sie den Namen des neuen Clusters ein. Vom Benutzer zugewiesene verwaltete Identität Wählen Sie in der Dropdownliste die verwaltete Identität aus, die mit dem Cluster verwendet werden soll. Wenn Sie der Besitzer der Managed Service Identity (MSI) sind und die MSI nicht über die Rolle "Managed Identity Operator" im Cluster verfügt, klicken Sie auf den Link unterhalb des Felds, um die für den AKS-Agentpool-MSI erforderliche Berechtigung zuzuweisen. Wenn die MSI bereits über die richtigen Berechtigungen verfügt, wird kein Link angezeigt. Siehe die Voraussetzungen für andere Rollenzuweisungen, die für das MSI erforderlich sind. Virtuelles Netzwerk (VNet) Das virtuelle Netzwerk für den Cluster. sie wird vom Clusterpool abgeleitet. Subnetz Das virtuelle Subnetz für den Cluster. sie wird vom Clusterpool abgeleitet. Geben Sie für Hive-Katalogdie folgenden Informationen an:
Eigentum Beschreibung Verwenden des Hive-Katalogs Aktivieren Sie diese Option, um einen externen Hive-Metaspeicher zu verwenden. Name des Hive-Katalogs Geben Sie den Namen für den Hive-Katalog ein, der zu Trino-Katalogen hinzugefügt werden soll. SQL-Datenbank für Hive Wählen Sie in der Dropdownliste die SQL-Datenbank aus, zu der die Hive-Metastore-Tabellen hinzugefügt werden sollen. Weitere Anforderungen für SQL-Datenbank finden Sie unter Ressourcenvoraussetzungen. SQL-Administratorbenutzername Geben Sie den Benutzernamen des SQL Server-Administrators ein. Dieses Konto wird vom Metastore verwendet, um mit der SQL-Datenbank zu kommunizieren. Schlüsseltresor Wählen Sie in der Dropdownliste den Schlüsseltresor aus, der einen geheimen Schlüssel mit Kennwort für den Benutzernamen des SQL Server-Administrators enthält. Weitere Anforderungen für Key Vault finden Sie unter Ressourcenvoraussetzungen. SQL-Passwort-Geheimnisname Geben Sie den geheimen Namen aus dem Key Vault ein, in dem das SQL-Datenbankkennwort gespeichert ist. Standardspeicher für den Hive-Katalog Wählen Sie in der Dropdownliste das Standardspeicherkonto aus, das für den Hive-Katalog verwendet werden soll. Behälter Wählen Sie den vorhandenen Container im Standardspeicherkonto zum Speichern von Daten und Protokollen aus, oder erstellen Sie einen neuen Container. Anmerkung
- Derzeit unterstützen wir die Azure SQL-Datenbank als integrierten Metastore.
- Aufgrund der Hive-Einschränkung wird das Zeichen "-" (Bindestrich) im Metastore-Datenbanknamen nicht unterstützt.
Weitere Informationen finden Sie unter hive metastore.
Geben Sie für Speichern von Abfrageereignissendie folgenden Informationen an:
Eigentum Beschreibung Container für Ereignisse Wählen Sie den Namen des Containers im Standardspeicherkonto aus, um die Abfrageereignisse zu schreiben. Pfad im Container Stellen Sie vollqualifizierten Pfad im Container bereit, um die Abfrageereignisse zu schreiben. Hive-Katalogschema Geben Sie den Namen des Schemas ein, um Tabellen und Ansichten zum Lesen von Abfrageereignissen in diesem Hive-Katalog zu erstellen. Tage der Partitionsaufbewahrung Geben Sie den Aufbewahrungszeitraum (in Tagen) für Abfrageereignissepartitionen ein. Weitere Informationen finden Sie unter Protokollierung von Abfrageereignissen.
Klicken Sie auf Weiter: Konfiguration, um den Vorgang fortzusetzen.
Geben Sie auf der Seite Configuration die folgenden Informationen an:
Eigentum Beschreibung Größe des Kopfknotens Dieser Wert ist gleich der Größe des Arbeitsknotens. Anzahl der Kopfknoten Dieser Wert wird standardmäßig basierend auf dem Clustertyp festgelegt. Größe des Arbeitsknotens Wählen Sie in der Dropdownliste die empfohlene SKU aus, oder wählen Sie die in Ihrem Abonnement verfügbare SKU aus, indem Sie auf Größe des virtuellen Computers auswählenklicken. Anzahl der Arbeitsknoten Wählen Sie die Anzahl der Arbeitsknoten aus, die für Ihren Cluster erforderlich sind. Geben Sie für Autoscale- und SSH-die folgenden Informationen an:
Eigentum Beschreibung Automatische Skalierung Bei der Auswahl können Sie die zeitplanbasierte Autoskalierung auswählen, um den Zeitplan für Skalierungsvorgänge zu konfigurieren. Aktivieren von SSH Bei auswahl können Sie sich für die Gesamtanzahl der erforderlichen SSH-Knoten entscheiden, bei denen es sich um die Zugriffspunkte für die Trino CLI mit Secure Shell handelt. Die maximal zulässigen SSH-Knoten sind 5. Klicken Sie auf Weiter: Integrationen, um fortzufahren.
Geben Sie auf der Seite Integrationen die folgenden Informationen an:
Eigentum Beschreibung Protokollanalyse Dieses Feature ist nur verfügbar, wenn dem Clusterpool ein Log Analytics-Arbeitsbereich zugeordnet ist. Sobald es aktiviert ist, können die zu sammelnden Protokolle ausgewählt werden. Azure Prometheus Dieses Feature besteht darin, Insights und Protokolle direkt in Ihrem Cluster anzuzeigen, indem Metriken und Protokolle an den Azure Monitor-Arbeitsbereich gesendet werden. Klicken Sie auf Weiter: Tags, um fortzufahren.
Auf der Seite Tags geben Sie (optional) Tags ein, die Sie dem Cluster zuweisen möchten.
Eigentum Beschreibung Name Geben Sie einen Namen (Schlüssel) ein, der Ihnen hilft, Ressourcen basierend auf einstellungen zu identifizieren, die für Ihre Organisation relevant sind. Beispielsweise „Umgebung“, um die Bereitstellungsumgebung für Ihre Ressourcen nachzuverfolgen. Wert Geben Sie den Wert ein, der dabei hilft, die Ressourcen zuzuordnen. Beispielsweise "Produktion", um die für die Produktion bereitgestellten Ressourcen zu identifizieren. Ressource Wählen Sie den entsprechenden Ressourcentyp aus. Wählen Sie Weiter: Überprüfen Und erstellen Sie, um fortzufahren.
Suchen Sie auf der Seite Überprüfen und Erstellen nach der Nachricht Überprüfung erfolgreich abgeschlossen oben auf der Seite und klicken Sie dann auf Erstellen.
Die Bereitstellung wird Seite ausgeführt, auf der der Cluster erstellt wird. Es dauert 5 bis 10 Minuten, um den Cluster zu erstellen. Sobald der Cluster erstellt wurde, wird die Meldung "Ihre Bereitstellung ist abgeschlossen" angezeigt.
Wenn Sie von der Seite weg navigieren, können Sie den Status der Bereitstellung überprüfen, indem Sie auf das Symbol "Benachrichtigungen" klicken.
Tipp
Für die Problembehandlung bei Bereitstellungsfehlern können Sie diese Seitekonsultieren.