Verwalten von Apache Hadoop-Clustern in HDInsight mit dem Azure-Portal
Mit dem Azure-Portal können Sie Apache Hadoop-Cluster in Azure HDInsight verwalten. Rufen Sie über die Registerkartenauswahl Informationen zum Verwalten von Hadoop-Clustern in HDInsight mit anderen Tools ab.
Voraussetzungen
Ein vorhandener Apache Hadoop-Cluster in HDInsight. Weitere Informationen finden Sie unter Erstellen von Linux-basierten Clustern in HDInsight mithilfe des Azure-Portals.
Erste Schritte
Melden Sie sich bei https://portal.azure.com an.
Auflisten und Anzeigen von Clustern
Auf der Seite HDInsight-Cluster werden Ihre vorhandenen Cluster aufgeführt. Im Portal:
- Wählen Sie im Menü links Alle Dienste aus.
- Wählen Sie unter ANALYSEN die Option HDInsight-Cluster aus.
Cluster-Homepage
Wählen Sie auf der Seite HDInsight-Cluster den Namen Ihres Clusters aus. Dadurch wird die Ansicht Übersicht geöffnet, die der folgenden Abbildung ähnelt:
Obere Menüleiste:
Element | BESCHREIBUNG |
---|---|
Move | Verschiebt den Cluster in eine andere Ressourcengruppe oder ein anderes Abonnement. |
Löschen | Löscht den Cluster. |
Aktualisieren | Aktualisiert die Sicht. |
Menü auf der linken Seite:
Obere linke Menüleiste:
Element BESCHREIBUNG Übersicht Gibt allgemeine Informationen zu Ihrem Cluster an. Aktivitätsprotokoll Dient zum Anzeigen und Abfragen von Aktivitätsprotokollen. Zugriffssteuerung (IAM) Verwenden Sie Rollenzuweisungen. Weitere Informationen finden Sie unter Zuweisen von Azure-Rollen zum Verwalten des Zugriffs auf Ihre Azure-Abonnementressourcen. `Tags` Dient zum Festlegen von Schlüssel-Wert-Paaren, um eine benutzerdefinierte Taxonomie für Ihre Clouddienste zu definieren. Sie können z. B. einen Schlüssel mit dem Namen Projekt erstellen und dann einen gemeinsamen Wert für alle mit einem bestimmten Projekt verknüpften Dienste verwenden. Diagnose und Problembehandlung Dient zum Anzeigen von Informationen zur Problembehandlung. Schnellstart Zeigt hilfreiche Informationen für die ersten Schritte mit HDInsight an. Tools Hilfeinformationen für HDInsight-bezogene Tools. Menü „Einstellungen“
Element BESCHREIBUNG Clustergröße Dient zum Überprüfen, Erhöhen und Verringern der Anzahl von Workerknoten im Cluster. Weitere Informationen finden Sie unter Skalieren von Clustern. Kontingentgrenzen Dient zum Anzeigen der verwendeten und verfügbaren Kernspeicher für Ihr Abonnement. SSH + Clusteranmeldung Zeigt die Anweisungen für die Verbindung mit dem Cluster über eine Secure Shell-Verbindung (SSH) an. Weitere Informationen finden Sie unter Verwenden von SSH mit Linux-basiertem Hadoop in HDInsight unter Linux, Unix oder OS X. Data Lake Storage Gen2 Konfigurieren von Zugriff auf Data Lake Storage Gen2 Weitere Informationen finden Sie unter Schnellstart: Einrichten von Clustern in HDInsight. Speicherkonten Dient zum Anzeigen der Speicherkonten und Schlüssel. Die Speicherkonten werden während der Clustererstellung konfiguriert. Anwendungen Dient zum Hinzufügen und Entfernen von HDInsight-Anwendungen. Weitere Informationen finden Sie unter Installieren benutzerdefinierter HDInsight-Anwendungen. Skriptaktionen Dienst zum Anwenden von Bashskripts auf den Cluster. Weitere Informationen finden Sie unter Anpassen Linux-basierter HDInsight-Cluster mithilfe von Skriptaktionen. Externe Metastores Anzeigen der Metastores für Apache Hive und Apache Oozie. Die Metastores können nur während der Clustererstellung konfiguriert werden. HDInsight-Partner Dient zum Hinzufügen/Entfernen des aktuellen HDInsight-Partners. Eigenschaften Dient zum Anzeigen der Clustereigenschaften. Locks Dient zum Hinzufügen einer Sperre, um zu verhindern, dass der Cluster geändert oder gelöscht wird. Exportieren der Vorlage Dient zum Anzeigen und Exportieren der Azure Resource Manager-Vorlage für den Cluster. Derzeit können Sie nur das abhängige Azure-Speicherkonto exportieren. Weitere Informationen finden Sie unter Erstellen Linux-basierter Apache Hadoop-Cluster in HDInsight mithilfe von Azure Resource Manager-Vorlagen. Menü „Überwachung“
Element BESCHREIBUNG Alerts Dient zum Verwalten der Warnungen und Aktionen. Metriken Überwacht die Clustermetriken in Azure Monitor-Protokollen. Diagnoseeinstellungen Einstellungen zum Speicherort der Diagnosemetriken. Azure Monitor Überwacht Ihre Cluster in Azure Monitor. Menü „Support und Problembehandlung“
Element BESCHREIBUNG Ressourcenintegrität Weitere Informationen finden Sie unter Übersicht über Azure Resource Health. Neue Supportanfrage Ermöglicht die Erstellung eines Supporttickets für den Microsoft-Support.
Eigenschaften des Clusters
Wählen Sie auf der Cluster-Homepage unter Einstellungen die Option Eigenschaften aus.
Element | BESCHREIBUNG |
---|---|
HOSTNAME | Clustername. |
CLUSTER URL | Dies ist die URL für die Ambari-Weboberfläche. |
Privater Endpunkt | Der private Endpunkt für den Cluster. |
Secure Shell (SSH) | Der Benutzername und der Hostname für den Zugriff auf den Cluster über SSH. |
STATUS | Eine der folgenden: Aborted, Accepted, ClusterStorageProvisioned, AzureVMConfiguration, HDInsightConfiguration, Operational, Running, Error, Deleting, Deleted, Timeout, DeleteQueued, DeleteTimeout, DeleteError, PatchQueued, CertRolloverQueued, ResizeQueued oder ClusterCustomization. |
REGION | Azure-Standort. Eine Liste der unterstützten Azure-Standorte finden Sie im Dropdownlistenfeld Region unter HDInsight-Preise. |
DATE CREATED | Das Datum der Clusterbereitstellung. |
OPERATING SYSTEM | Entweder Windows oder Linux. |
TYPE | Hadoop, HBase, Spark. |
Version | Siehe HDInsight-Versionen. |
TLS-Mindestversion | Die TLS-Version. |
SUBSCRIPTION | Abonnementname. |
DEFAULT DATA SOURCE | Das Standardcluster-Dateisystem. |
Workerknotengrößen | Die ausgewählte VM-Größe des Workerknotens. |
Hauptknotengröße | Die ausgewählte VM-Größe der Hauptknoten. |
Virtuelles Netzwerk | Der Name des virtuellen Netzwerks, für das der Cluster bereitgestellt wird, wenn eines zum Zeitpunkt der Bereitstellung ausgewählt wurde. |
Verschieben von Clustern
Sie können einen HDInsight-Cluster in eine andere Azure-Ressourcengruppe oder ein anderes Abonnement verschieben.
Auf der Startseite des Clusters:
- Wählen Sie auf der oberen Menüleiste Verschieben aus.
- Wählen Sie In eine andere Ressourcengruppe verschieben oder In ein anderes Abonnement verschieben aus.
- Befolgen Sie die Anweisungen auf der neuen Seite.
Löschen von Clustern
Wenn Sie einen Cluster löschen, werden dadurch weder das Standardspeicherkonto noch die verknüpften Speicherkonten gelöscht. Sie können den Cluster mit den gleichen Speicherkonten und den gleichen Metastores neu erstellen. Sie sollten einen neuen Standardblobcontainer verwenden, wenn Sie den Cluster neu erstellen.
Auf der Startseite des Clusters:
- Klicken Sie auf der oberen Menüleiste auf Löschen.
- Befolgen Sie die Anweisungen auf der neuen Seite.
Siehe auch Anhalten/Herunterfahren von Clustern.
Hinzufügen weiterer Speicherkonten
Nachdem ein Cluster erstellt wurde, können Sie weitere Azure-Speicherkonten und Azure Data Lake Storage-Konten hinzufügen. Weitere Informationen finden Sie unter Hinzufügen zusätzlicher Speicherkonten zu HDInsight.
Skalieren von Clustern
Mithilfe der Clusterskalierung können Sie die Anzahl der von einem Azure HDInsight-Cluster verwendeten Workerknoten ändern, ohne den Cluster neu erstellen zu müssen.
Weitere Informationen finden Sie unter Skalieren von HDInsight-Clustern.
Anhalten/Herunterfahren von Clustern
Die meisten Hadoop-Aufträge sind Batchaufträge, die nur gelegentlich ausgeführt werden. Bei den meisten Hadoop-Clustern gibt es immer wieder längere Phasen, in denen der Cluster nicht für die Verarbeitung genutzt wird. Mit HDInsight werden Ihre Daten in Azure Storage gespeichert, sodass Sie einen Cluster problemlos löschen können, wenn er nicht verwendet wird. Für einen HDInsight-Cluster fallen auch dann Gebühren an, wenn er nicht verwendet wird. Da die Gebühren für den Cluster erheblich höher sind als die Kosten für den Speicher, ist es sinnvoll, nicht verwendete Cluster zu löschen.
Es gibt viele Methoden, mit denen Sie den Prozess programmieren können:
- Verwenden Sie Azure Data Factory. Informationen zum Erstellen bedarfsgesteuerter verknüpfter HDInsight-Dienste finden Sie unter Erstellen von bedarfsgesteuerten Linux-basierten Apache Hadoop-Clustern in HDInsight mit Azure Data Factory.
- Verwenden Sie Azure PowerShell. Weitere Informationen hierzu finden Sie unter Analysieren von Flugverspätungsdaten mit Hive in HDInsight.
- Verwenden Sie die Azure-Befehlszeilenschnittstelle. Weitere Informationen finden Sie unter Verwalten von Azure HDInsight-Clustern mit der Azure-Befehlszeilenschnittstelle.
- Verwenden das Sie HDInsight .NET-SDK. Weitere Informationen finden Sie unter Übermitteln von Apache Hadoop-Aufträgen.
Die Preisinformationen finden Sie unter HDInsight Preise. Informationen zum Löschen eines Clusters aus dem Portal finden Sie unter Löschen von Clustern
Aktualisieren von Clustern
Informationen finden Sie unter Aktualisieren eines HDInsight-Clusters auf eine neuere Version.
Öffnen der Apache Ambari-Webbenutzeroberfläche
Ambari bietet eine intuitive, einfach zu bedienende Webbenutzeroberfläche für die Hadoop-Verwaltung, gesichert durch die RESTful-APIs. Mit Ambari können Systemadministratoren Hadoop-Cluster verwalten und überwachen.
Auf der Startseite des Clusters:
Wählen Sie Clusterdashboards aus.
Wählen Sie auf der neuen Seite die Ambari-Homepage aus.
Geben Sie den Benutzernamen und das Kennwort für den Cluster ein. Der Standardbenutzername für den Cluster lautet admin.
Weitere Informationen finden Sie unter Verwalten von HDInsight-Clustern mithilfe der Apache Ambari-Webbenutzeroberfläche.
Ändern von Kennwörtern
Ein HDInsight-Cluster kann über zwei Benutzerkonten verfügen. Das HDInsight-Clusterbenutzerkonto (auch HTTP-Benutzerkonto genannt) und das SSH-Benutzerkonto werden während des Erstellungsprozesses erstellt. Sie können das Portal verwenden, um das Kennwort für das Clusterbenutzerkonto zu ändern, und Skriptaktionen, um das SSH-Benutzerkonto zu ändern.
Ändern des Clusterbenutzerkennworts
Hinweis
Wenn Sie das Kennwort für den Clusterbenutzer (Admin) ändern, können Skriptaktionen, die für diesen Cluster ausgeführt werden, möglicherweise fehlschlagen. Wenn Sie Skriptaktionen beibehalten möchten, deren Ziel Workerknoten sind, können diese Skripts fehlschlagen, sobald Sie dem Cluster über eine Größenänderung Knoten hinzufügen. Weitere Informationen zu Skriptaktionen finden Sie unter Anpassen von HDInsight-Clustern mithilfe von Skriptaktionen.
Auf der Startseite des Clusters:
- Wählen Sie unter Einstellungen die Option SSH + Clusteranmeldung aus.
- Wählen Sie Anmeldeinformation zurücksetzen aus.
- Geben Sie in die Textfelder das neue Kennwort ein, und bestätigen Sie dieses.
- Klicken Sie auf OK.
Das Kennwort wird auf allen Knoten im Cluster geändert.
Ändern des SSH-Benutzerkennworts oder des öffentlichen Schlüssels
Speichern Sie den folgenden Text mit einem Text-Editor als Datei namens changecredentials.sh.
Wichtig
Sie müssen einen Editor verwenden, der „LF“ als Zeilenende verwendet. Wenn der Editor „CRLF“ verwendet, funktioniert das Skript nicht.
#! /bin/bash USER=$1 PASS=$2 usermod --password $(echo $PASS | openssl passwd -1 -stdin) $USER
Laden Sie die Datei an einen Speicherort hoch, auf den von HDInsight über eine HTTP- oder HTTPS-Adresse zugegriffen werden kann. Verwenden Sie z.B. einen öffentlichen Dateispeicher wie OneDrive oder Azure Blob Storage. Speichern Sie den URI (HTTP- oder HTTPS-Adresse) in der Datei, da dieser URI im nächsten Schritt benötigt wird.
Wählen Sie auf der Startseite des Clusters unter Einstellungen die Option Skriptaktionen aus.
Wählen Sie auf der Seite Skriptaktionen die Option + Neue übermitteln aus.
Geben Sie auf der Seite Skriptaktion übermitteln die folgenden Informationen ein:
Hinweis
Folgende Zeichen dürfen in den SSH-Kennwörtern nicht verwendet werden:
" ' ` / \ < % ~ | $ & ! #
Feld | Wert |
---|---|
Skripttyp | Wählen Sie in der Dropdownliste – Benutzerdefiniert aus. |
Name | "Change ssh credentials" |
Bash-Skript-URI | Der URI der Datei „changecredentials.sh“ |
Knotentyp(en): (Hauptknoten, Worker, Nimbus, Supervisor oder Zookeeper.) | ✓ für alle aufgeführten Knotentypen |
Parameter | Geben Sie den SSH-Benutzernamen und dann das neue Kennwort ein. Es muss ein Leerzeichen zwischen den Benutzernamen und das Kennwort eingefügt werden. |
Speichern Sie diese Skriptaktion ... | Lassen Sie dieses Feld deaktiviert. |
- Wählen Sie Erstellen aus, um das Skript anzuwenden. Nachdem das Skript ausgeführt wurde, können Sie per SSH mit den neuen Anmeldeinformationen eine Verbindung mit dem Cluster herstellen.
Ermitteln der Abonnement-ID
Jeder Cluster ist mit einem Azure-Abonnement verknüpft. Sie können die Azure-Abonnement-ID auf der Cluster-Homepage einsehen.
Suchen der Ressourcengruppe
Im Azure Resource Manager-Modus wird jeder HDInsight-Cluster mit einer Azure Resource Manager-Gruppe erstellt. Sie können die Gruppe „Resource Manager“ auf der Cluster-Homepage einsehen.
Suchen der Speicherkonten
HDInsight-Cluster verwenden zum Speichern von Daten entweder ein Azure-Speicherkonto oder Azure Data Lake Storage. Jeder HDInsight-Cluster kann ein Standardspeicherkonto und eine Reihe von verknüpften Speicherkonten enthalten. Wählen Sie zum Auflisten der Speicherkonten auf der Startseite des Clusters unter Einstellungen die Option Speicherkonten aus.
Überwachen von Aufträgen
Weitere Informationen finden Sie unter Verwalten von HDInsight-Clustern mithilfe der Apache Ambari-Webbenutzeroberfläche.
Clustergröße
Die Kachel Clustergröße auf der Startseite des Clusters zeigt die Anzahl von Kernen, die diesem Cluster zugewiesen sind, sowie die Zuordnung für die Knoten innerhalb des Clusters an.
Wichtig
Um die vom HDInsight-Cluster bereitgestellten Dienste zu überwachen, müssen Sie Ambari Web oder die Ambari-REST-API verwenden. Weitere Informationen zur Verwendung von Ambari finden Sie unter Verwalten von HDInsight-Clustern mit Apache Ambari.
Herstellen der Verbindung zu einem Cluster
Nächste Schritte
In diesem Artikel haben Sie einige grundlegende administrative Funktionen kennengelernt. Weitere Informationen erhalten Sie in den folgenden Artikeln:
- Verwalten von HDInsight mit Azure PowerShell
- Verwalten von HDInsight mit der Azure-CLI
- Erstellen von Hadoop-Clustern in HDInsight
- Verwenden der Apache Ambari-REST-API
- Verwenden von Apache Hive in HDInsight
- Verwenden von Apache Sqoop in HDInsight
- Verwenden benutzerdefinierter Python-Funktionen mit Apache Hive und Apache Pig in HDInsight
- Welche Apache Hadoop-Version wird in Azure HDInsight verwendet?