Gestire cluster Apache Hadoop in HDInsight tramite il portale di Azure
Usando il portale di Azure, è possibile gestire i cluster Apache Hadoop in Azure HDInsight. Usare il selettore di tabulazioni per informazioni sulla gestione dei cluster Hadoop in HDInsight usando altri strumenti.
Prerequisiti
Un cluster Apache Hadoop esistente in HDInsight. Per altre informazioni, vedere Creare cluster basati su Linux in HDInsight usando il portale di Azure.
Operazioni preliminari
Accedere al portale.
Elencare e visualizzare i cluster
I cluster esistenti vengono visualizzati nella pagina Cluster HDInsight. Dal portale:
- Nel menu a sinistra selezionare Tutti i servizi.
- In ANALISI selezionare Cluster HDInsight.
Home page del cluster
Nella pagina Cluster HDInsight selezionare il nome del cluster. Si apre il riquadro Panoramica e ha un aspetto simile all'immagine seguente.
Menu in alto
Articolo | Descrizione |
---|---|
Sposta | sposta il cluster in una sottoscrizione o un gruppo di risorse diverso. |
CANC | elimina il cluster. |
Aggiorna | Aggiorna la vista. |
Menu sinistro
Il menu a sinistra include più sezioni.
Menu in alto a sinistra
Articolo | Descrizione |
---|---|
Sintesi | Fornire informazioni generali per il cluster. |
Log attività | visualizza i log attività e consente di eseguire query. |
Controllo di accesso (IAM) | usa le assegnazioni di ruolo. Vedere Assegnare ruoli di Azure per gestire l'accesso alle risorse della sottoscrizione di Azure. |
Tag | Impostare coppie chiave/valore per definire una tassonomia personalizzata dei servizi cloud. Ad esempio, è possibile creare una chiave denominata project e quindi usare un valore comune per tutti i servizi associati a un progetto specifico. |
Diagnostica e risoluzione dei problemi | visualizza informazioni sulla risoluzione dei problemi. |
Guida introduttiva | Visualizzare informazioni utili per iniziare a usare HDInsight. |
Strumenti | Informazioni della Guida per gli strumenti correlati a HDInsight. |
Menu Impostazioni
Articolo | Descrizione |
---|---|
Dimensione del cluster | consente di verificare, aumentare e ridurre il numero di nodi di ruolo di lavoro del cluster. Vedere Ridimensionare i cluster. |
Limiti di quota | visualizza i core usati e disponibili per la sottoscrizione. |
SSH + Account di accesso al cluster | Visualizzare le istruzioni per connettersi al cluster usando una connessione Secure Shell (SSH). Per altre informazioni, vedere l'articolo su come usare SSH con HDInsight. |
Azure Data Lake Storage Gen2 | Configurare l'accesso a Data Lake Storage Gen2. Vedere Guida introduttiva: impostare i cluster in HDInsight. |
Account di archiviazione | visualizza gli account di archiviazione e le chiavi. Gli account di archiviazione vengono configurati durante il processo di creazione dei cluster. |
Applicazioni | Aggiungere o rimuovere applicazioni HDInsight. Vedere Installare applicazioni HDInsight personalizzate. |
Azioni script | esegue script Bash nel cluster. Vedere Personalizzare cluster HDInsight basati su Linux tramite Azione script. |
Metastore esterni | visualizza i metastore Apache Hive e Apache Oozie. È possibile configurare i metastore solo durante il processo di creazione del cluster. |
Partner HDInsight | Aggiungere o rimuovere il partner HDInsight corrente. |
Proprietà | visualizza le proprietà del cluster. |
Locks | Aggiungere un blocco per impedire che il cluster venga modificato o eliminato. |
Esportare il modello | visualizza ed esporta il modello di Azure Resource Manager per il cluster. Attualmente, è possibile esportare solo l'account Archiviazione di Azure dipendente. Vedere Creare cluster Apache Hadoop basati su Linux in HDInsight usando i modelli di Azure Resource Manager. |
Menu Monitoraggio
Articolo | Descrizione |
---|---|
Avvisi | gestisce gli avvisi e le azioni. |
Metriche | Monitorare le metriche del cluster nei log di Monitoraggio di Azure. |
Impostazioni di diagnosi | Impostare la posizione in cui archiviare le metriche di diagnosi. |
Monitoraggio di Azure | Monitorare il cluster in Monitoraggio di Azure. |
Menu Supporto e risoluzione dei problemi
Articolo | Descrizione |
---|---|
Integrità delle risorse | vedere Panoramica di Integrità risorse di Azure. |
Nuova richiesta di supporto | Creare un ticket di supporto con supporto tecnico Microsoft. |
Proprietà del cluster
Nella home page del cluster, in Impostazioni selezionare Proprietà.
Articolo | Descrizione |
---|---|
HOSTNAME | Nome del cluster. |
CLUSTER URL | URL per l'interfaccia Web Ambari. |
Endpoint privato | Endpoint privato per il cluster. |
Secure Shell | Nome utente e nome host da usare per accedere al cluster tramite SSH. |
STATO | Uno di Aborted, Accepted, ClusterStorageProvisioned, AzureVMConfiguration, HDInsightConfiguration, Operational, Running, Error, Deleted, Timeout, DeleteQueued, DeleteTimeout, DeleteError, PatchQueued, CertRolloverQueued, ResizeQueued o ClusterCustomization. |
REGIONE | località di Azure. Per un elenco delle località di Azure supportate, vedere l'elenco a discesa Area nei prezzi di HDInsight. |
DATA CREAZIONE | data di distribuzione del cluster. |
SISTEMA OPERATIVO | può essere Windows o Linux. |
TYPE | Hadoop, HBase o Spark. |
Versione | Vedere Versioni di HDInsight. |
Versione minima di TLS | Versione tls (Transport Layer Security). |
ABBONAMENTO | nome della sottoscrizione. |
ORIGINE DATI PREDEFINITA | file system predefinito del cluster. |
Dimensioni dei nodi di lavoro | Dimensioni della macchina virtuale (VM) selezionate dei nodi di lavoro. |
Dimensioni del nodo head | dimensioni selezionate dei nodi head nella macchina virtuale. |
Rete virtuale | Nome della rete virtuale, in cui viene distribuito il cluster, se selezionato in fase di distribuzione. |
Spostare cluster
È possibile spostare un cluster HDInsight in un altro gruppo di risorse di Azure o in un'altra sottoscrizione.
Nella home page del cluster:
Nel menu in alto selezionare Sposta.
Selezionare Sposta in un altro gruppo di risorse o Sposta in un'altra sottoscrizione.
Seguire le istruzioni nella nuova pagina.
Eliminare cluster
L'eliminazione di un cluster non elimina l'account di archiviazione predefinito o gli account di archiviazione collegati. È possibile ricreare il cluster usando gli stessi account di archiviazione e gli stessi metastore. È consigliabile usare un nuovo contenitore BLOB predefinito quando si ricrea il cluster.
Nella home page del cluster:
- Nel menu in alto selezionare Elimina.
- Seguire le istruzioni nella nuova pagina.
Per altre informazioni, vedere Sospendere o arrestare i cluster.
Aggiungere altri account di archiviazione
È possibile aggiungere altri account Archiviazione di Azure e account di Azure Data Lake Storage dopo la creazione di un cluster. Per altre informazioni, vedere Aggiungere altri account di archiviazione a HDInsight.
Ridimensionare i cluster
È possibile usare la funzionalità di ridimensionamento del cluster per modificare il numero di nodi di lavoro usati da un cluster HDInsight, senza dover ricreare il cluster.
Per altre informazioni, vedere Ridimensionare i cluster HDInsight.
Sospendere o arrestare i cluster
La maggior parte dei processi Hadoop sono processi batch eseguiti solo occasionalmente. Per la maggior parte dei cluster Hadoop, esistono lunghi periodi di tempo in cui il cluster non viene usato per l'elaborazione. Con HDInsight, i dati vengono archiviati in Archiviazione di Azure ed è possibile eliminare tranquillamente un cluster quando non è in uso. Vengono addebitati i costi anche per i cluster HDInsight che non sono in uso. Poiché gli addebiti per il cluster sono molte volte più degli addebiti per l'archiviazione, è opportuno eliminare i cluster quando non sono in uso.
È possibile programmare il processo in molti modi. Puoi usare:
- Azure Data Factory: vedere Creare cluster Apache Hadoop basati su Linux su richiesta in HDInsight usando Azure Data Factory per la creazione di servizi collegati HDInsight su richiesta.
- Azure PowerShell: vedere Analizzare i dati sui ritardi dei voli.
- Interfaccia della riga di comando di Azure: vedere Gestire i cluster Azure HDInsight usando l'interfaccia della riga di comando di Azure.
- HDInsight .NET SDK: vedere Inviare processi Apache Hadoop.
Per informazioni sui prezzi, vedere Prezzi di HDInsight. Per eliminare un cluster dal portale, vedere Eliminare i cluster.
Aggiornare i cluster
Per altre informazioni, vedere Aggiornare un cluster HDInsight a una versione più recente.
Aprire l'interfaccia utente Web di Apache Ambari
Ambari offre un'interfaccia utente Web di gestione hadoop intuitiva e facile da usare supportata dalle API RESTful. Con Ambari, gli amministratori di sistema possono gestire e monitorare i cluster Hadoop.
Nella home page del cluster:
Selezionare Dashboard cluster.
Nella nuova pagina selezionare Home di Ambari.
Immettere il nome utente e la password del cluster. Il nome utente predefinito del cluster è admin.
Per altre informazioni, vedere Gestire i cluster HDInsight usando l'interfaccia utente Web di Apache Ambari.
Modificare le password
Per un cluster HDInsight possono esistere due account utente. L'account utente del cluster HDInsight (account utente HTTP) e l'account utente SSH vengono creati durante il processo di creazione. È possibile usare il portale per modificare la password dell'account utente del cluster e usare azioni script per modificare l'account utente SSH.
Modificare la password utente del cluster
Nota
La modifica della password dell'utente del cluster (amministratore) potrebbe causare l'esito negativo delle azioni script eseguite su questo cluster. Se sono presenti azioni script persistenti destinate ai nodi di lavoro, questi script potrebbero non riuscire quando si aggiungono nodi al cluster tramite operazioni di ridimensionamento. Per altre informazioni sulle azioni script, vedere Personalizzare i cluster HDInsight usando azioni script.
Nella home page del cluster:
- In Impostazioni selezionare SSH + Accesso al cluster.
- Selezionare Reimposta credenziali.
- Immettere e confermare una nuova password nelle caselle di testo.
- Seleziona OK.
La password cambia in tutti i nodi del cluster.
Modificare la password utente SSH o la chiave pubblica
Usare un editor di testo per salvare il testo seguente come file denominato
changecredentials.sh
.Importante
È necessario utilizzare un editor che usa
LF
come fine riga. Se l'editor usaCRLF
, lo script non funziona.#! /bin/bash USER=$1 PASS=$2 usermod --password $(echo $PASS | openssl passwd -1 -stdin) $USER
Caricare il file in un percorso di archiviazione a cui è possibile accedere da HDInsight usando un indirizzo HTTP o HTTPS. Un esempio è un archivio file pubblico, ad esempio OneDrive o Archiviazione BLOB di Azure. Salvare l'URI (indirizzo HTTP o HTTPS) nel file. L'URI è necessario nel passaggio successivo.
Nella home page del cluster, in Impostazioni selezionare Azioni script.
Nella pagina Azioni script selezionare Invia nuovo.
Nella pagina Invia azione script immettere le informazioni nella tabella seguente.
Nota
Le password SSH non possono contenere i caratteri seguenti: " ' ' / \ < % ~ | $ & ! #
Campo valore Tipo di script Selezionare - Personalizzato nell'elenco a discesa. Nome "Modificare le credenziali SSH". Bash script URI URI del changecredentials.sh
file.Tipi di nodo: Head, Worker, Nimbus, Supervisor o ZooKeeper Selezionare ✓ per tutti i tipi di nodo elencati. Parametri Immettere il nome utente SSH e quindi immettere la nuova password. Deve essere presente un solo spazio tra il nome utente e la password. Rendere persistente l'azione script ... Lasciare il campo deselezionato. Selezionare Crea per applicare lo script. Al termine dello script, è possibile connettersi al cluster usando SSH con le nuove credenziali.
Trovare l'ID sottoscrizione
Ogni cluster è associato a una sottoscrizione di Azure. L'ID sottoscrizione di Azure è visibile nella home page del cluster.
Trovare il gruppo di risorse
Nella modalità Resource Manager ogni cluster HDInsight viene creato con un gruppo di Resource Manager. Il gruppo di Resource Manager è visibile nella home page del cluster.
Trovare gli account di archiviazione
I cluster HDInsight usano un account Archiviazione di Azure o Data Lake Storage per archiviare i dati. Ogni cluster HDInsight può avere un account di archiviazione predefinito e molti account di archiviazione collegati. Per elencare gli account di archiviazione, nella home page del cluster, in Impostazioni selezionare Account di archiviazione.
Monitorare i processi
Per altre informazioni, vedere Gestire i cluster HDInsight usando l'interfaccia utente Web di Apache Ambari.
Dimensione del cluster
Il riquadro Dimensioni cluster nella home page del cluster visualizza il numero di core allocati a questo cluster e il modo in cui vengono allocati per i nodi all'interno di questo cluster.
Importante
Per monitorare i servizi forniti dal cluster HDInsight, è necessario usare l'interfaccia utente Web di Ambari o l'API REST Ambari. Per altre informazioni sull'uso di Ambari, vedere Gestire cluster HDInsight con Apache Ambari.
Connettersi a un cluster
Contenuto correlato
In questo articolo si sono apprese alcune funzioni amministrative di base. Per ulteriori informazioni, vedere gli articoli seguenti:
- Amministrare HDInsight con Azure PowerShell
- Amministrare HDInsight usando l'interfaccia della riga di comando di Azure
- Creare cluster HDInsight
- Uso dell'API REST Apache Ambari
- Usare Apache Hive in HDInsight
- Usare Apache Sqoop in HDInsight
- Usare funzioni definite dall'utente Python con Apache Hive e Apache Pig in HDInsight
- Versione di Apache Hadoop inclusa in Azure HDInsight