Esercizio - Effettuare il provisioning di HDInsight per eseguire analisi ad hoc

Completato

Ora che sappiamo quali sono i vantaggi di Interactive Query e come funziona, è il momento di iniziare a distribuire le risorse per creare il dashboard immobiliare.

Prima di creare un cluster Interactive Query

Prima di poter creare un cluster, è necessario disporre di una sottoscrizione di Azure e un account di archiviazione di Azure. Archiviazione di Azure è una soluzione di archiviazione affidabile di utilizzo generico che si integra perfettamente con HDInsight. HDInsight può usare un contenitore BLOB in Archiviazione di Azure come file system predefinito per il cluster. Si consiglia di usare contenitori di archiviazione distinti per l'archiviazione del cluster predefinita e i dati aziendali, in modo da isolare i log di HDInsight e i file temporanei dai dati aziendali.

Interactive Query può anche usare Azure Data Lake Storage Gen1 o Azure Data Lake Storage Gen2, come illustrato nel Modulo 1, Funzionamento di HDInsight. Tuttavia, solo Archiviazione di Azure e Azure Data Lake Storage Gen2 supportano Hive LLAP. Questa procedura usa Archiviazione di Azure.

Dove creare un cluster Interactive Query

Quando si è certi che un cluster Interactive Query sia il tipo di cluster migliore per la soluzione, è possibile creare i cluster in diverse posizioni: portale di Azure, interfaccia della riga di comando di Azure, Azure PowerShell, cURL, modelli di Azure Resource Manager, HDInsight .NET SDK ed è anche possibile usare Azure Data Factory per creare cluster su richiesta. Questa procedura usa il portale di Azure per distribuire un cluster Interactive Query.

Effettuare il provisioning di un account di archiviazione nel portale di Azure

La prima risorsa da distribuire, se non se ne possiede già uno, è un account di Archiviazione di Azure.

  1. Accedere al portale di Azure usando la sottoscrizione gratuita.

  2. Fare clic su Crea una risorsa > Archiviazione > Account di archiviazione.

    Creazione di una soluzione HDInsight Interactive Query nel portale di Azure.

  3. Nella pagina Informazioni di base immettere i valori seguenti:

    • Sottoscrizione: verificare che sia selezionata la sottoscrizione gratuita.
    • Gruppo di risorse: fare clic su Crea nuovo e denominarlo hdinsightmodule6uid, dove UID è un identificatore univoco.
    • Nome dell'account di archiviazione: immettere hdinsightmodule6uid.
    • Posizione: selezionare la posizione più vicina agli utenti per ridurre la latenza. Prendere nota di questa area, poiché in essa verrà anche creato il cluster HDInsight.
    • Prestazioni: lasciare il valore predefinito Standard.
    • Tipo di account: lasciare il valore predefinito StorageV2 (utilizzo generico v2)
    • Replica: modificare il valore in Archiviazione con ridondanza locale
    • Livello di accesso (impostazione predefinita): lasciare il valore predefinito Accesso frequente.
  4. Fare clic su Avanti: Rete.

    Scheda Nozioni di base di HDInsight nel portale di Azure.

  5. Nella pagina Rete lasciare il metodo di connettività Endpoint pubblico (tutte le reti) e quindi fare clic su Avanti: Avanzate >.

    Scheda Rete di HDInsight nel portale di Azure.

  6. Nella pagina Avanzate immettere i valori seguenti:

    • Sicurezza: lasciare il valore predefinito Abilitato.
    • File di Azure: lasciare il valore predefinito Disabilitato
    • Protezione dati: lasciare il valore predefinito Disabilitato.
    • Data Lake storage Gen2: lasciare il valore predefinito Disabilitato per creare un account di archivio BLOB e quindi fare clic su Rivedi e crea >.
  7. Nella pagina Crea account di archiviazione, verificare che il tipo di account sia impostato su StorageV2 (utilizzo generico v2), quindi fare clic su Crea.

    Schermata di revisione di HDInsight nel portale di Azure.

  8. Una volta completata la distribuzione, viene visualizzato il messaggio seguente:

    Screenshot che mostra la pagina di panoramica dell'account di archiviazione Microsoft, che indica che la distribuzione è stata completata.

Ora che l'account di archiviazione è stato creato, è possibile distribuire i cluster HDInsight Interactive Query.

Effettuare il provisioning di un cluster HDInsight Interactive Query

  1. Fare clic su Crea una risorsa > Analisi > Azure HDInsight.

    Screenshot che mostra il portale di Azure con Creare una risorsa, Analisi e Azure HDInsight evidenziati.

  2. Nella pagina Nozioni di base fare clic su Passa all'esperienza di creazione classica.

    Screenshot che mostra la pagina Informazioni di base con Passa all'esperienza di creazione classica evidenziato.

  3. Nella pagina HDInsight selezionare Personalizzate (dimensioni, impostazioni, app).

    Screenshot che mostra la pagina HDInsight con Personalizzato evidenziato.

  4. Nella pagina Informazioni di base immettere i valori seguenti:

    • Nome del cluster: immettere un nome univoco per il cluster, ad esempio mslearnmodule6uid. Se il nome del cluster è stato convalidato ed è disponibile, viene visualizzato un segno di spunta verde accanto al nome.
    • Sottoscrizione: verificare che sia selezionata la sottoscrizione gratuita.
    • Tipo di cluster: fare clic su Configura le impostazioni obbligatorie, quindi, nella casella Tipo di cluster selezionare Query interattiva e nella casella Versione selezionare Interactive Query 3.1.0 (HDI 4.0).
    • Nome utente dell'account di accesso del cluster: lasciare il valore predefinito Amministratore
    • Password dell'account di accesso del cluster: immettere una password per l'accesso al cluster.
    • Nome utente Secure Shell (SSH): lasciare il valore predefinito sshuser.
    • Gruppo di risorse: selezionare il gruppo di risorse creato in precedenza, mslearnmodule6yourid.
    • Posizione: selezionare la stessa area in cui è stato creato l'account di archiviazione.
  5. Infine, fare clic su Avanti.

    Screenshot che mostra le pagine di configurazione HDInsight, Informazioni di base e Cluster con più campi evidenziati.

  6. Nella pagina Sicurezza + rete fare clic su Avanti.

  7. Nella pagina Archiviazione immettere i valori seguenti:

    • Tipo di archiviazione primario: assicurarsi che sia selezionato il valore predefinito di Archiviazione di Azure.
    • Selezionare un Account di archiviazione e fare clic su Configura le impostazioni obbligatorie.
    • Nella pagina Account di archiviazione, cercare il nome dell'account di archiviazione creato, mslearnmodule6uid, e selezionarlo.
  8. Mantenere l'impostazione predefinita per tutti gli altri valori, quindi fare clic su Avanti.

    Pagina Archiviazione nel portale di Azure.

  9. Nella pagina Applicazioni (facoltativo) fare clic su Avanti.

  10. Nella pagina Dimensioni del clic fare clic su Avanti.

  11. Nella pagina di azione Script fare clic su Facoltativo e quindi su Invia nuovo.

  12. Nella pagina Invia azione script compilare i valori seguenti:

  13. Infine, fare clic su Crea.

    Pagina Azioni script nel portale di Azure.

  14. Al termine della convalida nella pagina Azioni script fare clic su Seleziona e quindi su Avanti.

  15. Al termine della convalida, nella pagina Riepilogo del cluster, verificare che il tipo di cluster sia impostato su Interactive Query 3.1 (HDI 4.0), quindi fare clic su Crea.

    Pagina di riepilogo di HDInsight nel portale di Azure.

  16. Fare clic sull'icona di notifica per controllare lo stato di avanzamento della distribuzione.

    Notifica di distribuzione in corso nel portale di Azure.

    Al termine della distribuzione, viene visualizzato un messaggio per segnalare che la distribuzione è riuscita.

  17. Fare clic su Vai alla risorsa nel riquadro Notifiche.

    Schermata di distribuzione riuscita di HDInsight nel portale di Azure.

  18. Viene visualizzata la pagina Panoramica per il cluster HDInsight, che contiene informazioni sul cluster e presenta collegamenti a strumenti e report utili. È possibile aggiungere questa risorsa al dashboard facendo clic sul pulsante Aggiungi.

    Schermata di panoramica di HDInsight nel portale di Azure.