Övning – Etablera HDInsight för att utföra adhoc-analys

Slutförd

Nu när vi vet om fördelarna med Interaktiv fråga och hur det fungerar är det dags att börja distribuera resurser för att skapa vår instrumentpanel för fastigheter.

Innan du skapar ett Interaktiv fråga kluster

Innan du kan skapa ett kluster behöver du en Azure-prenumeration och ett Azure Storage-konto. Azure Storage är en robust lagringslösning för generell användning som integreras sömlöst med HDInsight. HDInsight kan använda en blobcontainer i Azure Storage som standardfilsystem för klustret. Vi rekommenderar att du använder separata lagringscontainrar för din standardklusterlagring och dina affärsdata för att isolera HDInsight-loggarna och temporära filer från dina egna affärsdata.

Interaktiv fråga kan också använda Azure Data Lake Storage Gen1 eller Azure Data Lake Storage Gen2 enligt beskrivningen i modul 1: Hur fungerar HDInsight, men endast Azure Storage och Azure Data Lake Storage Gen2 stöder Hive LLAP. Den här proceduren använder Azure Storage.

Var du kan skapa ett Interaktiv fråga kluster

När du är säker på att ett Interaktiv fråga kluster är den bästa klustertypen för din lösning kan du skapa klustren på flera platser: Azure Portal, Azure CLI, Azure PowerShell, cURL, Azure Resource Manager-mallar, HDInsight .NET SDK och du kan till och med använda Azure Data Factory för att skapa kluster på begäran. Den här proceduren använder Azure Portal för att distribuera ett Interaktiv fråga kluster.

Etablera ett lagringskonto i Azure Portal

Den första resursen som ska distribueras, om du inte redan har en, är ett Azure Storage-konto.

  1. Logga in på Azure Portal med din kostnadsfria prenumeration.

  2. Klicka på Skapa ett lagringskonto> för resurs>.

    Skapa en HDInsight-Interaktiv fråga lösning i Azure Portal.

  3. På sidan Grundläggande fyller du i följande värden:

    • Prenumeration: Se till att din kostnadsfria prenumeration är vald.
    • Resursgrupp: Klicka på Skapa ny och ge den namnet hdinsightmodule6uid, där uid är en unik identifierare åt dig.
    • Lagringskontonamn: Ange hdinsightmodule6uid.
    • Plats: Välj den plats som är närmast användarna för att minska svarstiden. Observera den här regionen eftersom du skapar HDInsight-klustret i samma region.
    • Prestanda: Lämna standardvärdet Standard.
    • Kontotyp: Lämna standardvärdet StorageV2 (generell användning v2)
    • Replikering: Ändra värdet till Lokalt redundant lagring (LRS)
    • Åtkomstnivå (standard): Lämna standardvärdet Frekvent.
  4. Klicka på Nästa: Nätverk.

    Fliken grundläggande HDInsight i Azure Portal.

  5. På sidan Nätverk lämnar du anslutningsmetoden för offentlig slutpunkt (alla nätverk) och klickar sedan på Nästa: Avancerat >.

    FLIKEN HDInsight-nätverk i Azure Portal.

  6. På sidan Avancerat fyller du i följande värden:

    • Säkerhet: Lämna standardvärdet Aktiverad.
    • Azure Files: Lämna standardvärdet Inaktiverat
    • Dataskydd: Lämna standardvärdet Inaktiverat.
    • Data Lake Storage Gen2: Lämna standardvärdet Inaktiverad för att skapa ett Blob Storage-konto och klicka sedan på Granska + skapa >.
  7. På sidan Skapa lagringskonto kontrollerar du att kontotyp är inställd på StorageV2 (generell användning v2) och klickar sedan på Skapa.

    HDInsight-granskningsskärmen i Azure Portal.

  8. När distributionen är klar visas följande meddelande:

    Skärmbild som visar översiktssidan för Microsoft Storage-kontot som anger att distributionen är klar.

Nu när lagringskontot har skapats är det dags att distribuera HDInsight-Interaktiv fråga kluster.

Etablera ett HDInsight-Interaktiv fråga kluster

  1. Klicka på Skapa en resursanalys > > i Azure HDInsight.

    Skärmbild som visar Azure Portal med Skapa en resurs, Analys och Azure H D Insight markerat.

  2. På sidan Grundinställningar klickar du på Gå till den klassiska skapa-upplevelsen.

    Skärmbild som visar sidan Grundläggande med Go to classic create experience markerat.

  3. På sidan HDInsight klickar du på Anpassad (storlek, inställningar, appar).

    Skärmbild som visar sidan H D Insight med Anpassad markerad.

  4. På sidan Grundläggande fyller du i följande värden:

    • Klusternamn: Ange ett unikt namn för klustret, till exempel mslearnmodule6uid. En grön bock visas bredvid namnet om klusternamnet har verifierats och är tillgängligt.
    • Prenumeration: Se till att din kostnadsfria prenumeration är vald.
    • Klustertyp: Klicka på Konfigurera nödvändiga inställningar och välj sedan Interaktiv fråga i rutan Version och välj sedan Interaktiv fråga 3.1.0 (HDI 4.0).
    • Användarnamn för klusterinloggning: Lämna standardvärdet administratör
    • Lösenord för klusterinloggning: Ange ett lösenord för klusterinloggning.
    • Secure Shell-användarnamn (SSH): Låt standardvärdet för sshuser vara kvar.
    • Resursgrupp: Välj den resursgrupp som du skapade tidigare, mslearnmodule6yourid.
    • Plats: Välj samma region där ditt lagringskonto skapades.
  5. Klicka sedan på Nästa.

    Skärmbild som visar konfigurationssidorna H D Insight, Basics och Cluster med flera fält markerade.

  6. På sidan Säkerhet + nätverk klickar du på Nästa.

  7. Fyll i följande värden på sidan Lagring:

    • Primär lagringstyp: Kontrollera att standardvärdet för Azure Storage är valt.
    • Välj ett lagringskonto och klicka på Konfigurera nödvändiga inställningar.
    • På sidan Lagringskonton söker du efter namnet på lagringskontot du skapade, mslearnmodule6uid och väljer det.
  8. Lämna alla andra värden som standard och klicka sedan på Nästa.

    Lagringssidan i Azure Portal.

  9. På sidan Program (valfritt) klickar du på Nästa.

  10. På sidan Klusterstorlek klickar du på Nästa.

  11. På sidan Skriptåtgärder klickar du på Valfritt och klickar sedan på Skicka nytt.

  12. På sidan Skicka skriptåtgärd fyller du i följande värden:

  13. Klicka sedan på Skapa.

    Sidan skriptåtgärder i Azure Portal.

  14. När verifieringen har slutförts på sidan Skriptåtgärder klickar du på Välj och klickar sedan på Nästa.

  15. När verifieringen har slutförts på sidan Klustersammanfattning kontrollerar du att klustertypen är inställd på Interaktiv fråga 3.1 (HDI 4.0) och klickar sedan på Skapa.

    Sammanfattningssidan för HDInsight i Azure Portal.

  16. Klicka på meddelandeikonen för att se distributionens förlopp.

    Meddelandet om distribution pågår i Azure Portal.

    När distributionen lyckas ändras meddelandet till Distributionen lyckades.

  17. Klicka på Gå till resurs i fönstret Meddelanden.

    HDInsight-distributionen lyckades skärmen i Azure Portal.

  18. Sidan Översikt för HDInsight-klustret visas, som innehåller information om klustret och innehåller länkar till användbara verktyg och rapporter. Du kan lägga till den här resursen på instrumentpanelen genom att klicka på pin-knappen.

    HdInsight-översiktsskärmen i Azure Portal.