Oefening: HDInsight inrichten om ad-hocanalyses uit te voeren

Voltooid

Nu we weten wat de voordelen van Interactive Query zijn en hoe het werkt, is het tijd om resources te implementeren om ons vastgoeddashboard te bouwen.

Voordat u een Interactive Query-cluster maakt

Voordat u een cluster kunt maken, hebt u een Azure-abonnement en een Azure-opslagaccount nodig. Azure Storage is een robuuste opslagoplossing voor algemeen gebruik die naadloos kan worden geïntegreerd met HDInsight. HDInsight kan een blobcontainer in Azure Storage gebruiken als het standaardbestandssysteem voor het cluster. Het is raadzaam om afzonderlijke opslagcontainers te gebruiken voor uw standaardclusteropslag en uw bedrijfsgegevens om de HDInsight-logboeken en tijdelijke bestanden te isoleren van uw eigen bedrijfsgegevens.

Interactive Query kan ook Gebruikmaken van Azure Data Lake Storage Gen1 of Azure Data Lake Storage Gen2, zoals beschreven in module 1: Hoe werkt HDInsight, maar alleen Azure Storage en Azure Data Lake Storage Gen2 ondersteunen Hive LLAP. Deze procedure maakt gebruik van Azure Storage.

Waar kan ik een Interactive Query-cluster maken?

Zodra u zeker weet dat een Interactive Query-cluster het beste clustertype voor uw oplossing is, kunt u de clusters op een aantal plaatsen maken: Azure Portal, Azure CLI, Azure PowerShell, cURL, Azure Resource Manager-sjablonen, de HDInsight .NET SDK en u kunt zelfs Azure Data Factory gebruiken om clusters op aanvraag te maken. In deze procedure wordt Azure Portal gebruikt om een Interactive Query-cluster te implementeren.

Een opslagaccount inrichten in Azure Portal

De eerste resource die moet worden geïmplementeerd, moet u er nog geen hebben, is een Azure Storage-account.

  1. Meld u aan bij Azure Portal met uw gratis abonnement.

  2. Klik op Een opslagaccount > voor een resource > maken.

    Een HDInsight Interactive Query-oplossing maken in Azure Portal.

  3. Vul op de pagina Basisinformatie de volgende waarden in:

    • Abonnement: Zorg ervoor dat uw gratis abonnement is geselecteerd.
    • Resourcegroep: Klik op Nieuwe maken en geef deze de naam hdinsightmodule6uid, waarbij uid een unieke id voor u is.
    • Naam van opslagaccount: Voer hdinsightmodule6uid in.
    • Locatie: Selecteer de locatie die zich het dichtst bij uw gebruikers bevindt om de latentie te verminderen. Let op deze regio omdat u het HDInsight-cluster in dezelfde regio maakt.
    • Prestaties: laat de standaardwaarde van Standard staan.
    • Soort account: laat de standaardwaarde voor StorageV2 staan (algemeen gebruik v2)
    • Replicatie: wijzig de waarde in lokaal redundante opslag (LRS)
    • Toegangslaag (standaard): laat de standaardwaarde Dynamisch staan.
  4. Klik op Volgende: Netwerken.

    Het tabblad Basisbeginselen van HDInsight in Azure Portal.

  5. Laat op de pagina Netwerken de connectiviteitsmethode van het openbare eindpunt (alle netwerken) staan en klik vervolgens op Volgende: Geavanceerd>.

    HdInsight-netwerktabblad in Azure Portal.

  6. Vul op de pagina Geavanceerd de volgende waarden in:

    • Beveiliging: laat de standaardwaarde Ingeschakeld staan.
    • Azure Files: laat de standaardwaarde uitgeschakeld
    • Gegevensbeveiliging: laat de standaardwaarde uitgeschakeld.
    • Data Lake Storage Gen2: laat de standaardwaarde Uitgeschakeld staan om een Blob Storage-account te maken en klik vervolgens op Controleren en maken >.
  7. Controleer op de pagina Opslagaccount maken of het accounttype is ingesteld op StorageV2 (algemeen gebruik v2) en klik vervolgens op Maken.

    HdInsight-controlescherm in Azure Portal.

  8. Wanneer de implementatie is voltooid, wordt het volgende bericht weergegeven:

    Schermopname van de overzichtspagina van het Microsoft Storage-account, waarin staat dat uw implementatie is voltooid.

Nu uw opslagaccount is gemaakt, is het tijd om de HDInsight Interactive Query-clusters te implementeren.

Een HDInsight Interactive Query-cluster inrichten

  1. Klik op Een resourceanalyse > > maken in Azure HDInsight.

    Schermopname van Azure Portal met Een resource, Analyse en Azure H D Insight maken gemarkeerd.

  2. Klik op de pagina Basisbeginselen op Ga naar de klassieke ervaring voor maken.

    Schermopname van de pagina Basisinformatie met Go naar de klassieke ervaring voor maken gemarkeerd.

  3. Klik op de pagina HDInsight op Aangepast (grootte, instellingen, apps).

    Schermopname van de pagina H D Insight met Aangepast gemarkeerd.

  4. Vul op de pagina Basisinformatie de volgende waarden in:

    • Clusternaam: Voer een unieke naam in voor het cluster, zoals mslearnmodule6uid. Er verschijnt een groen vinkje naast de naam als de clusternaam is gevalideerd en beschikbaar is.
    • Abonnement: Zorg ervoor dat uw gratis abonnement is geselecteerd.
    • Clustertype: Klik op Vereiste instellingen configureren en selecteer vervolgens in het vak Clustertype interactieve query en selecteer in het vak Versie interactive Query 3.1.0 (HDI 4.0).
    • Gebruikersnaam voor clusteraanmelding: laat de standaardwaarde van de beheerder staan
    • Wachtwoord voor clusteraanmelding: voer een wachtwoord in voor clusteraanmelding.
    • SSH-gebruikersnaam (Secure Shell): laat de standaardwaarde van sshuser staan.
    • Resourcegroep: Selecteer de resourcegroep die u eerder hebt gemaakt, mslearnmodule6yourid.
    • Locatie: Selecteer dezelfde regio waarin uw opslagaccount is gemaakt.
  5. Klik vervolgens op Volgende.

    Schermopname van de pagina's H D Insight, Basisinformatie en Clusterconfiguratie met meerdere velden gemarkeerd.

  6. Klik op de pagina Beveiliging en netwerken op Volgende.

  7. Vul op de pagina Opslag de volgende waarden in:

    • Primair opslagtype: Zorg ervoor dat de standaardwaarde van Azure Storage is geselecteerd.
    • Selecteer een opslagaccount en klik op Vereiste instellingen configureren.
    • Zoek op de pagina Opslagaccounts naar de naam van het opslagaccount dat u hebt gemaakt, mslearnmodule6uid en selecteer het.
  8. Laat alle andere waarden op de standaardwaarde staan en klik vervolgens op Volgende.

    De opslagpagina in Azure Portal.

  9. Klik op de pagina Toepassingen (optioneel) op Volgende.

  10. Klik op de pagina Clusterformaat op Volgende.

  11. Klik op de pagina Scriptacties op Optioneel en klik vervolgens op Nieuw verzenden.

  12. Vul op de pagina Scriptactie verzenden de volgende waarden in:

  13. Klik vervolgens op Maken.

    De pagina scriptacties in Azure Portal.

  14. Nadat de validatie is voltooid op de pagina Scriptacties, klikt u op Selecteren en vervolgens op Volgende.

  15. Controleer op de overzichtspagina van het cluster, nadat de validatie is voltooid, of het clustertype is ingesteld op Interactive Query 3.1 (HDI 4.0) en klik vervolgens op Maken.

    De overzichtspagina van HDInsight in Azure Portal.

  16. Klik op het meldingspictogram om de voortgang van de implementatie te bekijken.

    De melding dat de implementatie wordt uitgevoerd in Azure Portal.

    Wanneer de implementatie is geslaagd, is het bericht gewijzigd in Implementatie.

  17. Klik op Ga naar de resource in het deelvenster Meldingen.

    Het scherm HDInsight-implementatie is voltooid in Azure Portal.

  18. De overzichtspagina voor het HDInsight-cluster wordt weergegeven. Deze bevat informatie over uw cluster en bevat koppelingen naar nuttige hulpprogramma's en rapporten. U kunt deze resource toevoegen aan uw dashboard door op de knop Vastmaken te klikken.

    Het overzichtsscherm van HDInsight in Azure Portal.