Oefening: HDInsight inrichten om ad-hocanalyses uit te voeren
Nu we weten wat de voordelen van Interactive Query zijn en hoe het werkt, is het tijd om resources te implementeren om ons vastgoeddashboard te bouwen.
Voordat u een Interactive Query-cluster maakt
Voordat u een cluster kunt maken, hebt u een Azure-abonnement en een Azure-opslagaccount nodig. Azure Storage is een robuuste opslagoplossing voor algemeen gebruik die naadloos kan worden geïntegreerd met HDInsight. HDInsight kan een blobcontainer in Azure Storage gebruiken als het standaardbestandssysteem voor het cluster. Het is raadzaam om afzonderlijke opslagcontainers te gebruiken voor uw standaardclusteropslag en uw bedrijfsgegevens om de HDInsight-logboeken en tijdelijke bestanden te isoleren van uw eigen bedrijfsgegevens.
Interactive Query kan ook Gebruikmaken van Azure Data Lake Storage Gen1 of Azure Data Lake Storage Gen2, zoals beschreven in module 1: Hoe werkt HDInsight, maar alleen Azure Storage en Azure Data Lake Storage Gen2 ondersteunen Hive LLAP. Deze procedure maakt gebruik van Azure Storage.
Waar kan ik een Interactive Query-cluster maken?
Zodra u zeker weet dat een Interactive Query-cluster het beste clustertype voor uw oplossing is, kunt u de clusters op een aantal plaatsen maken: Azure Portal, Azure CLI, Azure PowerShell, cURL, Azure Resource Manager-sjablonen, de HDInsight .NET SDK en u kunt zelfs Azure Data Factory gebruiken om clusters op aanvraag te maken. In deze procedure wordt Azure Portal gebruikt om een Interactive Query-cluster te implementeren.
Een opslagaccount inrichten in Azure Portal
De eerste resource die moet worden geïmplementeerd, moet u er nog geen hebben, is een Azure Storage-account.
Meld u aan bij Azure Portal met uw gratis abonnement.
Klik op Een opslagaccount > voor een resource > maken.
Vul op de pagina Basisinformatie de volgende waarden in:
- Abonnement: Zorg ervoor dat uw gratis abonnement is geselecteerd.
- Resourcegroep: Klik op Nieuwe maken en geef deze de naam hdinsightmodule6uid, waarbij uid een unieke id voor u is.
- Naam van opslagaccount: Voer hdinsightmodule6uid in.
- Locatie: Selecteer de locatie die zich het dichtst bij uw gebruikers bevindt om de latentie te verminderen. Let op deze regio omdat u het HDInsight-cluster in dezelfde regio maakt.
- Prestaties: laat de standaardwaarde van Standard staan.
- Soort account: laat de standaardwaarde voor StorageV2 staan (algemeen gebruik v2)
- Replicatie: wijzig de waarde in lokaal redundante opslag (LRS)
- Toegangslaag (standaard): laat de standaardwaarde Dynamisch staan.
Klik op Volgende: Netwerken.
Laat op de pagina Netwerken de connectiviteitsmethode van het openbare eindpunt (alle netwerken) staan en klik vervolgens op Volgende: Geavanceerd>.
Vul op de pagina Geavanceerd de volgende waarden in:
- Beveiliging: laat de standaardwaarde Ingeschakeld staan.
- Azure Files: laat de standaardwaarde uitgeschakeld
- Gegevensbeveiliging: laat de standaardwaarde uitgeschakeld.
- Data Lake Storage Gen2: laat de standaardwaarde Uitgeschakeld staan om een Blob Storage-account te maken en klik vervolgens op Controleren en maken >.
Controleer op de pagina Opslagaccount maken of het accounttype is ingesteld op StorageV2 (algemeen gebruik v2) en klik vervolgens op Maken.
Wanneer de implementatie is voltooid, wordt het volgende bericht weergegeven:
Nu uw opslagaccount is gemaakt, is het tijd om de HDInsight Interactive Query-clusters te implementeren.
Een HDInsight Interactive Query-cluster inrichten
Klik op Een resourceanalyse > > maken in Azure HDInsight.
Klik op de pagina Basisbeginselen op Ga naar de klassieke ervaring voor maken.
Klik op de pagina HDInsight op Aangepast (grootte, instellingen, apps).
Vul op de pagina Basisinformatie de volgende waarden in:
- Clusternaam: Voer een unieke naam in voor het cluster, zoals mslearnmodule6uid. Er verschijnt een groen vinkje naast de naam als de clusternaam is gevalideerd en beschikbaar is.
- Abonnement: Zorg ervoor dat uw gratis abonnement is geselecteerd.
- Clustertype: Klik op Vereiste instellingen configureren en selecteer vervolgens in het vak Clustertype interactieve query en selecteer in het vak Versie interactive Query 3.1.0 (HDI 4.0).
- Gebruikersnaam voor clusteraanmelding: laat de standaardwaarde van de beheerder staan
- Wachtwoord voor clusteraanmelding: voer een wachtwoord in voor clusteraanmelding.
- SSH-gebruikersnaam (Secure Shell): laat de standaardwaarde van sshuser staan.
- Resourcegroep: Selecteer de resourcegroep die u eerder hebt gemaakt, mslearnmodule6yourid.
- Locatie: Selecteer dezelfde regio waarin uw opslagaccount is gemaakt.
Klik vervolgens op Volgende.
Klik op de pagina Beveiliging en netwerken op Volgende.
Vul op de pagina Opslag de volgende waarden in:
- Primair opslagtype: Zorg ervoor dat de standaardwaarde van Azure Storage is geselecteerd.
- Selecteer een opslagaccount en klik op Vereiste instellingen configureren.
- Zoek op de pagina Opslagaccounts naar de naam van het opslagaccount dat u hebt gemaakt, mslearnmodule6uid en selecteer het.
Laat alle andere waarden op de standaardwaarde staan en klik vervolgens op Volgende.
Klik op de pagina Toepassingen (optioneel) op Volgende.
Klik op de pagina Clusterformaat op Volgende.
Klik op de pagina Scriptacties op Optioneel en klik vervolgens op Nieuw verzenden.
Vul op de pagina Scriptactie verzenden de volgende waarden in:
- Scripttype: Selecteer Aangepast.
- Naam: Voer mslearnmodule6 in
- Bash-script-URI: Enter https://hdiconfigactions.blob.core.windows.net/dasinstaller/LaunchDASInstaller.sh
- Type knooppunt: Selecteer Hoofd.
Klik vervolgens op Maken.
Nadat de validatie is voltooid op de pagina Scriptacties, klikt u op Selecteren en vervolgens op Volgende.
Controleer op de overzichtspagina van het cluster, nadat de validatie is voltooid, of het clustertype is ingesteld op Interactive Query 3.1 (HDI 4.0) en klik vervolgens op Maken.
Klik op het meldingspictogram om de voortgang van de implementatie te bekijken.
Wanneer de implementatie is geslaagd, is het bericht gewijzigd in Implementatie.
Klik op Ga naar de resource in het deelvenster Meldingen.
De overzichtspagina voor het HDInsight-cluster wordt weergegeven. Deze bevat informatie over uw cluster en bevat koppelingen naar nuttige hulpprogramma's en rapporten. U kunt deze resource toevoegen aan uw dashboard door op de knop Vastmaken te klikken.