Gerenciar clusters do Apache Hadoop no Azure HDInsight usando o Azure PowerShell
Você pode usar o Azure PowerShell para controlar e automatizar a implantação e o gerenciamento de suas cargas de trabalho no Azure. Neste artigo, você aprenderá a gerenciar clusters do Apache Hadoop no Azure HDInsight usando o módulo do Az PowerShell. Para obter a lista de cmdlets do HDInsight PowerShell, consulte as Referência ao Az.HDInsight.
Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.
Pré-requisitos
Observação
Recomendamos que você use o módulo Az PowerShell do Azure para interagir com o Azure. Para começar, consulte Instalar o Azure PowerShell. Para saber como migrar para o módulo Az PowerShell, confira Migrar o Azure PowerShell do AzureRM para o Az.
O Módulo Az PowerShell instalado.
Criar clusters
Para criar clusters, consulte Criar clustes baseados em Linux no HDInsight usando o Azure PowerShell.
Listar clusters
Para listar todos os clusters na assinatura atual, use o seguinte comando:
Get-AzHDInsightCluster
Mostrar clusters
Para mostrar os detalhes de um cluster específico na assinatura atual, use o seguinte comando:
Get-AzHDInsightCluster -ClusterName <Cluster Name>
Excluir clusters
Para excluir um cluster, use o seguinte comando:
Remove-AzHDInsightCluster -ClusterName <Cluster Name>
Você também pode excluir um cluster removendo o grupo de recursos que contém o cluster. A exclusão de um grupo de recursos exclui todos os recursos no grupo, inclusive a conta de armazenamento padrão.
Remove-AzResourceGroup -Name <Resource Group Name>
Dimensionar clusters
Você pode usar o recurso de dimensionamento de clusters para alterar o número de nós de trabalho usados por um cluster em execução no HDInsight sem precisar recriar o cluster. Para alterar o tamanho do cluster do Hadoop usando o PowerShell, execute o seguinte comando em um computador cliente:
Set-AzHDInsightClusterSize -ClusterName <Cluster Name> -TargetInstanceCount <NewSize>
Para saber mais sobre dimensionamento de clusters, consulte Dimensionar os clusters do HDInsight.
Atualizar credenciais de usuário HTTP
O parâmetro Set-AzHDInsightGatewayCredential define as credenciais de HTTP do gateway de um cluster do HDInsight.
$clusterName = "CLUSTERNAME"
$credential = Get-Credential -Message "Enter the HTTP username and password:" -UserName "admin"
Set-AzHDInsightGatewayCredential -ClusterName $clusterName -HttpCredential $credential
Encontrar a conta de armazenamento padrão
O script do PowerShell a seguir demonstra como obter o nome da conta de armazenamento padrão e as informações relacionadas:
#Connect-AzAccount
$clusterName = "<HDInsight Cluster Name>"
$clusterInfo = Get-AzHDInsightCluster -ClusterName $clusterName
$storageInfo = $clusterInfo.DefaultStorageAccount.split('.')
$defaultStorageType = $storageInfo[1]
$defaultStorageName = $storageInfo[0]
echo "Default Storage account name: $defaultStorageName"
echo "Default Storage account type: $defaultStorageType"
if ($defaultStorageType -eq "blob")
{
$defaultBlobContainerName = $cluster.DefaultStorageContainer
$defaultStorageAccountKey = (Get-AzStorageAccountKey -ResourceGroupName $resourceGroupName -Name $defaultStorageAccountName)[0].Value
$defaultStorageAccountContext = New-AzStorageContext -StorageAccountName $defaultStorageAccountName -StorageAccountKey $defaultStorageAccountKey
echo "Default Blob container name: $defaultBlobContainerName"
echo "Default Storage account key: $defaultStorageAccountKey"
}
Encontrar o grupo de recursos
No modo Azure Resource Manager, cada cluster do HDInsight pertence a um grupo de recursos do Azure. Para localizar o grupo de recursos, use o seguinte comando:
$clusterName = "<HDInsight Cluster Name>"
$cluster = Get-AzHDInsightCluster -ClusterName $clusterName
$resourceGroupName = $cluster.ResourceGroup
Enviar trabalhos
Para usar os seguintes produtos para enviar trabalhos, siga as instruções nas referências:
- MapReduce: Executar os exemplos de MapReduce incluídos no HDInsight
- Apache Hive: Executar as consultas do Apache Hive usando o PowerShell
- Apache Sqoop: Usar o Apache Sqoop com o HDInsight
- Apache Oozie: Usar o Apache Oozie com o Apache Hadoop para definir e executar um fluxo de trabalho no HDInsight
Carregar dados no Armazenamento de Blobs do Azure
Para fazer upload de dados para o Armazenamento de Blobs do Azure, consulte Fazer upload de dados para o HDInsight.