Criar cluster Spark no HDInsight no AKS (versão prévia)

Artigo
10/16/2024

Observação

Desativaremos o Microsoft Azure HDInsight no AKS em 31 de janeiro de 2025. Para evitar o encerramento abrupto das suas cargas de trabalho, você precisará migrá-las para o Microsoft Fabric ou para um produto equivalente do Azure antes de 31 de janeiro de 2025. Os clusters restantes em sua assinatura serão interrompidos e removidos do host.

Somente o suporte básico estará disponível até a data de desativação.

Importante

Esse recurso está atualmente na visualização. Os Termos de uso complementares para versões prévias do Microsoft Azure incluem mais termos legais que se aplicam aos recursos do Azure que estão em versão beta, em versão prévia ou ainda não lançados em disponibilidade geral. Para obter informações sobre essa versão prévia específica, confira Informações sobre a versão prévia do Azure HDInsight no AKS. No caso de perguntas ou sugestões de recursos, envie uma solicitação no AskHDInsight com os detalhes e siga-nos para ver mais atualizações sobre a Comunidade do Azure HDInsight.

Depois que as etapas de pré-requisitos da assinatura e pré-requisitos do recurso forem concluídas e você tiver um pool de cluster implantado, continue a usar o portal do Azure para criar um cluster Spark. Você pode usar o portal do Azure para criar um cluster Do Apache Spark no pool de clusters. Em seguida, você pode criar um Jupyter Notebook e o usará para executar consultas SQL do Spark em tabelas do Apache Hive.

No portal do Azure, digite pools de cluster e selecione pools de cluster para ir para a página de pools de cluster. Na página de pools de cluster, selecione o pool de clusters no qual você pode adicionar um novo cluster Spark.

Na página do pool de clusters específica, clique em + Novo cluster.

Esta etapa abre a página de criação do cluster.

Propriedade	Descrição
Subscription	A assinatura do Azure que foi registrada para uso com o HDInsight no AKS na seção Pré-requisitos com pré-população
Grupo de recursos	O mesmo grupo de recursos que o pool de clusters será preenchido previamente
Region	A mesma região que o pool de clusters e o virtual serão preenchidos previamente
Pool de clusters	O nome do pool de clusters será preenchido previamente
Versão do Pool do HDInsight	A versão do pool de clusters será preenchida previamente da seleção de criação do pool
HDInsight na versão do AKS	Especificar o HDI na versão do AKS
Tipo de cluster	Na lista suspensa, selecione Spark
Versão do cluster	Selecione a versão da versão da imagem a ser usada
Nome do cluster	Insira o nome do novo cluster
Identidade gerenciada atribuída pelo usuário	Selecione a identidade gerenciada atribuída pelo usuário que funcionará como uma cadeia de conexão com o armazenamento
Conta de Armazenamento	Selecione a conta de armazenamento pré-criada que deve ser usada como armazenamento primário para o cluster
Nome do contêiner	Selecione o nome do contêiner(exclusivo) se for criado ou criado previamente ou criar um novo contêiner
Catálogo do Hive (opcional)	Selecione o metastore do Hive pré-criado (banco de dados SQL do Azure)
Banco de Dados SQL para Hive	Na lista suspensa, selecione o Banco de Dados SQL no qual adicionar tabelas hive-metastore.
Nome de usuário administrador do SQL	Insira o nome de usuário do administrador do SQL
Key vault	Na lista suspensa, selecione o Key Vault, que contém um segredo com senha para o nome de usuário do administrador do SQL
Nome do segredo da senha do SQL	Insira o nome do segredo do Key Vault em que a senha do BD SQL é armazenada

Observação

Atualmente, o HDInsight dá suporte apenas a bancos de dados do MS SQL Server.
Devido à limitação do Hive, não há suporte para o caractere "-" (hífen) no nome do banco de dados metastore.

Selecione Avançar: Configuração + preço para continuar.

Propriedade	Descrição
Tamanho do nó	Selecione o tamanho do nó a ser usado para os nós do Spark
Número de nós de trabalho	Selecione o número de nós para o cluster Spark. Desses, três nós são reservados para serviços de coordenador e sistema, os nós restantes são dedicados aos trabalhadores do Spark, um trabalho por nó. Por exemplo, em um cluster de cinco nós há dois trabalhos
Autoscale	Clique no botão de alternância para habilitar o Dimensionamento Automático
Tipo de dimensionamento automático	Selecione com base na carga ou no dimensionamento automático baseado em agendamento
Tempo limite de descomissionamento elegante	Especificar o tempo limite de desativação normal
Nenhum nó de trabalho padrão	Selecione o número de nós para dimensionamento automático
Fuso Horário	Selecione o fuso horário
Regras de dimensionamento automático	Selecione o dia, a hora de início, a hora de término, não. de nós de trabalho
Habilitar SSH	Se habilitado, permite definir prefixo e número de nós SSH

Clique em Avançar: Integrações para habilitar e selecionar o Log Analytics para registro em log.

O Azure Prometheus para monitoramento e métricas pode ser habilitado após a criação do cluster.
Clique em Avançar: Marcas para continuar na próxima página.

Na página Marcas, insira todas as marcas que você deseja adicionar ao recurso.

Propriedade	Descrição
Nome	Opcional. Insira um nome como Azure HDInsight na Visualização Privada do AKS para identificar facilmente todos os recursos associados a seus recursos
Valor	Deixe isso em branco
Recurso	Selecionar Todos os recursos selecionados

Clique em Próximo: Examinar + criar.
Na página Examinar + criarde, procure a mensagem de validação bem-sucedida na parte superior da página e clique em Criar.
A página Implantação está em processo e é exibida, mostrando que o cluster está sendo criado. Leva de cinco a dez minutos para criar o cluster. Uma vez criado o cluster, será exibida a mensagem Sua implantação está concluída. Se você navegar para longe da página, poderá verificar o status de suas Notificações.
Vá para a página de visão geral do cluster, você pode ver links de ponto de extremidade lá.

Compartilhar via

Criar cluster Spark no HDInsight no AKS (versão prévia)

Comentários

Recursos adicionais