Compartilhar via


Quais são as novidades no HDInsight sobre o AKS? (Versão prévia)

Importante

O Azure HDInsight no AKS se aposentou em 31 de janeiro de 2025. Saiba mais com este comunicado.

Você precisa migrar suas cargas de trabalho para microsoft fabric ou um produto equivalente do Azure para evitar o encerramento abrupto de suas cargas de trabalho.

Importante

Esse recurso está atualmente em versão prévia. Os termos de uso complementares para o Microsoft Azure Previews incluem mais termos legais que se aplicam aos recursos do Azure que estão em versão beta, em versão prévia ou ainda não lançados em disponibilidade geral. Para obter informações sobre essa versão prévia específica, consulte Azure HDInsight em informações de visualização do AKS. Para perguntas ou sugestões de recursos, envie uma solicitação no AskHDInsight com os detalhes e siga-nos para mais atualizações na Comunidade do Azure HDInsight .

Em HDInsight no AKS, todo o gerenciamento e as operações de clusters têm suporte nativo para de gerenciamento de serviços no portal do Azure para clusters individuais.

No HDInsight no AKS, dois novos conceitos são introduzidos:

  • Conjuntos de clusters são usados para o agrupamento e gerenciamento de clusters.
  • clusters são usados para computação de software livre, eles são hospedados em um pool de clusters.

Grupos de Clusters

O HDInsight no AKS é executado no AKS (Serviço de Kubernetes do Azure). O recurso de nível superior é o Pool de Clusters e gerencia todos os clusters em execução no mesmo cluster do AKS. Quando você cria um Cluster Pool, um cluster AKS subjacente é criado simultaneamente para hospedar todos os clusters no pool. Os pools de clusters são um agrupamento lógico de clusters, que ajuda a criar uma interoperabilidade robusta em vários tipos de cluster e permite que as empresas tenham os clusters na mesma rede virtual. Os pools de cluster fornecem acesso rápido e econômico a todos os tipos de cluster criados sob demanda e em escala. Um pool de clusters corresponde a um cluster na infraestrutura do AKS.

Agrupamentos

Os clusters são cargas de trabalho de computação de software livre individuais, como Apache Spark, Apache Flink e Trino, que podem ser criados rapidamente em poucos minutos com configurações predefinidas e poucos cliques. Embora rodem no mesmo pool de clusters, cada cluster pode ter suas próprias configurações, como tipo de cluster, versão, tamanho da VM dos nós, contagem de nós. Os clusters estão em execução em recursos de computação separados com seu próprio DNS e pontos de extremidade.

Recursos atualmente em versão prévia

A lista de tabelas a seguir mostra os recursos do HDInsight no AKS que estão atualmente em versão prévia. Os recursos de visualização são classificados em ordem alfabética.

Área Características
Fundamentos Criar pools e clusters usando o portal, suporte a SSH seguro, e capacidade de escolher o número de nós de trabalho durante a criação do cluster
Armazenamento Armazenamento do ADLS Gen2 suporte
Metastore Suporte externo do Metastore para Trino, Spark e Flink, Integrar com HDInsight
Segurança Suporte para RBAC do ARM, suporte para autenticação baseada em MSI, opção para fornecer acesso ao cluster a outros usuários.
Registro em log e monitoramento Agregação de logs na Análise de Log no Azure, para logs de servidor, métricas de Cluster e Serviço por meio do Prometheus Gerenciado e Grafana, suporte a métricas de servidor no Azure Monitor, página de Status do Serviço para monitorar a saúde do serviço .
Dimensionamento automático Dimensionamento Automático baseado em carga, e Dimensionamento Automático baseado em agendamento
Personalizar e configurar clusters Suporte para ações de script durante a criação do cluster, suporte para gerenciamento de biblioteca , configurações de serviço após a criação do cluster
Trino Suporte para catálogos Trino, de suporte da CLI do Trino, suporte DBeaver para envio de consulta, Adicionar ou remover plug-ins e conectores, suporte para eventos de consulta de log, suporte para verificação de estatísticas de consulta para qualquer do Conector no painel do Trino, suporte para de painel do Trino para monitorar consultas, de cache de consulta, integração com o Power BI, integração com Apache Superset, Redash, Suporte para vários conectores
Flink Suporte para interface do usuário web nativa do Flink, suporte ao Flink com HMS para DStream, enviar jobs para o cluster usando API REST e portal do Azure, executar programas empacotados como arquivos JAR via CLI do Flink , suporte para pontos de salvamento persistentes, suporte para atualizar as opções de configuração quando o job estiver em execução, conectando-se a vários serviços do Azure: Azure Cosmos DB , Azure Databricks , Azure Data Explorer , Azure Event Hubs , Azure IoT Hub , Azure Pipelines , Gerenciador de Orquestração de Fluxo de Trabalho do Azure Data Factory , Kafka do HDInsight , enviar jobs para o cluster usando CLI do Flink e CDC com Flink
Fagulha pt-BR: Jupyter Notebook, suporte para Delta lake 2.0, suporte ao Zeppelin, suporte para ATS, suporte para interface do servidor de histórico do Yarn, envio de trabalhos usando SSH, envio de trabalhos usando SDK e Machine Learning Notebook

Roteiro de Funcionalidades Planejadas

Característica Cronograma de lançamento estimado Estado
Dimensionamento Automático – Baseado em Carga – Trino 1º trimestre de 2024 Concluído
Autoescala ciente de embaralhamento baseada em carga para Spark 2º trimestre de 2024 Em andamento
de atualização in-loco 2º trimestre de 2024 Concluído
Suporte à instância reservada 2º trimestre de 2024 Em andamento
Autenticação baseada em MSI para Metastore (SQL) 1º trimestre de 2024 Em andamento
Spark 3.4 2º trimestre de 2024 Em andamento
Trino 426 1º trimestre de 2024 Concluído
Ranger para RBAC 2º trimestre de 2024 Em andamento
suporte ao modo de aplicativo para o Flink 1º trimestre de 2024 Concluído
Flink 1.17 1º trimestre de 2024 Concluído
Suporte ao Spark ACID 1º trimestre de 2024 Em andamento
SKUs configuráveis para Headnode, SSH 2º trimestre de 2024 Em andamento
Suporte ao Gateway SQL do Flink 1º trimestre de 2024 Concluído
clusters privados para HDInsight no AKS 1º trimestre de 2024 Concluído
Suporte do Ranger para Spark SQL 4º trimestre de 2024 Em andamento
ACLs do Ranger na camada de armazenamento 4º trimestre de 2024 Em andamento
Suporte para o One Lake como contêiner primário 2º trimestre de 2024 Em andamento