Compartir a través de


Novedades de HDInsight en AKS (Versión preliminar)

Importante

Azure HDInsight en AKS se retiró el 31 de enero de 2025. Obtenga más información con este anuncio.

Debe migrar las cargas de trabajo a microsoft Fabric o un producto equivalente de Azure para evitar la terminación repentina de las cargas de trabajo.

Importante

Esta característica está actualmente en versión preliminar. Los Términos de uso complementarios para las versiones preliminares de Microsoft Azure incluyen más términos legales que se aplican a las características de Azure que se encuentran en versión beta, en versión preliminar o, de lo contrario, aún no se han publicado en disponibilidad general. Para obtener información sobre esta versión preliminar específica, consulte información de la versión preliminar de Azure HDInsight en AKS. Para preguntas o sugerencias de características, envíe una solicitud en AskHDInsight con los detalles y síganos para obtener más actualizaciones sobre Azure HDInsight Community.

En HDInsight en AKS, todas las operaciones y administración de clústeres tienen compatibilidad nativa con administración de servicios en Azure Portal para clústeres individuales.

En HDInsight en AKS, se presentan dos nuevos conceptos:

  • los grupos de clústeres se usan para agrupar y administrar clústeres.
  • Clústeres se usan para computaciones de código abierto, se hospedan en una agrupación de clústeres.

Grupos de clústeres

HDInsight en AKS se ejecuta en Azure Kubernetes Service (AKS). El recurso de nivel superior es el grupo de clústeres y administra todos los clústeres que se ejecutan en el mismo clúster de AKS. Al crear un grupo de clústeres, se crea un clúster de AKS subyacente al mismo tiempo para hospedar todos los clústeres del grupo. Los grupos de clústeres son una agrupación lógica de clústeres, lo que ayuda a crear una interoperabilidad sólida en varios tipos de clúster y permite a las empresas tener los clústeres en la misma red virtual. Los grupos de clústeres proporcionan acceso rápido y rentable a todos los tipos de clúster creados a petición y a escala. Un grupo de clústeres corresponde a un clúster en la infraestructura de AKS.

Grupos

Los clústeres son cargas de trabajo de proceso de código abierto individuales, como Apache Spark, Apache Flink y Trino, que se pueden crear rápidamente en pocos minutos con configuraciones preestablecidas y pocos clics. Aunque se ejecuta en el mismo grupo de clústeres, cada clúster puede tener sus propias configuraciones, como el tipo de clúster, la versión, el tamaño de máquina virtual del nodo, el número de nodos. Los clústeres se ejecutan en recursos de proceso separados con su propio DNS y puntos de conexión.

Características actualmente en versión preliminar

En la siguiente lista de tablas se muestran las características de HDInsight en AKS que se encuentran actualmente en versión preliminar. Las características de vista previa se ordenan alfabéticamente.

Área Funciones
Fundamentos Creación de Pool y clústeres mediante el portal, compatibilidad con el acceso seguro web (ssh), capacidad para elegir el número de nodos de trabajo durante la creación del clúster
Almacenamiento ADLS Gen2 Storage soporte
Metastore Compatibilidad con metastore externo para Trino, Spark y Flink, Integración con HDInsight
Seguridad Compatibilidad con RBAC de ARM, compatibilidad con la autenticación basada en MSI, opción para proporcionar acceso al clúster a otros usuarios
Registro y supervisión Agregación de registros en Azure log analytics, para registros de servidor, métricas de clúster y servicio a través de Managed Prometheus y Grafana, Compatibilidad con las métricas del servidor en Azure Monitor, página Estado del servicio para supervisar el estado del servicio
Escalado automático Carga basada en , escalado automático, y programación basada en , escalado automático
Personalización y configuración de clústeres Compatibilidad con acciones de script de durante la creación del clúster, compatibilidad con la administración de bibliotecas de , y configuración de los ajustes del servicio de después de la creación del clúster.
Trino Compatibilidad con catálogos de Trino , compatibilidad con la CLI de Trino , compatibilidad con DBeaver para el envío de consultas, Agregar o quitar complementos y conectores , Compatibilidad con el registro de eventos de consulta , Compatibilidad con el análisis de estadísticas de consultas para cualquier conector en el panel de Trino, Compatibilidad con el panel de Trino para supervisar consultas, almacenamiento en caché de consultas , Integración con Power BI, Integración con Apache Superset , Redash, Compatibilidad con múltiples conectores
Flink Compatibilidad con la interfaz de usuario web nativa de Flink, compatibilidad con Flink con HMS para DStream, Envío de trabajos al clúster mediante API REST y Azure Portal, Ejecución de programas empaquetados como archivos JAR a través de la CLI de Flink, Compatibilidad con puntos de guardado persistentes, Compatibilidad con la actualización de las opciones de configuración cuando se ejecuta el trabajo, Conexión a varios servicios de Azure: azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Submit jobs to the cluster using Flink CLI and CDC with Flink with Flink
Chispa Jupyter Notebook, compatibilidad con Delta Lake 2.0, soporte técnico de Zeppelin, soporte técnico de ATS, compatibilidad con la interfaz del servidor de historial de Yarn, envío de trabajos mediante SSH, envío de trabajos mediante SDK y Notebook de Machine Learning

Hoja de ruta de características

Característica Escala de tiempo de lanzamiento estimada Estado
Escalado automático basado en carga de Trino Q1 2024 Completado
Escalado automático basado en la carga aleatoria para Spark Q2 2024 En curso
Actualización en el lugar Q2 2024 Completado
Soporte para instancias reservadas Q2 2024 En curso
Autenticación basada en MSI para Metastore (SQL) Q1 2024 En curso
Spark 3.4 Segundo trimestre de 2024 En curso
Trino 426 1er trimestre de 2024 Completado
Ranger para RBAC Segundo Trimestre de 2024 En curso
Compatibilidad del modo de aplicación de para Flink Q1 2024 Completado
Flink 1.17 Q1 2024 Completado
Compatibilidad con Spark ACID Q1 2024 En curso
SKU configurables para Headnode, SSH 2.º trimestre de 2024 En curso
Soporte de la gateway SQL de Flink Primer trimestre 2024 Completado
Clústeres Privados para HDInsight en AKS Q1 2024 Completado
Compatibilidad de Ranger con Spark SQL cuarto trimestre de 2024 En curso
ACL de Ranger en la capa de almacenamiento Cuarto trimestre de 2024 En curso
Compatibilidad con One Lake como contenedor principal segundo trimestre de 2024 En curso