HDInsight en AKS: preguntas más frecuentes
En este artículo se tratan algunas preguntas comunes sobre Azure HDInsight en AKS.
Importante
Azure HDInsight en AKS se retiró el 31 de enero de 2025. Obtenga más información con este anuncio.
Debe migrar las cargas de trabajo a microsoft Fabric o un producto equivalente de Azure para evitar la terminación repentina de las cargas de trabajo.
Importante
Esta característica está actualmente en versión preliminar. Los Términos de uso complementarios para las versiones preliminares de Microsoft Azure incluyen más términos legales que se aplican a las características de Azure que se encuentran en versión beta, en versión preliminar o, de lo contrario, aún no se han publicado en disponibilidad general. Para obtener información sobre esta versión preliminar específica, consulte la información de la versión preliminar de Azure HDInsight en AKS . Para preguntas o sugerencias de características, envíe una solicitud en AskHDInsight con los detalles y síganos para obtener más actualizaciones sobre Comunidad de Azure HDInsight.
General
¿Qué es HDInsight en AKS?
HDInsight en AKS es una nueva versión de HDInsight, que proporciona un servicio de clúster administrado listo para la empresa con proyectos emergentes de análisis de código abierto como Apache Flink (para streaming), Trino (para análisis adhoc y BI) y Apache Spark. Para obtener más información, consulte Información general.
¿Qué formas de clúster admite HDInsight en AKS?
HDInsight en AKS admite Trino, Apache Flink y Apache Spark para empezar. Sin embargo, otras formas de clúster, como Kafka, Hive, etc., están en la hoja de ruta.
¿Cómo puedo empezar a trabajar con HDInsight en AKS?
Para empezar, visite Azure Marketplace y busque Azure HDInsight en el servicio de AKS y consulte cómo empezar.
¿Qué ocurre con HDInsight existente en la máquina virtual y los clústeres que estoy ejecutando hoy?
No hay ningún cambio en HDInsight existente (HDInsight en la máquina virtual). Todos los clústeres existentes siguen ejecutándose y puede seguir creando y escalando nuevos clústeres de HDInsight.
¿Qué sistema operativo se admite con HDInsight en AKS?
HDInsight en AKS se basa en el sistema operativo Mariner. Para obtener más información, consulte la versión del sistema operativo .
¿En qué regiones están disponibles HDInsight en AKS?
Para obtener una lista de las regiones admitidas, consulte Disponibilidad de regiones.
¿Cuál es el costo de implementar un clúster de HDInsight en AKS?
Si desea más información sobre precios, consulte el apartado de precios de HDInsight en AKS.
Administración de clústeres
¿Puedo ejecutar varios clústeres simultáneamente?
Sí, puede ejecutar tantos clústeres como desee por grupo de clústeres simultáneamente. Sin embargo, asegúrese de que no está restricción por cuota para la suscripción. El número máximo de nodos permitidos en un grupo de clústeres es 250 (en versión preliminar pública).
¿Puedo instalar o agregar más complementos o bibliotecas en mi clúster?
Sí, puede instalar complementos y bibliotecas personalizados en función de las formas del clúster.
- Para Trino, consulte Instalar complementos personalizados.
- Para Spark, consulte la administración de bibliotecas en Spark .
¿Puedo acceder mediante SSH a mi clúster?
Sí, puede conectarse mediante SSH al clúster a través de webssh y ejecutar consultas y enviar trabajos directamente desde allí.
Metastore
¿Puedo usar un metastore externo para conectarse a mi clúster?
Sí, puede usar un metastore externo. Sin embargo, solo admitimos Azure SQL Database como un metastore personalizado externo.
¿Puedo compartir una tienda de metadatos en varios clústeres?
Sí, puede compartir un metastore entre varias instancias de HDInsight en AKS.
¿Cuál es la versión de Metastore de Hive compatible?
Metastore de Hive, versión 3.1.2
Cargas de trabajo
Trino
¿Qué es Trino?
Trino es un motor de consultas SQL distribuido y federado de código abierto, que permite consultar datos que residen en orígenes de datos diferentes sin moverse a un almacenamiento de datos central. Puede consultar los datos mediante ANSI SQL, no es necesario aprender un nuevo lenguaje. Para obtener más información, consulte introducción a Trino.
¿Qué conectores admiten todos?
HDInsight en AKS Trino admite varios conectores. Para obtener más información, consulte esta lista de conectores de Trino. Seguimos agregando nuevos conectores como y cuando los nuevos conectores están disponibles en la versión de código abierto.
¿Puedo agregar catálogos a un clúster existente?
Sí, puede agregar catálogos admitidos al clúster existente. Para obtener más información, consulte Agregar catálogos a un clúster existente.
Apache Flink
¿Qué es Apache Flink?
Apache Flink es un motor analítico de código abierto de primera clase para el procesamiento de flujos y la realización de cálculos con estado sobre flujos de datos sin enlazar y delimitados. Puede realizar cálculos a velocidad en memoria y a cualquier escala. Flink en HDInsight en AKS ofrece Apache Flink gestionado como software de código abierto. Para obtener más información, consulte visión general de Flink.
¿Admite el modo de sesión y aplicación en Apache Flink?
En HDInsight en AKS, Flink admite actualmente clústeres de modo de sesión.
¿Qué es la gestión de estado en el backend y cómo se realiza sobre HDInsight en AKS?
Los back-end determinan dónde se almacena el estado. Cuando se activa el punto de comprobación, el estado se conserva en los puntos de control para protegerse contra la pérdida de datos y recuperarse de forma coherente. La forma en que el estado se representa internamente y cómo y dónde se almacenan en los puntos de control depende del Backend de estado elegido. Para obtener más información, vea Flink overview
Apache Spark
¿Qué es Apache Spark?
Apache Spark es un marco de procesamiento de datos que puede realizar rápidamente tareas de procesamiento en grandes conjuntos de datos y también puede distribuir tareas de procesamiento de datos entre varios equipos, ya sea por sí mismo o junto con otras herramientas de computación distribuida.
¿Qué API de lenguaje se admiten en Spark?
Azure HDInsight en AKS admite Python y Scala.
¿Se admite el uso de metastore externo en HDInsight sobre AKS Spark?
HDInsight en AKS admite la conectividad externa de metastore. Actualmente solo se admite Azure SQL DB como metastore externo.
¿Cuáles son las distintas maneras de enviar trabajos en HDInsight en AKS Spark?
Puede enviar trabajos en HDInsight en AKS Spark mediante Jupyter Notebook, Zeppelin Notebook, SDK y terminal de clúster. Para obtener más información, véase Enviar y gestionar trabajos en un clúster de Spark en HDInsight en AKS