Compartir vía


Introducción al almacenamiento de clústeres

Importante

Azure HDInsight en AKS se retiró el 31 de enero de 2025. Obtenga más información con este anuncio.

Debe migrar las cargas de trabajo a microsoft Fabric o un producto equivalente de Azure para evitar la terminación repentina de las cargas de trabajo.

Importante

Esta característica está actualmente en versión preliminar. Los Términos de uso complementarios para las versiones preliminares de Microsoft Azure incluyen más términos legales que se aplican a las características de Azure que se encuentran en versión beta, en versión preliminar o, de lo contrario, aún no se han publicado en disponibilidad general. Para obtener información sobre esta versión preliminar específica, consulte información de la versión preliminar de Azure HDInsight en AKS. Para preguntas o sugerencias de características, envíe una solicitud en AskHDInsight con los detalles y síganos para obtener más actualizaciones sobre Comunidad de Azure HDInsight.

Azure HDInsight en AKS se puede integrar perfectamente con Azure Storage, que es una solución de almacenamiento de uso general que funciona bien con muchos otros servicios de Azure. Azure Data Lake Storage Gen2 (ADLS Gen 2) es el sistema de archivos predeterminado para los clústeres.

La cuenta de almacenamiento podría usarse como ubicación predeterminada para los datos, los registros de clúster y otras salidas que se generan durante la operación del clúster. También podría ser un almacenamiento predeterminado para el catálogo de Hive que depende del tipo de clúster.

Para más información, consulte Introducción a Azure Data Lake Storage Gen2.

Identidades administradas para el acceso seguro a archivos

Azure HDInsight en AKS usa identidades administradas (MSI) para proteger el acceso de clúster a los archivos de Azure Data Lake Storage Gen2. La identidad administrada es una característica de Microsoft Entra ID que proporciona servicios de Azure con un conjunto de credenciales administradas automáticamente. Estas credenciales se pueden usar para autenticarse en cualquier servicio que admita la autenticación de Active Directory. Además, las identidades administradas no requieren que almacene credenciales en archivos de código o configuración.

En Azure HDInsight en AKS, una vez que selecciona una identidad administrada y un almacenamiento durante la creación del clúster, la identidad administrada puede trabajar sin problemas con el almacenamiento para la administración de datos, siempre que el rol propietario de datos de blobs de almacenamiento se asigne al MSI asignado por el usuario.

En la tabla siguiente se describen las opciones de almacenamiento admitidas para Azure HDInsight en AKS (versión preliminar pública):

Tipo de clúster Almacenamiento compatible Conexión Rol en el almacenamiento
Trino, Apache Flink y Apache Spark ADLS Gen2 Identidad administrada asignada por el usuario (MSI) del clúster El MSI asignado por el usuario debe tener rol propietario de datos de blobs de almacenamiento en la cuenta de almacenamiento.

Nota

Para compartir una cuenta de almacenamiento entre varios clústeres, simplemente asigna el MSI de usuario asignado del clúster correspondiente como "Storage Blob Data Owner" en la cuenta de almacenamiento compartida. Obtenga información sobre cómo asignar un rol.

Después, puede usar la ruta de acceso de almacenamiento completa abfs:// para acceder a los datos a través de las aplicaciones.

Para más información, consulte Identidades administradas para recursos de Azure.
Aprenda a crear una cuenta de ADLS Gen2.

Arquitectura de almacenamiento de Azure HDInsight en AKS

En el diagrama siguiente se proporciona una vista abstracta de la arquitectura de Azure HDInsight en AKS de Azure Storage.

Captura de pantalla que muestra la arquitectura de almacenamiento.

Administración del almacenamiento

Actualmente, Azure HDInsight en AKS no admite cuentas de almacenamiento con la eliminación temporal habilitada, asegúrese de deshabilitar la eliminación temporal para la cuenta de almacenamiento.

Captura de pantalla que muestra la interfaz de usuario del portal para la eliminación suave.