Compartir vía


Prácticas recomendadas de DevOps y seguridad para migrar clústeres locales de Apache Hadoop a Azure HDInsight

En este artículo se proporcionan recomendaciones de DevOps y seguridad en sistemas de Azure HDInsight. Forma parte de una serie de artículos que proporcionan prácticas recomendadas para ayudar a migrar sistemas locales de Apache Hadoop a Azure HDInsight.

Protección y control del clúster con Enterprise Security Package

Enterprise Security Package (ESP) admite la autenticación basada en Active Directory multiusuario y control de acceso basado en roles. Con la opción de ESP elegida, el clúster de HDInsight se une al dominio de Active Directory y el administrador de empresa puede configurar el control de acceso basado en roles (RBAC) para la seguridad de Apache Hive mediante el uso de Apache Ranger. El administrador también puede auditar el acceso a los datos de los empleados y todos los cambios que se realizan en las directivas de control de acceso.

ESP está disponible en los siguientes tipos de clúster: Apache Hadoop, Apache Spark, Apache HBase, Apache Kafka e Interactive Query (Hive LLAP).

Para implementar el clúster de HDInsight unido a un dominio, siga estos pasos:

  • Implemente Microsoft Entra ID pasando el nombre de dominio.

  • Implemente Microsoft Entra Domain Services.

  • Cree la red virtual y la subred necesarias.

  • Implemente una máquina virtual en la red virtual para administrar Microsoft Entra Domain Services.

  • Una la máquina virtual al dominio.

  • Instale las herramientas de AD y DNS.

  • Haga que el administrador de Microsoft Entra Domain Services cree una unidad organizativa (UO).

  • Habilite LDAPS para Microsoft Entra Domain Services.

  • Cree una cuenta de servicio en el Microsoft Entra ID con permiso de administrador de lectura y escritura delegado en la unidad organizativa para que pueda hacerlo. Esta cuenta de servicio podrá unir las máquinas al dominio y colocar las entidades de seguridad de la máquina en la unidad organizativa. También puede crear entidades de servicio dentro de la unidad organizativa que especifique durante la creación del clúster.

    Nota

    No es necesario que la cuenta de servicio sea una cuenta de administrador de dominio de AD.

  • Implemente el clúster de HDInsight ESP estableciendo los parámetros siguientes:

    Parámetro Descripción
    Nombre de dominio Nombre de dominio asociado a Microsoft Entra Domain Services.
    Nombre de usuario de dominio La cuenta de servicio del dominio administrado por Microsoft Entra Domain Services DC que creó en la sección anterior, por ejemplo: hdiadmin@contoso.onmicrosoft.com. Este usuario de dominio será el administrador de este clúster de HDInsight.
    Contraseña de dominio contraseña de la cuenta de servicio.
    Unidad organizativa nombre distintivo de la unidad organizativa que quiere utilizar con el clúster de HDInsight; por ejemplo, OU=HDInsightOU,DC=contoso,DC=onmicrosoft,DC=com. Si no existe esta unidad organizativa, el clúster de HDInsight intenta crearla mediante los privilegios que tiene la cuenta de servicio.
    Dirección URL de LDAPS Por ejemplo: ldaps://contoso.onmicrosoft.com:636.
    Grupo de usuarios de acceso grupos de seguridad cuyos usuarios quiere que se sincronicen con el clúster; por ejemplo, HiveUsers. Si desea especificar varios grupos de usuarios, sepárelos con un punto y coma ";". Los grupos deben existir en el directorio antes de crear el clúster de ESP.

Para más información, consulte los siguientes artículos.

Implementación de la seguridad empresarial de un extremo a otro

La seguridad empresarial de extremo a extremo puede lograrse con los controles siguientes:

Canalización de datos privados y protegidos (seguridad a nivel de perímetro): la seguridad en el nivel de perímetro se puede lograr a través de redes virtuales de Azure, grupos de seguridad de red y el servicio de puerta de enlace.

Autenticación y autorización para el acceso a datos : creación de un clúster de HDInsight unido a un dominio mediante Microsoft Entra Domain Services. (Enterprise Security Package). - Use Ambari para proporcionar acceso basado en roles a los recursos de clúster para los usuarios de AD. - Use Apache Ranger para establecer las directivas de control de acceso para Hive en el nivel de tabla, columna y fila. - El acceso SSH al clúster puede estar restringido a solo el administrador.

Auditoría: vea y notifique todos los accesos a los recursos y los datos del clúster de HDInsight. - Vea y notifique todos los cambios en las directivas de control de acceso.

Cifrado: cifrado del lado servidor transparente con claves administradas por Microsoft o claves administradas por el cliente. - Cifrado en tránsito mediante el cifrado en el cliente, HTTPS y TLS.

Para más información, consulte los siguientes artículos.

Uso de supervisión y alertas

Para obtener más información, consulte el artículo:

Información general de Azure Monitor

Actualización de clústeres

Actualice regularmente a la última versión de HDInsight para aprovechar las últimas características. Los siguientes pasos pueden utilizarse para actualizar el clúster a la versión más reciente:

  1. Cree un nuevo clúster de HDInsight de prueba mediante la última versión de HDInsight.
  2. Realice pruebas en el nuevo clúster para asegurarse de que los trabajos y las cargas de trabajo funcionan según lo previsto.
  3. Modifique los trabajos, las aplicaciones o las cargas de trabajo según sea necesario.
  4. Haga copia de seguridad de todos los datos transitorios almacenados localmente en los nodos del clúster.
  5. Elimine el clúster existente.
  6. Cree un clúster en la versión más reciente de HDInsight en la misma subred de red virtual, con los mismos datos y almacén predeterminados que usaba el clúster anterior.
  7. Importe los datos transitorios cuya copia de seguridad realizó.
  8. Inicie trabajos o continúe el procesamiento con el nuevo clúster.

Para obtener más información, consulte el artículo: Actualización del clúster de HDInsight a una versión más reciente.

Revise los sistemas operativos del clúster

Para obtener más información, consulte el artículo: Aplicación de revisión del SO para HDInsight.

Después de la migración

  1. Corregir aplicaciones: realice de forma iterativa los cambios necesarios en los trabajos, procesos y scripts.
  2. Realizar pruebas : realice pruebas funcionales y de rendimiento de forma iterativa.
  3. Optimizar: aborde cualquier problema de rendimiento basándose en los resultados de las pruebas anteriores y luego vuelva a realizar la prueba para confirmar las mejoras de rendimiento.

Pasos siguientes

Más información acerca de HDInsight 4.0