Compartir a través de


Arquitectura de red virtual de Azure HDInsight

En este artículo, se explican los recursos que están presentes cuando se implementa un clúster de HDInsight en una red virtual de Azure personalizada. Esta información le ayuda a conectar recursos locales al clúster de HDInsight en Azure. Para más información sobre las redes virtuales de Azure, vea ¿Qué es Azure Virtual Network?.

Tipos de recursos en clúster de Azure HDInsight

Los clústeres de Azure HDInsight tienen distintos tipos de máquinas virtuales o nodos. Cada tipo de nodo desempeña un papel en el funcionamiento del sistema. En la tabla siguiente se resumen estos tipos de nodo y sus roles en el clúster.

Tipo Descripción
Nodo de ZooKeeper ZooKeeper coordina las tareas entre los nodos que realizan el procesamiento de datos. También realiza la elección de líder del nodo principal y realiza un seguimiento de qué nodo principal ejecuta un servicio maestro específico. El número de nodos de ZooKeeper se fija en tres.
Nodo de trabajo Representa los nodos que admiten la funcionalidad de procesamiento de datos. Los nodos de trabajo se pueden agregar o quitar del clúster para escalar la funcionalidad de computación y administrar los costos.
Nodo regional Para el tipo de clúster de HBase, el nodo regional (también denominado un nodo de datos) ejecuta el servidor de regiones. Los servidores de regiones atienden y administran una parte de los datos administrados por HBase. Los nodos regionales se pueden agregar o quitar del clúster para escalar la funcionalidad de computación y administrar los costos.

Convenciones de nomenclatura de recursos

Use nombres de dominio completos (FQDN) al tratar nodos del clúster. Puede obtener los FQDN de varios tipos de nodo del clúster mediante Ambari API.

Estos FQDN tienen el formato <node-type-prefix><instance-number>-<abbreviated-clustername>.<unique-identifier>.cx.internal.cloudapp.net.

<node-type-prefix> es hn para los nodos principales, wn para los nodos de trabajo y zn para los nodos de ZooKeeper.

Si solo necesita el nombre de host, use solo la primera parte del FQDN: <node-type-prefix><instance-number>-<abbreviated-clustername>.

Recursos de red virtual básicos

El siguiente diagrama muestra la colocación de los nodos de HDInsight y los recursos de red en Azure.

Diagrama de entidades de HDInsight creadas en una red virtual personalizada de Azure.

Los recursos predeterminados de una instancia de Azure Virtual Network incluyen los tipos de nodo de clúster que se mencionan en la tabla anterior. Y los dispositivos de red que admiten la comunicación entre la red virtual y las redes externas.

En la tabla siguiente se resumen los nueve nodos de clúster que se crean cuando HDInsight se implementa en una instancia personalizada de Azure Virtual Network.

Tipo de recurso Número presente Detalles
Nodo principal two
Nodo de Zookeeper three
Nodo de trabajo two Este número puede variar en función de la configuración del clúster y el escalado. Se necesitan tres nodos de trabajo como mínimo para Apache Kafka.
Nodo de puerta de enlace two Los nodos de puerta de enlace son máquinas virtuales de Azure que se crean en Azure, pero no están visibles en la suscripción. Póngase en el servicio de soporte técnico si necesita reiniciar estos nodos.

Los siguientes recursos de red presentes se crean automáticamente dentro de la red virtual usada con HDInsight:

Recursos de redes Número presente Detalles
Equilibrador de carga dos El equilibrador de carga proporciona acceso de red entrante para los nodos. Los dos equilibradores de carga son para: dos nodos principales y dos nodos de puerta de enlace. Los equilibradores de carga son SKU estándar.
Interfaces de red nueve Este valor se basa en un clúster normal, donde cada nodo tiene su propia interfaz de red. Las nueve interfaces son para los dos nodos principales, los tres nodos de ZooKeeper, los dos nodos de trabajo y los dos nodos de puerta de enlace que se mencionan en la tabla anterior.
Direcciones IP públicas two Dos direcciones IP públicas se enlazan a los equilibradores de carga.

Se pueden usar varios métodos de conectividad de salida con la red virtual personalizada que se muestra en Traducción de direcciones de red de origen (SNAT) para conexiones salientes: Azure Load Balancer.

Nota:

La forma más recomendada es asociar la subred a una puerta de enlace NAT. Requiere una puerta de enlace NAT y un grupo de seguridad de red creado en la subred antes de crear el clúster de HDInsight. Puede vincular una dirección IP pública o un prefijo de dirección IP pública con la instancia de NAT Gateway. Para ver las reglas de NSG que se van a crear, consulte Control del tráfico de red en Azure HDInsight.

Puntos de conexión para conectarse a HDInsight

Puede acceder al clúster de HDInsight de tres formas:

  • Un punto de conexión HTTPS fuera de la red virtual en CLUSTERNAME.azurehdinsight.net.
  • Un punto de conexión SSH para conectarse directamente al nodo principal en CLUSTERNAME-ssh.azurehdinsight.net.
  • Un punto de conexión HTTPS dentro de la red virtual CLUSTERNAME-int.azurehdinsight.net. Observe "-int" en esta dirección URL. Este punto de conexión se resuelve en una dirección IP privada en esa red virtual y no es accesible desde la red pública de Internet.

A estos tres puntos de conexión se les asigna un equilibrador de carga.

Las direcciones IP públicas también se proporcionan a los dos puntos de conexión que permiten la conexión desde fuera de la red virtual.

  1. Se asigna una dirección IP pública al equilibrador de carga para que el nombre de dominio completo (FQDN) la use cuando se conecte al clúster desde Internet CLUSTERNAME.azurehdinsight.net.
  2. La segunda dirección IP pública se utiliza para el nombre de dominio solo SSH CLUSTERNAME-ssh.azurehdinsight.net.

Pasos siguientes