Поделиться через


Архитектура виртуальной сети Azure HDInsight

В этой статье описываются ресурсы, которые присутствуют при развертывании кластера HDInsight в пользовательском виртуальная сеть Azure. Эти сведения помогают подключать локальные ресурсы к кластеру HDInsight в Azure. Дополнительные сведения о виртуальных сетях Azure см. в статье Что такое виртуальная сеть Azure?.

Типы ресурсов в кластере Azure HDInsight

Кластеры Azure HDInsight имеют различные типы виртуальных машин или узлов. Каждый тип узла играет определенную роль в работе системы. В следующей таблице перечислены типы узлов и их роли в кластере.

Тип Описание
Узел ZooKeeper ZooKeeper координирует задачи между узлами, выполняющими обработку данных. Он также выполняет выбор лидера головного узла и отслеживает, на каком головном узле запущена конкретная главная служба. Число узлов ZooKeeper фиксировано (3 узла).
Рабочий узел Представляет узлы, поддерживающие функции обработки данных. Рабочие узлы могут быть добавлены в кластер или удалены из него для масштабирования вычислительных возможностей и управления затратами.
Региональный узел Узел региона (также называемый узлом данных) запускает Региональный сервер для типа кластера HBase. Региональные серверы обслуживают и управляют частью данных, управляемых HBase. Региональные узлы могут быть добавлены в кластер или удалены из него для масштабирования вычислительных возможностей и управления затратами.

Соглашения об именовании ресурсов

При адресации узлов в кластере используйте полные доменные имена. Полные доменные имена для различных типов узлов в кластере можно получить с помощью API Ambari.

Эти полные доменные имена имеют форму <node-type-prefix><instance-number>-<abbreviated-clustername>.<unique-identifier>.cx.internal.cloudapp.net.

Он <node-type-prefix> предназначен hn для головных узлов, wn рабочих узлов и zn для узлов zookeeper.

Если требуется только имя узла, используйте только первую часть полного доменного имени: <node-type-prefix><instance-number>-<abbreviated-clustername>

Основные ресурсы виртуальной сети

На следующей схеме показано размещение узлов HDInsight и сетевых ресурсов в Azure.

Схема сущностей HDInsight, созданных в пользовательской виртуальной сети Azure.

Ресурсы по умолчанию в виртуальной сети Azure содержат в себе типы узлов кластера, упомянутые в предыдущей таблице, а также сетевые устройства, поддерживающие обмен данными между виртуальной сетью и внешними сетями.

В следующей таблице приведены девять узлов кластера, созданные при развертывании HDInsight в настраиваемой виртуальной сети Azure.

Тип ресурса Количество узлов Сведения
Головной узел two
Узел ZooKeeper три
Рабочий узел two Количество может варьироваться в зависимости от конфигурации и масштабирования кластера. Для Apache Kafka требуется не менее трех рабочих узлов.
Узел шлюза two Узлы шлюза — это виртуальные машины Azure, которые создаются в Azure, но не отображаются в подписке. Если необходимо перезагрузить эти узлы, обратитесь в службу поддержки.

В виртуальной сети, используемой в HDInsight, автоматически создаются следующие сетевые ресурсы.

Сетевые ресурсы Количество узлов Сведения
Подсистема балансировки нагрузки two Подсистема балансировки нагрузки предоставляет входящий сетевой доступ для узлов. Для двух подсистем балансировки нагрузки используются два головного узла и два узла шлюза. Подсистемы балансировки нагрузки — это стандартный номер SKU.
Сетевые интерфейсы девять Это значение основано на обычном кластере, где каждый узел имеет собственный сетевой интерфейс. Эти девять интерфейсов предназначены для: двух головных узлов, трех узлов ZooKeeper, двух рабочих узлов и двух узлов шлюза, упомянутых в предыдущей таблице.
Общедоступные IP-адреса two Два общедоступных IP-адреса связаны с подсистемами балансировки нагрузки.

Существует несколько методов исходящего подключения, которые можно использовать с пользовательской виртуальной сетью, показанной в переводе сетевых адресов источника (SNAT) для исходящих подключений — Azure Load Balancer.

Примечание.

Самый рекомендуемый способ — связать подсеть с шлюзом NAT. Для этого требуется шлюз NAT и группа безопасности сети, созданная в подсети перед созданием кластера HDInsight. Вы можете привязывать общедоступный IP-адрес или префикс общедоступного IP-адреса с шлюзом NAT. Сведения о создании правил NSG см. в статье "Управление сетевым трафиком в Azure HDInsight"

Конечные точки для подключения к HDInsight

Получить доступ к кластеру HDInsight можно тремя способами:

  • с помощью конечной точки протокола HTTPS за пределами виртуальной сети по адресу CLUSTERNAME.azurehdinsight.net;
  • с помощью конечной точки протокола SSH для прямого подключения к головному узлу по адресу CLUSTERNAME-ssh.azurehdinsight.net;
  • с помощью конечной точки протокола HTTPS в виртуальной сети CLUSTERNAME-int.azurehdinsight.net. Обратите внимание на "-int" в этом URL-адресе. Эта конечная точка разрешает частный IP-адрес в этой виртуальной сети и недоступна из общедоступного Интернета.

Каждой из этих трех конечных точек назначается подсистема балансировки нагрузки.

Общедоступные IP-адреса также предоставляются двум конечным точкам, которые позволяют подключение извне виртуальной сети.

  1. Первый общедоступный IP-адрес назначается подсистеме балансировки нагрузки для полного доменного имени (FQDN) для использования при подключении к кластеру из Интернета CLUSTERNAME.azurehdinsight.net.
  2. Второй общедоступный IP-адрес используется только для доменного имени, предназначенного для протокола SSH CLUSTERNAME-ssh.azurehdinsight.net.

Следующие шаги