Рекомендации по проектированию пула ресурсов
Пул ресурсов — это логическая группировка серверов управления и/или шлюзов, используемая для распределения работы между ними и принятия на себя работы из вышедшего из строя члена. Иными словами, они обеспечивают высокую доступность и масштабируемость рабочих процессов. При разработке группы управления необходимо учитывать мониторинг сетевых устройств, систем Linux/UNIX и других рабочих нагрузок, предполагающих использование пула ресурсов.
Обзор
Пулы ресурсов обеспечивают непрерывность мониторинга, предоставляя возможность нескольким членам, которые представляют собой серверы управления и/или серверы шлюзов, взять на себя рабочие процессы мониторинга, если один из членов пула становится недоступным. Можно создавать пулы ресурсов для определенных целей. Например, можно создать пул ресурсов серверов управления в основном центре обработки данных для мониторинга сетевых устройств.
Пулы ресурсов применяют логику, аналогичную кластеризации набора основных узлов, где (<число узлов, функционирующих в качестве членов пула>/2) + 1. Как минимум, в пуле должно быть три участника для поддержки кворума: чтобы обеспечить доступность пула, необходимо, чтобы более 50% участников кворума в пуле имели право голоса. Если у вас есть только два члена пула, и один недоступен, вы потеряли кворум.
Для каждого пула ресурсов, созданного в консоли управления, база данных Operations Manager, которая называется наблюдатель по умолчанию, всегда имеет голос, даже если в пуле четное число членов, чтобы обеспечить достижение кворума. Это также относится к трем пулам ресурсов, созданным по умолчанию при первом создании группы управления, которая рассматривается далее в этой статье. Для всех пулов ресурсов, созданных с помощью командлета PowerShell NewSCOM-ResourcePool, он по умолчанию отключен. Включение базы данных Operations Manager в качестве наблюдателя по умолчанию снижает сложность группы управления, только требуя развертывания двух серверов управления как минимум для обеспечения высокой доступности пулов ресурсов.
Другая роль, поддерживающая пул ресурсов, — наблюдатели. Это сервер управления или сервер шлюза, который не участвует в загрузке рабочих процессов для пула; однако они участвуют в решениях кворума. Это никогда не используется в обычных обстоятельствах, поэтому не следует рассматривать.
Существует два типа членства:
- Автоматически
- Руководство
При создании пула ресурсов его членство устанавливается вручную и не может быть перенастроено на автоматически. При создании группы управления System Center — Operations Manager три пула ресурсов создаются по умолчанию с автоматическим членством. В следующей таблице описаны три пула ресурсов.
Имя пула ресурсов | Описание |
---|---|
Пул ресурсов всех серверов управления | Выполняет рабочие процессы для вычисления групп, обеспечения доступности, свертки показателей работоспособности распределенного монитора и оптимизации базы данных. |
Пул ресурсов уведомлений | Рабочие процессы службы подписки оповещений предназначены для этого пула ресурсов для поддержки уведомлений об оповещениях. |
Пул ресурсов назначения AD | Рабочие процессы интеграции AD предназначены для этого пула ресурсов для поддержки автоматического назначения агента серверам управления. |
Так как членство в пуле ресурсов "Все серверы управления" является автоматическим, любой сервер управления, который выполняется по заказу, автоматически становится членом этого пула ресурсов. В некоторых архитектурах и аспектах дизайна, таких как включение географически распределенных контингентных операций, автоматическое назначение пулу ресурсов всех серверов управления может быть нежелательным. В таких ситуациях можно изменить назначение членства с автоматического на ручное. Таким образом, серверы управления должны быть добавлены в пул ресурсов "Все серверы управления" через мануальное назначение.
Примечание.
Параметр членства в пуле ресурсов всех серверов управления имеет атрибут "только для чтения". Сведения об изменении членства с автоматического на ручное см. в разделе "Изменение членства в пуле".
При внедрении пулов ресурсов рекомендуется, чтобы все члены были подключены к сети с низкой задержкой (менее 10 мс). Пулы ресурсов не следует развертывать в нескольких центрах обработки данных или в гибридной облачной среде, такой как Microsoft Azure.
Примеры доступности пула ресурсов
В следующих примерах демонстрируется концепция доступности пула ресурсов на основе следующих конфигураций, только с серверами управления или только с серверами шлюза.
Единый сервер управления
- Наблюдатель включен по умолчанию и не предоставляет преимуществ, поскольку есть только два члена, и кворум не достигнут.
- Высокий уровень доступности отсутствует, так как сервер управления является одной точкой сбоя.
Два сервера управления
- Наблюдатель по умолчанию включен по умолчанию.
- Высокая доступность пула обеспечивается благодаря трем членам с правом голоса - двум серверам управления и наблюдателю по умолчанию.
- Если отключить наблюдатель по умолчанию, вы потеряете высокий уровень доступности для пула.
Три сервера управления
- Наблюдатель по умолчанию включен по умолчанию.
- Для пула обеспечена высокая доступность, так как есть четыре члена с правом голоса - три сервера управления и наблюдатель по умолчанию.
- По умолчанию можно оставить неработающим только один сервер управления, чтобы поддерживать кворум. Если два сервера управления недоступны, то у вас ровно 50% участников голосования и пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
- Наблюдатель по умолчанию не увеличивает количество серверов управления, которые могут быть отключены, поэтому он не увеличивает доступность пула.
- В этом сценарии можно удалить наблюдателя по умолчанию.
Четыре сервера управления
- Наблюдатель по умолчанию включен по умолчанию.
- У пула высокая доступность, потому что есть пять членов с правом голоса — четыре сервера управления и наблюдатель по умолчанию.
- По умолчанию можно оставить недоступными только два сервера управления, чтобы сохранить кворум. Если три сервера управления отключены, у вас менее 50% участников голосования и пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
- Наблюдатель по умолчанию в этом сценарии предоставляет весомое значение, так как он увеличивает допустимое количество серверов управления, которые могут быть отключены. Без наблюдателя по умолчанию у вас будет только четыре члена кворума, что позволяет только одному участнику быть недоступным.
Пять серверов управления
- Наблюдатель по умолчанию включен по умолчанию.
- Пул обладает высокой доступностью, так как в нём шесть членов, участвующих в голосовании - пять серверов управления и наблюдатель по умолчанию.
- По умолчанию для поддержания кворума может быть недоступно не более двух серверов управления. Если три сервера управления недоступны, это ровно 50% членов голосования, а пул ресурсов больше не работает для управления рабочими нагрузками мониторинга.
- Наблюдатель по умолчанию не увеличивает количество серверов управления, которые могут быть отключены, поэтому он не увеличивает доступность пула.
- В этом сценарии можно удалить наблюдателя по умолчанию.
Когда вы достигнете трех или более серверов управления в пуле ресурсов, где у вас есть нечетное количество участников в пуле, можно рассмотреть возможность удаления наблюдателя по умолчанию в качестве члена. Если вы достигнете уровня пяти серверов управления, это может вызвать значительную нагрузку на операционную базу данных, вследствие чего может возникнуть задержка, способная повлиять на вычисления пула ресурсов.
Так как наблюдатель по умолчанию играет роль, каждый сервер управления в пуле запрашивает собственную локальную службу SDK, которая позволяет запрашивать таблицу в операционной базе данных для наблюдателя по умолчанию. Если служба SDK или база данных находится под нагрузкой, возникнет задержка, которой в противном случае не было бы.
Один сервер шлюза
- Наблюдатель по умолчанию включен по умолчанию.
- Высокий уровень доступности отсутствует, так как сервер шлюза является одной точкой сбоя.
- Наблюдатель по умолчанию не должен использоваться здесь, так как серверы шлюза не имеют локальной службы SDK и поэтому не могут запрашивать операционную базу данных.
Два сервера шлюза
- Наблюдатель по умолчанию включён автоматически.
- Высокий уровень доступности отсутствует, так как существует только два члена пула, а наблюдатель по умолчанию не является участником, так как серверы шлюзов напрямую не взаимодействуют с операционной базой данных. Для поддержания кворума пула требуются три сервера шлюза.
Три сервера шлюза
- Наблюдатель по умолчанию включен по умолчанию.
- Существует высокий уровень доступности для пула, так как существует три члена голосования - три сервера шлюза.
- По умолчанию можно допустить недоступность только одного сервера шлюза, чтобы поддерживать кворум. Если два сервера шлюза отключены, это менее 50% членов голосующего состава, и пул ресурсов больше не работает для управления мониторинговыми нагрузками.
- Наблюдатель по умолчанию не должен использоваться здесь, так как серверы шлюза не имеют локальной службы SDK и поэтому не могут запрашивать операционную базу данных.
Сценарии мониторинга, поддерживающие пулы ресурсов
Следующие рабочие процессы размещаются пулами ресурсов в Operations Manager:
- Управление сетевыми устройствами
- Управление агентами UNIX и Linux
- Мониторинг URL-адресов веб-приложения
Примечание.
Агенты Windows не сообщают пулам ресурсов.
Для мониторинга сети в Operations Manager требуется отдельный выделенный пул ресурсов. Это связано с тем, что рабочие процессы мониторинга сети выполняются на серверах управления (в модуле SNMP), а не на агентах. Это позволяет установить тяжелую нагрузку на серверы управления после включения мониторинга сетевых портов, особенно при выборе большинства активных портов, доступных на устройстве. Поэтому для повышения производительности рекомендуется использовать выделенные серверы управления в выделенных пулах ресурсов для мониторинга сети. Кроме того, серверы управления, которые являются членами этого пула, должны быть удалены из пулов "Все серверы управления", "Уведомления" и "Назначения AD".
При необходимости мониторинг Linux и UNIX в Operations Manager можно назначить выделенному пулу ресурсов для обеспечения высокой доступности мониторинга и управления агентами, но это не обязательно. Operations Manager использует сертификаты для проверки подлинности доступа к компьютерам, которые он управляет. Когда мастер обнаружения развертывает агент, он получает сертификат от этого агента, подписывает его, возвращает сертификат обратно агенту и затем перезапускает его. Для обеспечения высокой доступности каждый сервер управления в пуле ресурсов должен иметь все корневые сертификаты, которые используются для подписывания сертификатов, развернутых на агентах на компьютерах UNIX и Linux. В противном случае, если сервер управления становится недоступным, другие серверы управления не смогут доверять сертификатам, подписанным сервером, который завершился сбоем.
Следующие шаги
Сведения о создании пулов ресурсов и управлении ими см. в статье "Управление пулами ресурсов".