Поделиться через


Политика работоспособности кластера

Определяет политику работоспособности, используемую для оценки работоспособности кластера или узла кластера.

Свойства

Имя Тип Обязательно
ConsiderWarningAsError Логическое Нет
MaxPercentUnhealthyNodes Целое число Нет
MaxPercentUnhealthyApplications Целое число Нет
ApplicationTypeHealthPolicyMap Массив ApplicationTypeHealthPolicyMapItem Нет
NodeTypeHealthPolicyMap Массив NodeTypeHealthPolicyMapItem Нет

ConsiderWarningAsError

Тип: boolean
Обязательный: нет
По умолчанию: false

Указывает, учитываются ли предупреждения с той же степенью серьезности, что и ошибки.


MaxPercentUnhealthyNodes

Тип: целое число
Обязательный: нет
По умолчанию: 0

Максимально допустимый процент неработоспособных узлов, по достижении которого отображается сообщение об ошибке. Например, чтобы разрешить 10 % неработоспособных узлов, это значение должно быть равно 10.

Это значение указывает максимально допустимый процент неработоспособных узлов, превышение которого вызывает состояние "Error" при оценке кластера. Если процент учитывается, но имеется по крайней мере один неработоспособный узел, то состояние работоспособности оценивается как "Warning". Это процентное значение вычисляется путем деления числа неработоспособных узлов за общее число узлов в кластере. Расчет округляется: на небольшом количестве узлов допускается один сбой. Значение в процентах по умолчанию равняется нулю.

В крупных кластерах всегда есть отключенные узлы или узлы в состоянии восстановления. Следует учитывать это при настройке параметра.


MaxPercentUnhealthyApplications

Тип: целое число
Обязательный: нет
По умолчанию: 0

Максимально допустимый процент неработоспособных приложений, по достижении которого отображается сообщение об ошибке. Например, чтобы разрешить 10 % неработоспособных приложений, это значение должно быть равно 10.

Это значение указывает максимально допустимый процент неработоспособных приложений, превышение которого вызывает состояние "Error" при оценке кластера. Если процент учитывается, но имеется по крайней мере одно неработоспособное приложение, то состояние работоспособности оценивается как "Warning". Это значение вычисляется путем деления числа неработоспособных приложений на общее число экземпляров приложения в кластере, за исключением приложений, типы которых указаны в ApplicationTypeHealthPolicyMap. Расчет округляется: на небольшом количестве приложений допускается один сбой. Значение в процентах по умолчанию равняется нулю.


ApplicationTypeHealthPolicyMap

Тип: массив ApplicationTypeHealthPolicyMapItem
Обязательный: нет

Определяет сопоставление, содержащее максимальный процент неработоспособных приложений для конкретных типов приложений. Каждая запись содержит ключ, представляющий имя типа приложения, и значение — целое число, представляющее процент MaxPercentUnhealthyApplications, используемый для оценки приложений для указанного типа приложения.

Сопоставление политики работоспособности для типа приложения используется во время оценки работоспособности кластера для описания особых типов приложений. Типы приложений, включенные в сопоставление, анализируются с учетом процента, заданного в схеме, а не глобального показателя MaxPercentUnhealthyApplications, определенного в политике работоспособности кластера. Приложения типов, указанных в сопоставлении, не учитываются в рамках глобального пула приложений. Например, если некоторые приложения принадлежат к типу "критический", администратор кластера может добавить в сопоставление запись для этого типа и присвоить ему значение 0 % (т. е. не допускать каких-либо ошибок). Все остальные приложения можно проанализировать при показателе MaxPercentUnhealthyApplications 20 %, чтобы допускать некоторые ошибки на тысячи экземпляров приложения. Сопоставление политики работоспособности для типа приложения используется только в том случае, если манифест кластера включает оценку работоспособности типа приложения с использованием записи конфигурации для HealthManager/EnableApplicationTypeHealthEvaluation.


NodeTypeHealthPolicyMap

Тип: массив NodeTypeHealthPolicyMapItem
Обязательный: нет

Определяет карту с максимальным процентом неработоспособных узлов для определенных типов узлов. Каждая запись указывает в качестве ключа имя типа узла, а в качестве значения целое число, представляющее процент MaxPercentUnhealthyNodes, используемый для оценки узлов указанного типа узла.

Сопоставление политики работоспособности для типа узла используется при оценке работоспособности кластера для описания особых типов узлов. Они оцениваются в процентах, связанных с именем типа узла на карте. Это не влияет на глобальный пул узлов, используемых для MaxPercentUnhealthyNodes. Схема политики работоспособности типа узла используется только в том случае, если манифест кластера позволяет оценивать работоспособность типа узла с помощью записи конфигурации для HealthManager/EnableNodeTypeHealthEvaluation.

Например, учитывая кластер с множеством узлов разных типов, с важной работой, размещенной на узле типа SpecialNodeType, который не должен допускать работу каких-либо узлов. Вы можете указать глобальное значение MaxPercentUnhealthyNodes равным 20 %, чтобы допускать некоторые сбои на всех узлах, но для типа узла SpecialNodeType задайте для параметра MaxPercentUnhealthyNodes значение 0, задав значение в паре ключевого значения в NodeTypeHealthPolicyMapItem. Ключ — это имя типа узла. Таким образом, если узлы типа SpecialNodeType не находятся в состоянии ошибки, даже если некоторые из многих узлов в глобальном пуле находятся в состоянии ошибки, но ниже глобального процента неработоспособности, кластер будет оцениваться как Предупреждение. Состояние работоспособности предупреждения не влияет на обновление кластера или другой мониторинг, активироваемый состоянием работоспособности ошибки. Но даже один узел типа SpecialNodeType в поле Ошибка сделает кластер неработоспособным (в поле Ошибка, а не Предупреждение/ОК), что активирует откат или приостанавливает обновление кластера в зависимости от конфигурации обновления.

И наоборот, установка глобального значения MaxPercentUnhealthyNodes в значение 0, а для параметра Параметра SpecialNodeType max percent неработоспособных узлов — 100, при этом один узел типа SpecialNodeType в состоянии Ошибки по-прежнему переводит кластер в состояние Ошибка, так как глобальное ограничение в этом случае является более строгим.