Stratégie d’intégrité du cluster
Définit une stratégie d’intégrité utilisée pour évaluer l’intégrité du cluster ou d’un nœud de cluster.
Propriétés
Nom | Type | Obligatoire |
---|---|---|
ConsiderWarningAsError |
boolean | Non |
MaxPercentUnhealthyNodes |
entier | Non |
MaxPercentUnhealthyApplications |
entier | Non |
ApplicationTypeHealthPolicyMap |
tableau d’ApplicationTypeHealthPolicyMapItem | Non |
NodeTypeHealthPolicyMap |
tableau de NodeTypeHealthPolicyMapItem | Non |
ConsiderWarningAsError
Type : booléen
Obligatoire : Non
Par défaut : false
Indique si les avertissements sont traités avec le même niveau de gravité que les erreurs.
MaxPercentUnhealthyNodes
Type : entier
Obligatoire : Non
Par défaut : 0
Pourcentage maximal autorisé de nœuds non sains avant signalement d’une erreur. Par exemple, pour autoriser 10 % de nœuds défectueux, cette valeur serait de 10.
Il s’agit du pourcentage maximum toléré de nœuds pouvant être défectueux avant que l’intégrité du cluster ne soit considérée comme étant à l’état Error. Si le pourcentage est respecté mais qu’il existe au moins un nœud pouvant être défectueux, l’état d’intégrité est Warning. Le pourcentage est calculé en divisant le nombre de nœuds défectueux par le nombre total de nœuds du cluster. Le calcul est arrondi pour tolérer une défaillance sur un petit nombre de nœuds. Le pourcentage par défaut est zéro.
Dans les clusters de grande taille, certains nœuds sont toujours inactifs ou en réparation. Ce pourcentage doit donc être configuré pour tolérer cette condition.
MaxPercentUnhealthyApplications
Type : entier
Obligatoire : Non
Par défaut : 0
Pourcentage maximal autorisé d’applications non saines avant signalement d’une erreur. Par exemple, pour autoriser 10 % des applications pouvant être défectueuses, cette valeur serait de 10.
Il s’agit du pourcentage maximum toléré d’applications pouvant être défectueuses avant que l’intégrité du cluster ne soit considérée comme étant à l’état Error. Si le pourcentage est respecté mais qu’il existe au moins une application pouvant être défectueuse, l’état d’intégrité est Warning. Ce calcul est effectué en divisant le nombre d’applications pouvant être défectueuses par le nombre total d’instances de l’application dans le cluster, à l’exception des types d’applications inclus dans le ApplicationTypeHealthPolicyMap. Le calcul est arrondi pour tolérer la défaillance d’un petit nombre d’applications. Le pourcentage par défaut est zéro.
ApplicationTypeHealthPolicyMap
Type : tableau d’ApplicationTypeHealthPolicyMapItem
Obligatoire : Non
Définit un mappage avec le pourcentage maximal d’applications défectueuses pour des types d’applications spécifiques.
Chaque entrée spécifie sous forme de clé le nom du type d’application et sous forme de valeur un entier qui représente le pourcentage MaxPercentUnhealthyApplications permettant d’évaluer les applications du type d’application spécifié.
Le mappage de stratégie d’intégrité de type application peut être utilisé lors de l’évaluation de l’intégrité du cluster pour décrire les types d’applications particuliers. Les types d’applications inclus dans le mappage sont évalués par rapport au pourcentage spécifié dans le mappage et non par rapport au pourcentage MaxPercentUnhealthyApplications global défini dans la stratégie de contrôle d’intégrité du cluster. Les applications correspondant aux types spécifiés dans le mappage ne sont pas comptées dans le pool global d’applications. Par exemple, si certaines applications d’un type sont critiques, l’administrateur du cluster peut ajouter une entrée dans le mappage pour ce type d’application et lui attribuer une valeur de 0 % (autrement dit, aucun échec n’est toléré). Toutes les autres applications peuvent être évaluées avec une valeur MaxPercentUnhealthyApplications définie sur 20 % pour tolérer un certain nombre d’échecs parmi les milliers d’instances d’applications. Le mappage de stratégie de contrôle d’intégrité du type d’application est utilisé uniquement si le manifeste du cluster permet l’évaluation de l’intégrité du type d’application à l’aide de l’entrée de configuration pour HealthManager/EnableApplicationTypeHealthEvaluation.
NodeTypeHealthPolicyMap
Type : tableau de NodeTypeHealthPolicyMapItem
Obligatoire : Non
Définit une carte avec le pourcentage maximal de nœuds non sains pour des types de nœuds spécifiques.
Chaque entrée spécifie comme clé le nom du type de nœud et comme valeur un entier qui représente le pourcentage MaxPercentUnhealthyNodes utilisé pour évaluer les nœuds du type de nœud spécifié.
Le mappage de stratégie d’intégrité de type de nœud peut être utilisé lors de l’évaluation de l’intégrité du cluster pour décrire les types de nœuds particuliers. Ils sont évalués par rapport aux pourcentages associés à leur nom de type de nœud dans la carte. Cette définition n’a aucun impact sur le pool global de nœuds utilisé pour MaxPercentUnhealthyNodes. Le mappage de stratégie d’intégrité de type de nœud est utilisé uniquement si le manifeste de cluster active l’évaluation de l’intégrité du type de nœud à l’aide de l’entrée de configuration pour HealthManager/EnableNodeTypeHealthEvaluation.
Par exemple, étant donné un cluster avec de nombreux nœuds de types différents, avec un travail important hébergé sur le type de nœud « SpecialNodeType » qui ne doit tolérer aucun nœud en panne. Vous pouvez spécifier maxPercentUnhealthyNodes global sur 20 % pour tolérer certains échecs pour tous les nœuds, mais pour le type de nœud « SpecialNodeType », définissez MaxPercentUnhealthyNodes sur 0 en définissant la valeur dans la paire clé-valeur dans NodeTypeHealthPolicyMapItem. La clé est le nom du type de nœud. Ainsi, tant qu’aucun nœud de type « SpecialNodeType » n’est à l’état Erreur, même si certains des nombreux nœuds du pool global sont à l’état Erreur, mais en dessous du pourcentage global non sain, le cluster est évalué à Avertissement. Un état d’intégrité Avertissement n’a pas d’impact sur la mise à niveau du cluster ou toute autre surveillance déclenchée par l’état d’intégrité de l’erreur. Mais même un nœud de type SpecialNodeType dans Error rend le cluster non sain (dans Error plutôt que Warning/Ok), ce qui déclenche la restauration ou suspend la mise à niveau du cluster, en fonction de la configuration de la mise à niveau.
À l’inverse, si vous définissez le maxPercentUnhealthyNodes global sur 0 et que le pourcentage maximal de nœuds non sains de SpecialNodeType est défini sur 100, avec un nœud de type SpecialNodeType dans l’état Error, le cluster est toujours dans un état d’erreur, car la restriction globale est plus stricte dans ce cas.