クラスター正常性ポリシー
クラスターまたはクラスター ノードの正常性を評価するために使用される正常性ポリシーを定義します。
プロパティ
名前 | Type | 必須 |
---|---|---|
ConsiderWarningAsError |
boolean | いいえ |
MaxPercentUnhealthyNodes |
整数 (integer) | いいえ |
MaxPercentUnhealthyApplications |
整数 (integer) | いいえ |
ApplicationTypeHealthPolicyMap |
ApplicationTypeHealthPolicyMapItem の配列 | いいえ |
NodeTypeHealthPolicyMap |
NodeTypeHealthPolicyMapItem の配列 | いいえ |
ConsiderWarningAsError
型: ブール値
必須: いいえ
既定値:
警告がエラーと同じ重大度で処理されることを示します。
MaxPercentUnhealthyNodes
型: 整数
必須: いいえ
既定値:
エラーを報告する前の異常なノードの最大許容パーセンテージ。 たとえば、ノードの 10% の異常を許容するには、この値を 10 にします。
パーセンテージは、異常な可能性のあるノードの最大許容パーセンテージを表します。この値を超えるとクラスターはエラーの状態と見なされます。 許容パーセンテージ内であっても、1 つ以上の異常なノードがある場合は、正常性は Warning として評価されます。 パーセンテージは、異常なノードの数をクラスター内のノードの総数で割ることによって計算されます。 切り上げ計算が実行され、少数のノードに対する 1 つのエラーは許容されます。 既定のパーセンテージは 0 です。
大規模なクラスターでは、ダウンしているか修復を必要とするノードがいくつか必ず存在するため、それが許容されるようにこのパーセンテージを構成する必要があります。
MaxPercentUnhealthyApplications
型: 整数
必須: いいえ
既定値:
エラーを報告する前の異常なアプリケーションの最大許容パーセンテージ。 たとえば、アプリケーションの 10% の異常を許容するには、この値を 10 にします。
パーセンテージは、異常な可能性のあるアプリケーションの最大許容パーセンテージを表します。この値を超えるとクラスターはエラーの状態と見なされます。 許容パーセンテージ内であっても、1 つ以上の異常なアプリケーションがある場合は、正常性は Warning として評価されます。 これは、異常なアプリケーションの数をクラスター内のアプリケーション インスタンスの総数で割ることによって計算されます。ApplicationTypeHealthPolicyMap に含まれているアプリケーションの種類のアプリケーションは除外されます。 切り上げ計算が実行され、少数のアプリケーションに対する 1 つのエラーは許容されます。 既定のパーセンテージは 0 です。
ApplicationTypeHealthPolicyMap
型: ApplicationTypeHealthPolicyMapItem の配列
必須: いいえ
特定のアプリケーションの種類の異常なアプリケーションの最大の割合でマップを定義します。
各エントリは、キーとしてアプリケーションの種類名を指定し、値として指定したアプリケーションの種類のアプリケーションを評価するために使用される MaxPercentUnhealthyApplications を表す整数を指定します。
アプリケーションの種類の正常性ポリシー マップをクラスターの正常性評価時に使用して、特別なアプリケーションの種類を記述できます。 マップに含まれるアプリケーションの種類は、クラスターの正常性ポリシーで定義されているグローバルな MaxPercentUnhealthyApplications ではなく、マップで指定されている割合に対して評価されます。 マップで指定されているアプリケーションの種類のアプリケーションは、アプリケーションのグローバル プールに対してカウントされません。 たとえば、ある種類の一部のアプリケーションがクリティカルである場合、クラスター管理者はそのアプリケーションの種類のエントリをマップに追加し、値 0% を割り当てることができます (つまり、すべてのエラーは許容されません)。 他のすべてのアプリケーションは、20% に設定された MaxPercentUnhealthyApplications で評価して、多数のアプリケーション インスタンスのうち一部の障害を許容できます。 アプリケーションの種類の正常性ポリシー マップは、HealthManager/EnableApplicationTypeHealthEvaluation の構成エントリを使うアプリケーションの種類の正常性評価がクラスター マニフェストで有効になっている場合にのみ使われます。
NodeTypeHealthPolicyMap
型: NodeTypeHealthPolicyMapItem の配列
必須: いいえ
特定のノード タイプに対する異常なノードの最大割合を持つマップを定義します。
各エントリは、キーとしてノードの種類名を指定し、値として、指定したノードの種類のノードを評価するために使用される MaxPercentUnhealthyNodes の割合を表す整数を指定します。
ノードの種類の正常性ポリシー マップをクラスターの正常性評価時に使用して、特別なノードの種類を記述できます。 これらは、マップ内のノード タイプ名に関連付けられているパーセンテージに対して評価されます。 この設定は、MaxPercentUnhealthyNodes に使用されるノードのグローバル プールには影響しません。 ノード の種類の正常性ポリシー マップは、クラスター マニフェストで HealthManager/EnableNodeTypeHealthEvaluation の構成エントリを使用してノードの種類の正常性評価を有効にする場合にのみ使用されます。
たとえば、ノードの種類が異なる多数のノードを持つクラスターで、ノードの種類が "SpecialNodeType" でホストされている重要な作業があり、ノードのダウンを許容しないようにする必要があります。 グローバル MaxPercentUnhealthyNodes を 20% に指定すると、すべてのノードに対して一部のエラーが許容されますが、ノードの種類が "SpecialNodeType" の場合は、NodeTypeHealthPolicyMapItem のキー値ペアの値を設定して MaxPercentUnhealthyNodes を 0 に設定します。 キーはノードの種類名です。 これにより、"SpecialNodeType" 型のノードがエラー状態でない限り、グローバル プール内の多数のノードの一部がエラー状態であっても、グローバル異常率を下回っている場合でも、クラスターは警告に評価されます。 警告正常性状態は、クラスターのアップグレードや、エラー正常性状態によってトリガーされるその他の監視には影響しません。 ただし、エラーの SpecialNodeType 型のノードが 1 つであっても、クラスターが異常になります (警告/OK ではなくエラー)。 これにより、アップグレード構成に応じて、クラスターのアップグレードのロールバックまたは一時停止がトリガーされます。
逆に、グローバルな MaxPercentUnhealthyNodes を 0 に設定し、SpecialNodeType の最大異常率ノードを 100 に設定します。SpecialNodeType 型の 1 つのノードが Error 状態の場合でも、グローバル制限の方が厳しいため、クラスターはエラー状態になります。