ワークステーション ノードとアンマネージド サーバー ノードの可用性ポリシーについて
ワークステーション ノードとアンマネージド サーバー ノードをオンラインにしてジョブを実行し、手動または自動でオフラインにすることができます。 ワークステーション ノードとアンマネージド サーバー ノードを自動的にオンラインおよびオフラインにする場合は、ノード テンプレートで週単位の可用性ポリシーを指定する必要があります。
注意
ワークステーション ノードとアンマネージド サーバー ノードの両方が、HPC Pack 2008 R2 SP3 以降でサポートされています。 以前のバージョンの HPC Pack 2008 R2 では、ワークステーション ノードのみがサポートされています。
可用性ポリシーでは、クラスター ジョブを実行するためにノードが使用可能になる (オンライン状態になる) 1 週間に 1 つ以上の期間を指定します。 ノードをジョブの実行に使用できるようにする場合は、毎週複数回を指定できます 。たとえば、平日は毎晩、週末は終日です。 クラスターは、各オンライン 時間ブロックの先頭にワークステーション ノードとアンマネージド サーバー ノードを自動的にオンラインにします。 その後、ノードは、クラスターに送信されたジョブをすぐに実行できます。 各時間ブロックの最後に、ノードは自動的にオフラインになります。 必要に応じて、ワークステーション ノードとアンマネージド サーバー ノードで実行されているジョブがドレインされるときに、オンライン ブロックが終了するまでの時間間隔を指定できます。
お使いのバージョンの Microsoft HPC Pack でサポートされている場合は、テンプレートでユーザー アクティビティ検出設定を構成することもできます。 ユーザー アクティビティ検出設定により、クラスターは、オンライン 時間ブロック中に (キーボード、マウス、または CPU アクティビティに基づいて) 使用されていないワークステーション ノードとアンマネージド サーバー ノードでのみジョブを実行します。 詳細については、「 ユーザー アクティビティの検出について」を参照してください。
[タスクの猶予期間の取り消し] 設定を使用した可用性ポリシーの操作
自動可用性ポリシーが構成されている場合、ワークステーション・ノードおよびアンマネージド・サーバー・ノードは、オンライン・タイム・ブロックが経過した後にジョブを開始しません。 ただし、[タスクの猶予期間の取り消し] 設定が構成されている場合、オンライン タイム ブロックの最後にまだ実行されている HPC タスクは、一定期間実行し続けることができます。 [タスクの猶予期間の取り消し] クラスター プロパティを使用すると、アプリケーションは状態情報を保存し、終了する前に一定期間クリーンアップできます (既定の期間は 15 秒です)。 タスクが終了する正確な時刻は、タスクがCTRL_BREAK イベントに応答するかどうかと、その応答速度 (Ctrl + BREAK キーの組み合わせと同等) によって異なります。 イベントを処理しないタスクはすぐに終了しますが、イベントを処理するタスクは、タスクの猶予期間の取り消しが正常に終了するまでに時間がかかります。
タスクのキャンセル猶予期間は常にワークステーション ノードとアンマネージド サーバー ノードのオンライン タイム ブロックの最後から開始されるため、これらのノードは、タスクのキャンセル猶予期間 (またはタスクがCTRL_BREAKイベントを処理して停止するまで) HPC タスクを実行し続ける可能性があります。 ユーザーがノードでのアクティビティを再開した後も、HPC タスクを続行できます。ただし、重複する可能性がある時間は短い可能性があります。
注意
ワークステーション ノードのタスクキャンセル猶予期間の開始は、可用性ポリシーのタスクドレイン期間の構成の影響を受けません。
タスクのキャンセル猶予期間が構成されている場合、スケジュールされていない時間帯に、ワークステーション ノードとアンマネージド サーバー ノードで HPC タスクを誤って実行しないようにするための推奨されるベスト プラクティスを次に示します。
[タスクの猶予期間の取り消し] の値を可能な限り小さく指定します (たとえば、分単位ではなく秒単位の値)。
タスクのキャンセル猶予期間を使用するワークステーション ノードで実行される HPC アプリケーションが迅速にクリーンアップされ、終了できることを確認します。 CTRL_BREAK イベントを受信した直後に終了しないアプリケーションは、タスクの猶予期間を取り消す限り実行を続けることができます。
HPC Pack のバージョンでサポートされている場合は、可用性ポリシーでユーザー アクティビティ検出設定を構成します。 これらの設定は、HPC タスクがワークステーションで通常の優先度より低い状態で実行され、ワークステーションでユーザー アクティビティが検出されるとすぐにタスクがシステムを放棄するのに役立ちます。
その他の注意点
週単位の可用性ポリシーに従ってオンラインおよびオフラインにするように構成されているワークステーション ノードとアンマネージド サーバー ノードは、手動でオンラインまたはオフラインにすることはできません。 これらのノードを手動でオンラインおよびオフラインにするように構成するには、それらのノードに別のワークステーション・ノード・テンプレートを割り当てる必要があります。または、それらのノードの現行ワークステーション・ノード・テンプレートを変更する必要があります。
ノード テンプレートに加えられた変更は、テンプレートが割り当てられているすべてのワークステーション ノードとアンマネージド サーバー ノードに影響します。
ワークステーション ノードとアンマネージド サーバー ノードのグループごとに異なる可用性ポリシーを設定する場合は、各グループに適用する別のノード テンプレートを作成します。