ジョブの除外ノードの定義
HPC Pack では、ジョブ内のタスクが特定のノードで一貫して失敗する場合は、そのノードをジョブから除外するには、そのノードを Excluded Nodes job プロパティに追加します。 除外ノードでノードを指定する場合:
除外されたノード に追加されたノードで実行されているジョブのタスクは取り消され、失敗したとしてマークされます ( ノード リリース タスクを除く)。ノードリリース タスクは、ノードが解放される前に、除外されたノードで実行されます。
除外ノードにリストされているノードでは、ジョブ内のタスクは開始されません。
除外されたノード 一覧に追加すると、ジョブが最小リソース要件を下回る場合、ジョブは取り消され、再キューされます。
所有するアクティブなジョブの場合は、除外されたノード ジョブ プロパティでノードを追加または削除するか、一覧をクリアできます。 HPC PowerShell またはコマンド プロンプトを使用して、除外されたノードの一覧を変更および表示するコマンドの一覧を次に示します。
HPC PowerShell で、次のコマンドレットを使用します。
Set-HpcJob –Id <yourJobID> /addExludedNodes <nodeName>, <nodename>
Set-HpcJob –Id <yourJobID> /removeExcludedNodes <nodeName>, <nodename>
Set-HpcJob –Id <yourJobID> /clearExcludedNodes
(Get-HpcJob –Id <yourJobID>).ExcludedNodes
または、すべてのジョブ プロパティを表示するには、
Get-HpcJob –Id <yourJobID>|fl
コマンド プロンプトで、次のコマンドを使用します。
job modify <yourJobID> /addExludedNodes:<nodeName>,<nodename>
job modify <yourJobID> /removeExcludedNodes:<nodeName>,<nodename>
job modify <yourJobID> /clearExcludedNodes
job view <yourJobID> /detailed|find “excludednodes” /i
または、すべてのジョブ プロパティを表示するには、
job view <yourJobID> /detailed
注:
SOA ジョブの場合、ブローカー ノードは、(サービス構成ファイル内の) EndPointNotFoundRetryPeriod 設定に従って、除外されたノードの一覧を自動的に更新および維持します。 この設定では、サービス ホストがサービスの読み込みを再試行する期間と、ブローカーが接続を待機する時間を指定します。 この時間が経過すると、ブローカーはノード (サービス ホスト) を除外ノードの一覧に追加します。 サービス構成には、セッションが失敗するまでに除外できるノードの数を指定する maxExcludedNodes 設定も含まれています。
関連情報
Microsoft HPC Pack でのジョブの送信の