次の方法で共有


ジョブの除外ノードの定義

HPC Pack では、ジョブ内のタスクが特定のノードで一貫して失敗する場合は、そのノードをジョブから除外するには、そのノードを Excluded Nodes job プロパティに追加します。 除外ノードでノードを指定する場合:

  • 除外されたノード に追加されたノードで実行されているジョブのタスクは取り消され、失敗した としてマークされます (ノード リリース タスクを除く)。

  • ノードリリース タスクは、ノードが解放される前に、除外されたノードで実行されます。

  • 除外ノードにリストされているノードでは、ジョブ内のタスクは開始されません。

  • 除外されたノード 一覧に追加すると、ジョブが最小リソース要件を下回る場合、ジョブは取り消され、再キューされます。

所有するアクティブなジョブの場合は、除外されたノード ジョブ プロパティでノードを追加または削除するか、一覧をクリアできます。 HPC PowerShell またはコマンド プロンプトを使用して、除外されたノードの一覧を変更および表示するコマンドの一覧を次に示します。

HPC PowerShell で、次のコマンドレットを使用します。

  • Set-HpcJob –Id <yourJobID> /addExludedNodes <nodeName>, <nodename>

  • Set-HpcJob –Id <yourJobID> /removeExcludedNodes <nodeName>, <nodename>

  • Set-HpcJob –Id <yourJobID> /clearExcludedNodes

  • (Get-HpcJob –Id <yourJobID>).ExcludedNodes

  • または、すべてのジョブ プロパティを表示するには、Get-HpcJob –Id <yourJobID>|fl

コマンド プロンプトで、次のコマンドを使用します。

  • job modify <yourJobID> /addExludedNodes:<nodeName>,<nodename>

  • job modify <yourJobID> /removeExcludedNodes:<nodeName>,<nodename>

  • job modify <yourJobID> /clearExcludedNodes

  • job view <yourJobID> /detailed|find “excludednodes” /i

  • または、すべてのジョブ プロパティを表示するには、job view <yourJobID> /detailed

注:

SOA ジョブの場合、ブローカー ノードは、(サービス構成ファイル内の) EndPointNotFoundRetryPeriod 設定に従って、除外されたノードの一覧を自動的に更新および維持します。 この設定では、サービス ホストがサービスの読み込みを再試行する期間と、ブローカーが接続を待機する時間を指定します。 この時間が経過すると、ブローカーはノード (サービス ホスト) を除外ノードの一覧に追加します。 サービス構成には、セッションが失敗するまでに除外できるノードの数を指定する maxExcludedNodes 設定も含まれています。

関連情報

Microsoft HPC Pack でのジョブの送信の