共用方式為


定義作業的排除節點

在 HPC Pack 中,如果您注意到作業中的工作在特定節點上一致失敗,您可以將該節點新增至 [排除的節點] 作業屬性,以排除該節點。 當您在 [排除的節點]中指定節點時:

  • 在已新增至 排除節點 之節點上執行的工作會取消,並標示為失敗 (但 節點發行 工作除外)。

  • 節點發行 工作會在釋放節點之前,於排除的節點上執行。

  • 作業中的工作不會在 排除的節點中所列的節點上啟動。

  • 如果新增 排除節點 清單會導致作業低於其最低資源需求,則會取消作業並重新排入佇列。

對於您擁有的任何使用中作業,您可以在 [排除的節點] 屬性中新增或移除節點,或清除清單。 下列列出使用 HPC PowerShell 或命令提示字元修改和檢視排除節點清單的命令。

在 HPC PowerShell 中,使用下列 Cmdlet:

  • Set-HpcJob –Id <yourJobID> /addExludedNodes <nodeName>, <nodename>

  • Set-HpcJob –Id <yourJobID> /removeExcludedNodes <nodeName>, <nodename>

  • Set-HpcJob –Id <yourJobID> /clearExcludedNodes

  • (Get-HpcJob –Id <yourJobID>).ExcludedNodes

  • 或檢視所有作業屬性,Get-HpcJob –Id <yourJobID>|fl

在命令提示字元中,使用下列命令:

  • job modify <yourJobID> /addExludedNodes:<nodeName>,<nodename>

  • job modify <yourJobID> /removeExcludedNodes:<nodeName>,<nodename>

  • job modify <yourJobID> /clearExcludedNodes

  • job view <yourJobID> /detailed|find “excludednodes” /i

  • 或檢視所有作業屬性,job view <yourJobID> /detailed

注意事項

針對SOA作業,訊息代理程式節點會根據 EndPointNotFoundRetryPeriod 設定,自動更新並維護排除的節點清單(在服務組態檔中)。 此設定會指定服務主機應該重試載入服務的時間,以及訊息代理程式應該等候連線的時間長度。 如果這次經過,訊息代理程式會將節點(服務主機)新增至 [排除的節點] 清單。 服務組態也包含 maxExcludedNodes 設定,指定會話失敗前可排除多少個節點。

請參閱

Microsoft HPC Pack 中的 作業提交