瞭解工作站節點和 Unmanaged 伺服器節點可用性原則
工作站節點和 Unmanaged 伺服器節點可以上線以執行作業,並手動或自動離線。 如果您想要讓工作站節點和非受控伺服器節點自動上線和離線,您必須在節點範本中指定每周可用性原則。
注意
從 HPC Pack 2008 R2 搭配 SP3 開始,支援工作站節點和非受控伺服器節點。 舊版 HPC Pack 2008 R2 僅支援工作站節點。
可用性原則會指定當節點可供使用時,每周有一或多個時間週期,以執行叢集作業。 您可以指定每周多個時間,讓節點可供執行作業,例如,工作日的每天晚上和週末的所有日子。 叢集會在每個在線時間區塊的開頭自動讓工作站節點和非受控伺服器節點上線。 然後,節點會立即可供執行已提交至叢集的作業。 在每次區塊結束時,節點會自動脫機。 或者,當工作站節點上執行的任何作業和 Unmanaged 伺服器節點清空時,您可以指定在線區塊結束前的時間間隔。
如果您的Microsoft HPC Pack 版本支援,您也可以在範本中設定用戶活動偵測設定。 用戶活動偵測設定可確保叢集只會在在線時間區塊期間,在工作站節點上執行作業,以及非使用中非受控伺服器節點(根據鍵盤、滑鼠或 CPU 活動)。 如需詳細資訊,請參閱 瞭解使用者活動偵測。
可用性原則與 [工作取消寬限期] 設定的互動
設定自動可用性原則時,工作站節點和 Unmanaged 伺服器節點不會在在線時間區塊通過之後啟動作業。 不過,如果已設定 [工作取消寬限期] 設定,仍在在線時間區塊結尾執行的 HPC 工作可以繼續執行一段時間。 工作取消寬限期叢集屬性可讓應用程式儲存狀態資訊,並在結束前清除一段時間(預設期間為15秒)。 工作結束的確切時間取決於工作是否回應CTRL_BREAK事件的速度(相當於 CTRL+BREAK 鍵組合)。 未處理事件的工作會立即結束,而處理事件的工作可能需要一段工作取消寬限期才能正常結束。
由於工作取消寬限期一律會在工作站節點和非受控伺服器節點的在線時間區塊結尾開始,因此這些節點可能會在工作取消寬限期期間繼續執行 HPC 工作(或直到工作處理CTRL_BREAK事件並停止為止)。 HPC 工作可以在用戶繼續節點上的活動之後繼續執行;不過,潛在的重疊時間可能很短。
注意
工作站節點上的工作取消寬限期開頭不會受到可用性原則中工作清空期間設定的影響。
如果已設定工作取消寬限期,建議的最佳做法是避免在未排程時間意外地在工作站節點上執行 HPC 工作和 Unmanaged 伺服器節點:
盡可能指定工作取消寬限期的值(例如,以秒為單位的值,而不是分鐘)。
請確定在使用工作取消寬限期的工作站節點上執行的 HPC 應用程式可以快速清除並結束。 收到CTRL_BREAK事件后不久未結束的應用程式,只要工作取消寬限期,就可以繼續執行。
如果您的 HPC Pack 版本支援,請在可用性原則中設定用戶活動偵測設定。 這些設定有助於確保 HPC 工作在工作站上以低於正常優先順序執行,並在工作站上偵測到用戶活動時立即放棄系統。
其他考慮
根據每周可用性原則設定為上線和離線的工作站節點和非受控伺服器節點,無法手動上線或離線。 若要將這些節點設定為手動上線和離線,您必須指派給它們不同的工作站節點範本,或者您必須修改其目前的工作站節點範本。
對節點範本所做的變更會影響指派範本的所有工作站節點和非受控伺服器節點。
如果您想要針對不同工作站節點和 Unmanaged 伺服器節點群組有不同的可用性原則,請建立不同的節點範本以套用至每個群組。