瞭解工作類型
在 HPC Pack 中,Type task 屬性有助於定義如何執行命令。 task Type 的預設值是 Basic。 Basic 工作會執行命令一次。 其他工作類型會建立每個執行命令實例的子工作。 工作最多可以包含 1,000,000 個子工作。
注意
在包含子工作的工作中,您可以使用星號 ≦ 字元作為參數掃掠索引的佔位元(在 參數掃掠 工作中)或子工作標識符(在 Service中、節點準備,以及 節點發行 工作)。 您可以包含一個以上的星號 。 表示索引或子工作數目時要使用的最小位置數目。 這不會限制需要更多位置的數位。 定義命令或工作的輸入和輸出檔案時,這個佔位元很有用。 如需詳細資訊和範例,請參閱使用子工作 工作和星號。
下表描述屬性值:
任務類型值 | 描述 | 操作說明 |
---|---|---|
基本 | 執行序列應用程式或訊息傳遞介面 (MPI) 應用程式的單一實例。 MPI 應用程式通常會在多個核心上同時執行,而且可以跨越多個節點。 | 定義基本或 MPI 工作 |
參數掃掠 | 執行命令的指定次數(以開始、結束和遞增值表示),通常跨索引的輸入和輸出檔案。 掃掠的步驟可能或可能不會平行執行,視工作執行時叢集上可用的資源而定。 | 定義參數式掃掠工作 |
節點準備 | 在配置給作業的每個計算節點上執行命令或腳本,即使節點會動態新增 (成長原則)。
節點準備 工作會在作業中的任何其他工作之前,於節點上執行。 如果 節點準備 工作無法在節點上執行,則該節點將不會新增至作業。 |
定義節點準備工作 |
節點發行 | 在從作業釋放時,在計算每個節點上執行命令或腳本,即使節點會動態移除 (壓縮原則)。 節點發行 工作的最大運行時間(以秒為單位),是由叢集管理員使用 NodeReleaseTaskTimeout cluster 參數來定義。 您無法覆寫此執行時間限制。 根據預設,逾時會設定為15秒。 若要查看此叢集參數的值,您可以執行下列命令(搜尋字串區分大小寫): cluscfg listparams|find “NodeReleaseTaskTimeout” 節點發行 工作取消時執行。 當強制取消作業時,節點發行 工作不會執行。 注意: 如果作業運行時間上限和 節點發行 工作,作業排程器會在作業運行時間到期之前取消作業中的其他工作(作業運行時間 減 去節點發行工作運行時間)。 這可讓 節點發行 工作在作業的已配置時間內執行。 |
定義 Node ReleaseTask |
Service | 在所有配置給作業的資源上執行命令或服務。 當將新資源新增至作業時,或先前執行中的實例結束時,命令的新實例會執行,且其執行中的資源仍會配置給作業。
服務 工作會繼續啟動實例,直到作業取消或停止、運行時間上限到期,或到達實例數目上限(子工作) 為止。 透過服務導向架構 (SOA) 用戶端提交的工作會以 服務 工作的形式執行。 您無法將 基本 工作或 參數掃掠 工作新增至包含 服務 工作的作業。 |
定義服務工作 |
下列工作屬性不適用於每個資源啟動的工作,而且無法在 節點準備、節點發行或 服務 工作上設定這些屬性:
核心數目、套接字、節點數目
必要節點
獨家
可重新執行
相依性 (工作相依性)
參數掃掠設定