ジョブとタスクの状態について
HPC Pack では、ジョブとタスクのライフ サイクル状態はほぼ同じです。 主なライフサイクルの状態は、の構成、
ジョブとタスクの状態
状態 | 定義 |
---|---|
の構成 | ジョブまたはタスクはシステム内にありますが、キューに送信されていません。 |
送信 | ジョブまたはタスクが送信され、キューに入れる前に検証を待機しています。 |
検証 | HPC ジョブ スケジューラ サービスは、ジョブまたはタスクを検証しています。 検証中、HPC ジョブ スケジューラ サービスはアクセス許可を確認し、ジョブ所有者が指定しなかったプロパティに既定の設定を適用し、各プロパティを制約に照らして検証します。 既定の設定と制約は、ジョブ テンプレートによって定義されます。 ジョブ テンプレートの詳細については、「ジョブ テンプレートについて - ジョブ マネージャー」を参照してください。 HPC ジョブ スケジューラ サービスでは、ジョブ プロパティにすべてのタスク プロパティが含まれていることも確認されます (たとえば、ジョブの実行時よりも値が大きい実行時間を持つタスクはありません)。 検証中に、ジョブはクラスター管理者によって定義されたカスタム申請フィルター アプリケーションを通過する場合もあります。 ジョブが検証に合格すると、キュー 状態 |
キューに登録された を |
ジョブまたはタスクが検証に合格し、スケジュールされてアクティブ化 (実行) されるのを待機しています。 実行中のジョブ、Basic タスク、または のパラメトリック スイープ サブタスクが HPC ジョブ スケジューラ サービスによって割り込まれると、キューに登録された 状態に戻ります (タスクが再実行できない場合は、失敗としてマークされます)。 |
ディスパッチ | この状態はタスクにのみ適用されます。 HPC ジョブ スケジューラ サービスは、タスクにリソースを割り当て、割り当てられたノードに接続してタスクの実行を開始します。 タスクが開始されると、実行中の 状態に移動します。 |
実行中の | ジョブまたはタスクが 1 つ以上のノードで実行されています。 |
仕上げ | ジョブまたはタスクが完了し、ジョブまたはタスクのクリーンアップが進行中です。 |
Finished | ジョブまたはタスクが正常に完了しました。 |
失敗した | ジョブまたはタスクの完了、実行の停止、または失敗を示す終了コード (既定では 0 以外の終了コード) が返されました。 さらに、実行中のタスクは、次の場合 失敗した としてマークされます。 - ジョブ所有者またはクラスター管理者がタスクを取り消します。 - HPC ジョブ スケジューラ サービスは、タスクの最大実行時間を超えたため、タスクを取り消します。 - HPC ジョブ スケジューラ サービスは、再実行可能としてマークされていないタスクを優先します。 - HPC ジョブ スケジューラ サービスは、リソースごとに開始されるサブタスク (ノード準備、ノード リリース、および Service サブタスク) を優先します。 クラスターの障害が原因でジョブまたはタスクの開始に失敗した場合、ジョブまたはタスクは、指定された回数だけ自動的に再試行され、失敗としてマークされます。 |
の取り消しを |
ジョブまたはタスクが取り消され、クリーンアップが進行中です。 |
取り消された の |
ジョブは、ジョブ所有者、クラスター管理者、または HPC ジョブ スケジューラ サービスによって取り消されました。 たとえば、HPC ジョブ スケジューラ サービスは、ジョブがランタイムを超えた場合、または割り込まれた場合にジョブを取り消すことができます。 実行を開始する前に、ジョブ所有者またはクラスター管理者によってタスクが取り消されました。 実行中のタスクが取り消された場合、タスクは Failedとしてマークされます。 ジョブまたはタスクを取り消すには、「 |