持續執行作業
使用連續模式來排程工作負載以持續執行。 Databricks 建議針對一律開啟串流工作負載使用連續模式。
連續模式會取代結構化串流工作負載的舊版建議,以無限制的重試原則和最多一次並行執行來設定作業。
重要
作業的無伺服器計算不支援連續模式。
設定作業以連續模式執行
若要設定作業以連續模式執行,請執行下列動作:
- 在側邊欄中,按下 [工作流程]。
- 在 [名稱] 資料行,按下 [作業] 索引標籤。
- 按下 [作業詳細資料] 面板中的 [新增觸發程序],在 [觸發程序類型] 中選取 [連續],然後按下 [儲存]。
若要停止連續作業,請按下 [暫停] 按鈕。 按下 [繼續] 以連續模式重新啟動作業。
注意
- 連續作業只能有一個執行中的執行個體。
- 執行完成和新的執行開始之間存在延遲。 此延遲應小於 60 秒。
- 您無法使用工作相依性搭配連續作業。
- 您無法將使用 [重試原則} 搭配連續作業。 相反地,連續作業會使用 [指數輪詢] 來管理作業執行失敗。
- 選取 [立即 執行] 以在暫停的持續作業上觸發新作業執行。
- 若要讓連續作業挑選新的設定,請取消現有的執行。 新的執行會自動啟動。 您也可以按下 [重新啟動執行] 以使用更新的組態重新啟動作業執行。
如何處理連續作業的失敗?
Azure Databricks 使用 [指數輪詢] 配置來管理連續失敗的連續作業。 指數輪詢可讓連續作業在沒有暫停的情況下執行,並在發生可復原失敗時回到狀況良好的狀態。
當連續作業超過連續失敗的允許閾值時,下列描述後續作業的執行管理方式:
- 工作會在系統設定的重試期間之後重新啟動。
- 如果下一個作業執行失敗,重試期間就會增加,而且作業會在這個新的重試期間之後重新啟動。
- 針對每個後續的作業執行失敗,重試期間會增加至系統所設定的重試期間上限。 達到重試期間上限之後,工作會使用重試期間上限繼續重試。 連續作業的重試次數沒有限制。
- 如果作業執行順利完成並啟動新的執行,或如果執行超過閾值而沒有失敗,則作業會視為狀況良好,而輪詢順序會重設。
您可以在 [作業 UI] 中以指數輪詢狀態重新啟動連續作業,或將作業 ID 傳遞至 Jobs 2.1 API 中的 POST /api/2.1/jobs/run-now 要求或 Jobs 2.0 API 中的 POST /api/2.0/jobs/run-now 要求。