共用方式為


設定和編輯 Databricks 工作

本文著重於使用 [工作流程] 工作區 UI 建立、設定和編輯工作的指示。

Azure Databricks 會將工作當做 Databricks 作業的元件來管理。 作業有一或多個工作。 您可以藉由設定第一個工作,在工作區 UI 中建立新的作業。 若要設定新的作業,請參閱設定和編輯 Databricks 作業

每個工作都有一個相關聯的計算資源,可執行工作邏輯。 如果您使用無伺服器,Azure Databricks 會設定計算資源。 如果您未使用無伺服器,請參閱設定作業的計算

Azure Databricks 有其他進入點和工作設定的工具,包括以下:

建立或設定工作

若要使用工作區 UI 編輯現有的工作或新增新工作,請使用下列步驟選取現有的作業:

  1. 按一下側邊欄中的 工作流程圖示 [工作流程]
  2. 在 [名稱] 資料行,按下工作名稱。
  3. 按下 [工作] 索引標籤。工作圖表隨即出現。
  4. 若要編輯工作,請按下工作名稱。 工作組態會出現在工作圖表下方。
  5. 若要新增工作,請按下 [新增工作] 按鈕

工作類型

組態選項和指令會因工作而異。 以下是可用的工作類型:

複製工作

複製工作以複製現有工作的所有組態,包括上游相依性。

若要複製工作,請執行下列動作:

  1. 在工作圖表中選取工作。
  2. 按一下 複製工作按鈕
  3. 指定 [複製的工作名稱],然後按下 [複製]

刪除工作

若要刪除工作,請執行下列動作:

  1. 在工作圖表中選取工作。
  2. 按下 資源回收筒 並選取 [刪除工作]

複製工作路徑

某些工作類型,例如筆記本工作,可讓您將路徑複製到工作原始程式碼:

  1. 按下 [工作] 索引標籤。
  2. 選取包含要複製路徑的工作。
  3. 按下工作路徑旁的 作業複製圖示,將路徑複製到剪貼板。

進階工作設定

下列進階設定可控制失敗工作的重試,以及未回應工作的逾時原則。

注意

您可以在工作或作業層級設定通知。 請參閱 在作業上新增通知

設定重試原則

工作重試的預設設定取決於作業組態。 針對大部分的組態,預設設定不會重試工作失敗的任何工作。

無伺服器作業預設會自動最佳化重試。 請參閱設定無伺服器計算自動最佳化,以禁止重試

連續作業會使用指數輪詢重試原則。 請參閱如何處理連續作業的失敗?

若要設定原則,以確定任務執行重試失敗的時間和次數,請按一下 [重試] 旁邊的 [+ 新增]。

重試間隔以毫秒為單位進行計算,從失敗執行開始到隨後的重試執行。

注意

如果您同時設定 [逾時] 和 [重試],則逾時會套用至每個重試。

設定工作執行期間或串流待辦專案計量的閾值

重要

Databricks 作業的串流可觀察性 公開預覽版

您可以設定工作執行持續時間或串流待辦專案計量的選擇性閾值。 若要設定持續時間臨界值或串流計量閾值,請按一下工作組態面板中 計量閾值

若要設定任務工期閾值,包括工作的預期和最大完成時間,請在 [ 計量] 下拉功能表中選取 [執行工期] 。 在 [警告] 字段中輸入工期,以設定工作的預期完成時間。 如果工作執行超過此閾值,就會觸發事件。 若要設定任務的完成時間上限,請在 [逾時] 欄位中輸入最大持續時間。 如果任務未在此時間完成,Azure Databricks 會將其狀態設定為「逾時」。

若要設定串流待辦專案計量的臨界值,請選取 [計量] 下拉功能表中的計量,然後輸入閾值的值。 若要瞭解串流來源支援的特定計量,請參閱 檢視串流工作的計量

若要設定工作的預期完成時間,請在 [警告] 欄位中輸入持續時間。 如果任務超過此閾值,就會觸發事件。 您可以使用此事件在任務執行緩慢時發出通知。 請參閱 慢速作業通知設定

若要設定任務的完成時間上限,請在 [逾時] 欄位中輸入最大持續時間。 如果任務未在此時間完成,Azure Databricks 會將其狀態設定為「逾時」。

如果因為超過臨界值而觸發事件,您可以使用 事件來傳送通知。 請參閱 設定慢速作業的通知