設定和編輯 Databricks 工作
本文著重於使用 [工作流程] 工作區 UI 建立、設定和編輯工作的指示。
Azure Databricks 會將工作當做 Databricks 作業的元件來管理。 作業有一或多個工作。 您可以藉由設定第一個工作,在工作區 UI 中建立新的作業。 若要設定新的作業,請參閱設定和編輯 Databricks 作業。
每個工作都有一個相關聯的計算資源,可執行工作邏輯。 如果您使用無伺服器,Azure Databricks 會設定計算資源。 如果您未使用無伺服器,請參閱設定作業的計算。
Azure Databricks 有其他進入點和工作設定的工具,包括以下:
建立或設定工作
若要使用工作區 UI 編輯現有的工作或新增新工作,請使用下列步驟選取現有的作業:
- 按一下側邊欄中的 [工作流程]。
- 在 [名稱] 資料行,按下工作名稱。
- 按下 [工作] 索引標籤。工作圖表隨即出現。
- 若要編輯工作,請按下工作名稱。 工作組態會出現在工作圖表下方。
- 若要新增工作,請按下 。
工作類型
組態選項和指令會因工作而異。 以下是可用的工作類型:
複製工作
複製工作以複製現有工作的所有組態,包括上游相依性。
若要複製工作,請執行下列動作:
- 在工作圖表中選取工作。
- 按一下 。
- 指定 [複製的工作名稱],然後按下 [複製]。
刪除工作
若要刪除工作,請執行下列動作:
- 在工作圖表中選取工作。
- 按下 並選取 [刪除工作]。
複製工作路徑
某些工作類型,例如筆記本工作,可讓您將路徑複製到工作原始程式碼:
- 按下 [工作] 索引標籤。
- 選取包含要複製路徑的工作。
- 按下工作路徑旁的 ,將路徑複製到剪貼板。
進階工作設定
下列進階設定可控制失敗工作的重試,以及未回應工作的逾時原則。
注意
您可以在工作或作業層級設定通知。 請參閱 在作業上新增通知。
設定重試原則
工作重試的預設設定取決於作業組態。 針對大部分的組態,預設設定不會重試工作失敗的任何工作。
無伺服器作業預設會自動最佳化重試。 請參閱設定無伺服器計算自動最佳化,以禁止重試
連續作業會使用指數輪詢重試原則。 請參閱如何處理連續作業的失敗?。
若要設定原則,以確定任務執行重試失敗的時間和次數,請按一下 [重試] 旁邊的 [+ 新增]。
重試間隔以毫秒為單位進行計算,從失敗執行開始到隨後的重試執行。
注意
如果您同時設定 [逾時] 和 [重試],則逾時會套用至每個重試。
設定工作執行期間或串流待辦專案計量的閾值
重要
Databricks 作業的串流可觀察性 公開預覽版。
您可以設定工作執行持續時間或串流待辦專案計量的選擇性閾值。 若要設定持續時間臨界值或串流計量閾值,請按一下工作組態面板中 計量閾值。
若要設定任務工期閾值,包括工作的預期和最大完成時間,請在 [
若要設定串流待辦專案計量的臨界值,請選取 [計量] 下拉功能表中的計量,然後輸入閾值的值。 若要瞭解串流來源支援的特定計量,請參閱 檢視串流工作的計量。
若要設定工作的預期完成時間,請在 [警告] 欄位中輸入持續時間。 如果任務超過此閾值,就會觸發事件。 您可以使用此事件在任務執行緩慢時發出通知。 請參閱 慢速作業通知設定。
若要設定任務的完成時間上限,請在 [逾時] 欄位中輸入最大持續時間。 如果任務未在此時間完成,Azure Databricks 會將其狀態設定為「逾時」。
如果因為超過臨界值而觸發事件,您可以使用 事件來傳送通知。 請參閱 設定慢速作業的通知。