共用方式為


HPC 作業停滯在取消模式中,且新作業未啟動

本文提供在取消模式中停滯執行作業的問題解決方案,而當 Azure SQL 資料庫用於 HPC PACK 遠端資料庫時,新作業無法變成執行中狀態。

徵兆

當您取消執行中的作業時,它們會卡在取消模式中,而提交的新作業仍會排入佇列中,而有可供執行作業的計算節點。 重新啟動節點沒有説明。

同時,平臺即服務 (PaaS) 資料庫達到 100%,而且您會在 HPC 排程器記錄中看到下列錯誤訊息:

排程器伺服器忙碌中。 它現在無法處理用戶端要求。 請稍後再試一次。

原因

之所以發生此問題,是因為前端節點因 PaaS 資料庫達到其效能限制而過度壓力。

解決方法

若要解決此問題,請將 Azure 中排程器資料庫的資料庫交易單位 (DTU) 增加至符合您工作負載的較高 SKU。 HPC 排程器資料庫所需的最小初始 DTU 為 100 DTU。

參考資料

如需詳細資訊,請參閱 步驟 1:準備遠端資料庫

與我們連絡,以取得說明

如果您有問題或需要相關協助,請建立支援要求,或詢問 Azure community 支援。 您也可以向 Azure 意見反應社群提交產品意見反應。