共用方式為


針對後續復原的節點未就緒失敗進行疑難解答

本文可協助針對Microsoft Azure Kubernetes Service (AKS) 叢集中節點顯示節點未就緒狀態,但會自動復原至狀況良好狀態的案例進行疑難解答。

徵兆

您注意到當節點回報其狀態為「未就緒」時,您的應用程式會停止回應。 不過,節點會自動復原,現在它會尋找根本原因分析 (RCA)。

原因

此問題的可能原因包括下列案例:

  • API 伺服器無法使用,而且您使用的是部署的整備探查。

    如果 Pod 正在執行但尚未就緒,則這種情況表示整備探查失敗。 如果整備探查失敗,Pod 不會連結至服務,且流量不會轉送至 Pod 實例。

  • 發生虛擬機 (VM) 主機錯誤。 若要判斷是否發生 VM 主機錯誤,請檢查下列資訊來源:

預護

若要防止此問題在未來發生,請採取下列一或多個動作:

  • 請確定您的服務層級已完全付費。
  • 減少 API 伺服器的 和 get 要求數目watch
  • 以狀況良好的節點集區取代節點集區。

其他相關資訊