針對後續復原的節點未就緒失敗進行疑難解答
本文可協助針對Microsoft Azure Kubernetes Service (AKS) 叢集中節點顯示節點未就緒狀態,但會自動復原至狀況良好狀態的案例進行疑難解答。
徵兆
您注意到當節點回報其狀態為「未就緒」時,您的應用程式會停止回應。 不過,節點會自動復原,現在它會尋找根本原因分析 (RCA)。
原因
此問題的可能原因包括下列案例:
API 伺服器無法使用,而且您使用的是部署的整備探查。
如果 Pod 正在執行但尚未就緒,則這種情況表示整備探查失敗。 如果整備探查失敗,Pod 不會連結至服務,且流量不會轉送至 Pod 實例。
發生虛擬機 (VM) 主機錯誤。 若要判斷是否發生 VM 主機錯誤,請檢查下列資訊來源:
預護
若要防止此問題在未來發生,請採取下列一或多個動作:
- 請確定您的服務層級已完全付費。
- 減少 API 伺服器的 和
get
要求數目watch
。 - 以狀況良好的節點集區取代節點集區。
其他相關資訊
- 如需一般疑難解答步驟,請參閱 節點未就緒失敗的基本疑難解答。