針對後續復原的節點未就緒失敗進行疑難解答
本文提供指南,以針對 Azure Kubernetes Service (AKS) 叢集中的「節點未就緒」問題進行疑難解答和解決。 當節點進入「未就緒」狀態時,可能會中斷應用程式的功能,並導致它停止回應。 一般而言,節點會在短時間內自動復原。 不過,若要防止週期性問題和維護穩定的環境,請務必瞭解能夠實作有效解決的根本原因。
原因
有幾個案例可能會導致「未就緒」狀態發生:
API 伺服器無法使用。 這會導致整備探查失敗。 這可防止 Pod 連結至服務,讓流量不再轉送至 Pod 實例。
虛擬機 (VM) 主機錯誤。 若要判斷是否發生 VM 主機錯誤,請檢查下列資訊來源:
解決方法
執行 kubectl get apiservices
命令來檢查 API 伺服器的可用性。 請確定部署 YAML 檔案中已正確設定整備探查。
如需進一步步驟,請參閱 節點未就緒失敗的基本疑難解答。
預護
若要防止此問題在未來發生,請採取下列一或多個動作:
- 請確定您的服務層級已完全付費。
- 減少 API 伺服器的 和
get
要求數目watch
。