Problembehandlung bei Fehlern bei Knoten nicht bereit, die von Wiederherstellungen gefolgt werden
Dieser Artikel enthält einen Leitfaden zur Problembehandlung und Behebung von Problemen mit "Node Not Ready" in Azure Kubernetes Service (AKS)-Clustern. Wenn ein Knoten in den Status "Nicht bereit" wechselt, kann er die Funktionalität der Anwendung stören und dazu führen, dass er nicht mehr reagiert. In der Regel wird der Knoten nach einem kurzen Zeitraum automatisch wiederhergestellt. Um wiederkehrende Probleme zu verhindern und eine stabile Umgebung aufrechtzuerhalten, ist es wichtig, die zugrunde liegenden Ursachen zu verstehen, um effektive Lösungen zu implementieren.
Ursache
Es gibt mehrere Szenarien, die dazu führen können, dass ein Status "Nicht bereit" auftritt:
Die Nichtverfügbarkeit des API-Servers. Dies führt dazu, dass die Bereitschaftssonde fehlschlägt. Dadurch wird verhindert, dass der Pod an den Dienst angefügt wird, sodass der Datenverkehr nicht mehr an die Pod-Instanz weitergeleitet wird.
Vm-Hostfehler. Um zu ermitteln, ob VM-Hostfehler aufgetreten sind, überprüfen Sie die folgenden Informationsquellen:
- AKS-Diagnose
- Azure-Status
- Azure-Benachrichtigungen (für aktuelle Ausfälle oder Wartungszeiträume)
Lösung
Überprüfen Sie die Verfügbarkeit des API-Servers, indem Sie den kubectl get apiservices
Befehl ausführen. Stellen Sie sicher, dass die Bereitschaftssonde in der YaML-Bereitstellungsdatei ordnungsgemäß konfiguriert ist.
Weitere Schritte finden Sie unter Grundlegende Problembehandlung bei Fehlern von Node Not Ready.
Prävention
Um zu verhindern, dass dieses Problem in Zukunft auftritt, führen Sie eine oder mehrere der folgenden Aktionen aus:
- Stellen Sie sicher, dass Ihre Serviceebene vollständig bezahlt ist.
- Verringern Sie die Anzahl und
watch
get
Anforderungen an den API-Server.