Bewerten der Integrität des AKS-Clusters
Dieser Artikel ist Teil einer Serie. Beginnen Sie mit der Übersicht.
Zu Beginn Ihrer Selektierungsübung, bewerten Sie die allgemeine Integrität des Clusters und des Netzwerks.
Extras
Es gibt viele Tools und Features, mit denen Sie Probleme in Ihrem AKS-Cluster diagnostizieren und lösen können.
Navigieren Sie im Azure-Portal zu Ihrer AKS-Clusterressource. Diese Tools und Features befinden sich im Navigationsbereich.
Diagnose und Problembehandlung: Sie können dieses Tool verwenden, um Probleme innerhalb Ihres Clusters zu identifizieren und zu beheben.
Ressourcenintegrität: Mithilfe dieses Tools können Sie Dienstprobleme diagnostizieren und Support für Dienstprobleme erhalten, die sich auf Ihre Azure-Ressourcen auswirken können. Dieses Tool bietet Informationen zum aktuellen und vergangenen Status Ihrer Ressourcen.
Advisor-Empfehlungen: Azure Advisor fungiert als personalisierter Cloudberater und führt Sie zu bewährten Methoden zur Optimierung Ihrer Azure-Bereitstellungen. Sie können Advisor verwenden, um Ihre Ressourcenkonfiguration und Nutzungstelemetriedaten zu analysieren. Advisor schlägt Lösungen vor, damit Sie die Kosteneffizienz, Leistung, Zuverlässigkeit und Sicherheit verbessern können.
Protokolle: Verwenden Sie dieses Feature, um auf die Clusterprotokolle und Metriken zuzugreifen, die im Log Analytics--Arbeitsbereich gespeichert werden. Sie können die Protokolle und Metriken Ihres Clusters überwachen und analysieren, um Erkenntnisse zu gewinnen und die Problembehandlung zu verbessern.
Verwenden Sie diese Tools und Features, damit Sie Probleme effektiv diagnostizieren und beheben, Ihre AKS-Clusterbereitstellung optimieren und die Integrität und Leistung Ihrer Azure-Ressourcen überwachen können.
Diagnose und Problembehandlung
Das Feature Diagnose und Problembehandlung bietet eine umfassende Palette von Tools, die Ihnen bei der Identifizierung und Lösung verschiedener Probleme im Zusammenhang mit Ihrem Cluster helfen. Wählen Sie die Problembehandlungskategorie aus, die für Ihr Problem am relevantesten ist.
Um die Clusterintegrität zu überprüfen, können Sie Folgendes auswählen:
- Verfügbarkeit und Leistung von Cluster- und Steuerungsebenen: Überprüfen Sie, ob Probleme mit der Dienstverfügbarkeit oder Einschränkung vorliegen, die sich auf die Integrität des Clusters auswirken.
- Konnektivitätsprobleme: Überprüfen Sie, ob Fehler bei der Auflösung des Clusterdomänensystems (Domain Name System, DNS) auftreten oder ob bei der ausgehenden Kommunikationsroute Verbindungsprobleme vorliegen.
Ressourcenintegrität
Die Funktion Ressourcenintegrität hilft Ihnen bei der Identifizierung von Cluster- und Serviceproblemen, die die Integrität Ihres Clusters beeinträchtigen könnten, und beim Anfordern von Support. Richten Sie eine Ressourcenwarnung ein, damit Sie die Integrität Ihres Clusters einfach überwachen können. Diese Ressourcenintegritätsfunktion stellt einen Bericht zur aktuellen und früheren Integrität Ihres Clusters bereit. Es gibt vier Integritätsstatuswerte:
Verfügbar: Dieser Status bedeutet, dass keine Ereignisse erkannt werden, die sich auf die Integrität des Clusters auswirken. Wenn der Cluster innerhalb der letzten 24 Stunden nach ungeplanter Ausfallzeit wiederhergestellt wurde, wird die Benachrichtigung Kürzlich aufgelöst angezeigt.
Nicht verfügbar: Dieser Status gibt an, dass der Dienst ein aktives plattformbezogenes oder nicht plattformbezogenes Ereignis erkannt hat, das die Integrität des Clusters beeinträchtigt.
Unbekannt: Wenn die Funktion seit mehr als 10 Minuten keine Informationen über die Ressource erhalten hat, wird dieser Status angezeigt. Dieser Status wird in der Regel angezeigt, wenn die Zuordnung eines virtuellen Computers aufgehoben wird. Dieser Status ist definitiver Hinweis auf den Ressourcenzustand, kann aber ein wichtiger Datenpunkt für die Problembehandlung sein.
Herabgestuft: Dieser Status gibt an, dass bei Ihrem Cluster ein Leistungsverlust auftritt, der Cluster ist jedoch weiterhin verwendet werden kann.
Der folgende Screenshot bietet eine Übersicht über die Ressourcenintegrität.
Weitere Informationen finden Sie unter Übersicht über die Azure-Ressourcenintegrität.
Advisor
Azure Advisor bietet umsetzbare Empfehlungen, mit denen Sie Ihre AKS-Cluster in Bezug auf Zuverlässigkeit, Sicherheit, optimalen Betrieb und Leistung optimieren können. Sie können Azure Advisor nutzen, um proaktiv die Leistung Ihres Clusters zu verbessern und potenzielle Probleme zu vermeiden. Wählen Sie eine Empfehlung aus, um detaillierte Informationen zur Optimierung Ihres Clusters zu erhalten.
Der folgende Screenshot zeigt die Ressourcen für die ausgewählte Empfehlung.
Weitere Informationen finden Sie unter Azure Advisor – Übersicht.
Log Analytics
Log Analytics bietet Erkenntnisse über die Integrität des Clusters. Um auf den Log Analytics-Arbeitsbereich zuzugreifen, wechseln Sie zu Ihrem AKS-Cluster, und wählen Sie im Navigationsbereich Protokolle aus.
Sie können vordefinierte Abfragen auswählen, um die Clusterintegrität zu analysieren.
Verwenden Sie integrierte Abfragen zum Abfragen der Im Log Analytics-Arbeitsbereich gesammelten Protokolle und Metriken. In der folgenden Liste wird die Funktion einiger Abfragen in den Kategorien „Verfügbarkeit“, „Containerprotokolle“ und „Diagnose“ beschrieben.
Verfügbarkeit
Abfrage Bereitschaftsstatus pro Knoten: Anzeigen der Anzahl aller Knoten im Cluster anhand des Bereitschaftsstatus.
Abfrage Liste der gesamten Podanzahl nach Phase: Anzeigen der Anzahl aller Pods nach der Phase, z. B. fehlgeschlagen, ausstehend, unbekannt, ausgeführt oder erfolgreich.
Containerprotokolle
Abfrage Wert in Containerprotokolltabelle finden: Finden von Zeilen in der Tabelle ContainerLogs, in denen LogEntry einen bestimmten String-Parameter enthält.
Abfrage Listencontainerprotokolle pro Namespace: Anzeigen der Containerprotokolle aus den Namespaces im Cluster.
Diagnose
Abfrage Cluster-Autoskalierungsprotokolle: Abfragen von Protokollen aus der Cluster-Autoskalierung. Diese Abfrage kann Informationen dazu bereitstellen, warum der Cluster unerwartet nach oben oder unten skaliert wird.
Abfrage Kubernetes-API-Serverprotokolle: Abfragen von Protokollen vom Kubernetes-API-Server.
Abfrage Bildinventar: Auflisten aller Containerimages und deren Status.
Abfrage Prometheus-Datenträgerlesevorgang pro Sekunde pro Knoten: Anzeigen der Prometheus-Datenträgerlesemetriken aus dem Kubernetes-Standardnamespace als Zeitdiagramm.
Abfrage Wachstum der durchschnittlichen CPU-Auslastung der Instanzen seit letzter Woche: Anzeigen des Wachstums der durchschnittlichen CPU-Auslastung pro Instanz in der letzten Woche in absteigender Reihenfolge.
Beitragende
Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:
Hauptautoren:
- Paolo Salvatori | Principal Customer Engineer
- Francis Simy Nazareth | Senior Technical Specialist
Andere Mitwirkende:
- Rong Zhang | Senior Product Manager
Melden Sie sich bei LinkedIn an, um nicht öffentliche LinkedIn-Profile anzuzeigen.