Freigeben über


Überwachen von Knoten

Ein wichtiger Schritt bei der Überwachung und Aufrechterhaltung der Clusterintegrität besteht darin, abweichungen vom normalen Betriebszustand oder der Normalenleistung zu identifizieren. MIT HPC Cluster Manager können Sie den Cluster- und Knotenstatus auf einen Blick anzeigen, Problemknoten identifizieren und einen Drilldown zu Knotendetails zur weiteren Untersuchung ausführen.

In diesem Thema:

Anzeigen des Clusterstatus auf einen Blick

In Knotenverwaltung können Sie Ihren Cluster auf einen Blick mithilfe der Knoten- Listenansicht oder der Knoten-Wärmebild--Ansicht überwachen. In Diagrammen und Berichtzeigen die Überwachungsdiagramme aktuelle und aktuelle Daten zur Knotenintegrität und Clusternutzung an. Weitere Informationen finden Sie unter

Drilldown zu einzelnen Knotendetails

Die ansichten List and Heat Map bieten einen Ausgangspunkt für die Identifizierung von Problembereichen. Doppelklicken Sie auf einen Computeknoten, um detaillierte Informationen wie Hardware, Betriebssystemeigenschaften und aktuelle Leistungsmetriken anzuzeigen. Sie können auch einen oder mehrere Knoten auswählen und dann einen Drilldown in die Knotendetails ausführen, um die Leistung zu untersuchen.

Überwachen von Knotenvorgängen

Das Nachverfolgen neuer oder fortlaufender Clustervorgänge ist ein weiterer Überwachungsaspekt, der für die Verwaltung eines Clusters von entscheidender Bedeutung ist. Weitere Informationen finden Sie unter

Korrelieren der Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnosen

Im HPC Job Manager können Sie die Pivot To Aktionen verwenden, um die Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnosen zu korrelieren. Sie können beispielsweise einen oder mehrere Knoten im Ansichtsbereich auswählen und dann zu den Aufträgen für die ausgewählten Knotenpivotieren. Dadurch gelangen Sie zu einer Auftragslistenansicht, die nach den von Ihnen ausgewählten Knoten gefiltert wird.

Die unterstützten Pivotpfade sind:

  • Knoten: pivotieren zu Aufträgen, Testergebnissen und Vorgängen.

  • Aufträge: Pivot auf Knoten.

  • Testergebnisse: Pivot zu fehlgeschlagenen Knoten und Vorgängen.

Überwachen der Clusternutzung und -statistiken im Laufe der Zeit

HPC Cluster Manager bietet mehrere integrierte Diagramme und Berichte zum Überwachen und Analysieren von Clusterressourcennutzung und Auftrags- und Knotenstatistiken im Laufe der Zeit. Die HPCReporting Datenbank unterstützt auch benutzerdefinierte Berichte. Weitere Informationen finden Sie unter Diagramme und Berichte: HPC Cluster Manager.

In diesem Abschnitt