Überwachen von Knoten
Ein wichtiger Schritt bei der Überwachung und Aufrechterhaltung der Clusterintegrität besteht darin, abweichungen vom normalen Betriebszustand oder der Normalenleistung zu identifizieren. MIT HPC Cluster Manager können Sie den Cluster- und Knotenstatus auf einen Blick anzeigen, Problemknoten identifizieren und einen Drilldown zu Knotendetails zur weiteren Untersuchung ausführen.
In diesem Thema:
Korrelieren der Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnose
Überwachen der Clusternutzung und -statistiken im Laufe der Zeit
Anzeigen des Clusterstatus auf einen Blick
In Knotenverwaltung können Sie Ihren Cluster auf einen Blick mithilfe der Knoten- Listenansicht oder der Knoten-Wärmebild--Ansicht überwachen. In Diagrammen und Berichtzeigen die Überwachungsdiagramme aktuelle und aktuelle Daten zur Knotenintegrität und Clusternutzung an. Weitere Informationen finden Sie unter
Drilldown zu einzelnen Knotendetails
Die ansichten List and Heat Map bieten einen Ausgangspunkt für die Identifizierung von Problembereichen. Doppelklicken Sie auf einen Computeknoten, um detaillierte Informationen wie Hardware, Betriebssystemeigenschaften und aktuelle Leistungsmetriken anzuzeigen. Sie können auch einen oder mehrere Knoten auswählen und dann einen Drilldown in die Knotendetails ausführen, um die Leistung zu untersuchen.
Ausführen von Diagnosetests und -berichten: Ausführen von Diagnosetests auf einem oder mehreren Computeknoten.
Anzeigen von Leistungsdiagrammen: Anzeigen eines Diagramms der Leistungsmetriken für einen Berechnungsknoten im Laufe der Zeit.
Anzeigen von Knotenereignissen: Anzeigen von Ereignissen, die von HPC-Diensten auf einem bestimmten Computeknoten generiert wurden.
Öffnen sie eine Remotedesktopverbindung mit Ihren Knoten vom HPC Cluster Manager: Öffnen Sie eine Remotedesktopsitzung für einen oder mehrere Computeknoten.
Überwachen von Knotenvorgängen
Das Nachverfolgen neuer oder fortlaufender Clustervorgänge ist ein weiterer Überwachungsaspekt, der für die Verwaltung eines Clusters von entscheidender Bedeutung ist. Weitere Informationen finden Sie unter
Korrelieren der Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnosen
Im HPC Job Manager können Sie die Pivot To Aktionen verwenden, um die Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnosen zu korrelieren. Sie können beispielsweise einen oder mehrere Knoten im Ansichtsbereich auswählen und dann zu den Aufträgen für die ausgewählten Knotenpivotieren. Dadurch gelangen Sie zu einer Auftragslistenansicht, die nach den von Ihnen ausgewählten Knoten gefiltert wird.
Die unterstützten Pivotpfade sind:
Knoten: pivotieren zu Aufträgen, Testergebnissen und Vorgängen.
Aufträge: Pivot auf Knoten.
Testergebnisse: Pivot zu fehlgeschlagenen Knoten und Vorgängen.
Überwachen der Clusternutzung und -statistiken im Laufe der Zeit
HPC Cluster Manager bietet mehrere integrierte Diagramme und Berichte zum Überwachen und Analysieren von Clusterressourcennutzung und Auftrags- und Knotenstatistiken im Laufe der Zeit. Die HPCReporting Datenbank unterstützt auch benutzerdefinierte Berichte. Weitere Informationen finden Sie unter Diagramme und Berichte: HPC Cluster Manager.