Überwachen von Clustern mit dem Integritätsdienst
Gilt für: Azure Local, Versionen 23H2 und 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Der Integritätsdienst wurde erstmals in Windows Server 2016 veröffentlicht und optimiert die tägliche Überwachung und den Betrieb von Clustern, in denen „Direkte Speicherplätze“ ausgeführt wird.
Voraussetzungen
Für „Direkte Speicherplätze“ ist der Integritätsdienst standardmäßig aktiviert. Für seine Einrichtung und seinen Start sind keine weiteren Aktionen erforderlich. Weitere Informationen zu „Direkte Speicherplätze“ finden Sie in der Übersicht über „Direkte Speicherplätze“.
Clusterleistungsverlauf
Hier können Sie Liveinformationen zur Leistung und Kapazität aus Ihrem Cluster vom Typ „Direkte Speicherplätze“ abrufen. Weitere Informationen finden Sie unter Abrufen des Clusterleistungsverlaufs.
Integritätsdienstfehler
Hier können Sie alle aktuellen Fehler anzeigen und mühelos die Integrität Ihrer Bereitstellung überprüfen. Weitere Informationen finden Sie unter Anzeigen von Integritätsdienstfehlern.
Nachverfolgen von Aktionen des Integritätsdiensts
Hier können Sie den Fortschritt autonom ausgeführter Aktionen des Integritätsdiensts nachverfolgen. Weitere Informationen finden Sie unter Nachverfolgen von Aktionen des Integritätsdiensts.
Automation
Im nächsten Abschnitt werden Workflows beschrieben, die vom Integritätsdienst im Lebenszyklus von Datenträgern automatisiert werden.
Lebenszyklus von Datenträgern
Der Integritätsdienst automatisiert die meisten Phasen des Lebenszyklus physischer Datenträger. Angenommen, der Ausgangsstatus Ihrer Bereitstellung ist eine perfekte Integrität, was heißt, dass alle physischen Datenträger ordnungsgemäß funktionieren.
Außerkraftsetzung
Physische Datenträger werden automatisch deaktiviert, wenn sie nicht mehr verwendet werden können, woraufhin ein entsprechender Fehler ausgelöst wird. Es gibt mehrere Fälle:
- Medienfehler: Der physische Datenträger ist definitiv ausgefallen oder beschädigt und muss ausgetauscht werden.
- Kommunikationsverlust: Der physische Datenträger hatte 15 Minuten lang keine Verbindung.
- Keine Reaktion: Der physische Datenträger hatte binnen einer Stunde dreimal oder öfter eine Latenz von 5,0 Sekunden zu verzeichnen.
Hinweis
Wenn die Verbindung mit zahlreichen physischen Datenträgern gleichzeitig bzw. mit einem gesamten Knoten oder Speichergehäuse verloren geht, werden diese Datenträger vom Integritätsdienst nicht deaktiviert, weil sie wahrscheinlich nicht die Ursache sind.
Wenn der deaktivierte Datenträger als Cache für viele andere physische Datenträger fungiert hat, werden diese, sofern verfügbar, automatisch einem anderen Cachedatenträger neu zugewiesen. Es ist keine spezielle Benutzeraktion erforderlich.
Wiederherstellen der Ausfallsicherheit
Nachdem ein physischer Datenträger deaktiviert wurde, beginnt der Integritätsdienst sofort mit dem Kopieren seiner Daten auf die restlichen physischen Datenträger, um die vollständige Ausfallsicherheit wiederherzustellen. Sobald dies abgeschlossen ist, sind die Daten vollständig sicher und wieder fehlertolerant.
Hinweis
Die sofortige Wiederherstellung erfordert ausreichend verfügbare Kapazität auf den verbleibenden physischen Datenträgern.
Blinken der Leuchte
Falls möglich, aktiviert der Integritätsdienst das Blinken der Leuchte auf dem deaktivierten physischen Datenträger oder an seinem Steckplatz. Dies wird dauerhaft fortgesetzt, bis der deaktivierte Datenträger ausgetauscht wird.
Hinweis
Mitunter kann der Datenträger ggf. auf eine Weise ausfallen, die selbst das Funktionieren der Leuchte verhindert, z. B. beim Totalausfall des Stroms.
Physischer Austausch
Nach Möglichkeit sollten Sie den deaktivierten physischen Datenträger austauschen. In den meisten Fällen erfolgt hierfür ein Austausch bei laufendem Betrieb, d. h. das Ausschalten des Knotens oder Speichergehäuses ist nicht erforderlich. In den Informationen zum Fehler finden Sie hilfreiche Angaben zu Stelle und Teil.
Überprüfung
Wenn der Ersatzdatenträger eingesetzt wird, wird er anhand des Dokuments mit unterstützten Komponenten überprüft (siehe nächster Abschnitt).
Pooling
Falls zulässig, wird der Austauschdatenträger automatisch dem Pool seines Vorgängers hinzugefügt, um den Betrieb aufzunehmen. Sobald der Fehler verschwunden ist, wird das System in seinen Ausgangszustand mit perfekter Integrität zurückgesetzt.
Dokument mit unterstützten Komponenten
Der Integritätsdienst stellt einen Erzwingungsmechanismus zur Verfügung, um die von „Direkte Speicherplätze“ verwendeten Komponenten auf die Komponenten in einem Dokument mit unterstützten Komponenten zu beschränken, das vom Administrator oder Lösungsanbieter bereitgestellt wird. Diese kann verwendet werden, um eine versehentliche Nutzung nicht unterstützter Hardware durch Sie oder andere zu verhindern, sodass Garantie- und Supportvertragsbedingungen besser eingehalten werden. Diese Funktionalität ist derzeit auf Geräte mit physischen Datenträgern wie SSD-, HDD- und NVMe-Laufwerke beschränkt. Das Dokument mit unterstützten Komponenten kann auf Modell, Hersteller (optional) und Firmwareversion (optional) beschränkt werden.
Verbrauch
Das Dokument mit unterstützten Komponenten verwendet eine von XML inspirierte Syntax. Es wird empfohlen, den bevorzugten Text-Editor (z. B. den kostenlosen Editor Visual Studio Code oder Windows-Editor) für die Erstellung eines XML-Dokuments zu verwenden, das Sie speichern und wiederverwenden können.
Abschnitte
Das Dokument enthält zwei unabhängige Abschnitte: Disks
und Cache
.
Wird der Abschnitt Disks
angegeben, dürfen nur die aufgeführten Laufwerke (als Disk
) Pools beitreten. Das Hinzufügen nicht aufgeführter Laufwerke zu Pools wird verhindert, sodass sie nicht in der Produktionsumgebung eingesetzt werden können. Wenn dieser Abschnitt leer gelassen wird, dürfen alle Laufwerke Pools beitreten.
Wird der Abschnitt Cache
angegeben, dürfen nur die aufgeführten Laufwerke (als CacheDisk
) zum Zwischenspeichern verwendet werden. Wenn dieser Abschnitt leer gelassen wird, versucht „Direkte Speicherplätze“, anhand des Medientyps und des Bustyps eine Schätzung vorzunehmen. Die hier aufgeführten Laufwerke sollten auch in Disks
aufgeführt sein.
Wichtig
Das Dokument mit unterstützten Komponenten gilt nicht rückwirkend für Laufwerke, die bereits zu einem Pool gehören und genutzt werden.
Beispiel
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
Um mehrere Laufwerke auflisten zu können, fügen Sie einfach zusätzliche Tags vom Typ <Disk>
oder <CacheDisk>
hinzu.
Verwenden Sie den Parameter -XML
, um diesen XML-Code beim Bereitstellen von „Direkte Speicherplätze“ einzufügen:
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
So legen Sie das Dokument mit unterstützten Komponenten fest oder ändern es, wenn „Direkte Speicherplätze“ bereitgestellt wurde:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
Hinweis
Die Eigenschaften „Model“, „Manufacturer“ und „FirmwareVersion“ müssen exakt mit den Werten übereinstimmen, die Sie mit dem Cmdlet Get-PhysicalDisk abrufen. Je nach Implementierung des Herstellers weichen diese von Ihren Erwartungen ab. Anstatt „Contoso“ kann der Hersteller (Manufacturer) „CONTOSO-LTD“ heißen, oder dieser Eintrag ist leer, während das Modell „Contoso-XZY9000“ ist.
Sie können dies mit dem folgenden PowerShell-Cmdlet überprüfen:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
Ändern der Integritätsdiensteinstellungen
Durch Ändern der Integritätsdiensteinstellungen können Sie unter anderem die Aggressivität von Fehlern oder Aktionen anpassen oder bestimmte Verhaltensweisen aktivieren bzw. deaktivieren. Weitere Informationen finden Sie unter Ändern der Integritätsdiensteinstellungen.