Мониторинг кластеров с помощью службы работоспособности
Применимо к: Azure Local 2311.2 и более поздних версий; Windows Server 2022, Windows Server 2019, Windows Server 2016
Служба работоспособности, впервые выпущенная в Windows Server 2016, улучшает повседневный мониторинг и работу кластеров, выполняющих Storage Spaces Direct.
Предварительные требования
По умолчанию включен Режим работоспособности с использованием Storage Spaces Direct. Не требуется никаких дополнительных действий для ее настройки и запуска. Дополнительные сведения о Локальных дисковых пространствах Direct см. в обзоре Локальные дисковые пространства Direct.
История производительности кластеров
Получайте информацию о производительности и емкости в режиме реального времени от вашего кластера Storage Spaces Direct. См. Историю производительности кластера.
Недостатки в работе службы здравоохранения
Отобразите все текущие ошибки, чтобы легко проверить состояние развертывания. Просмотреть неисправности службы здоровья.
действия службы здравоохранения
Отслеживайте ход выполнения действий, выполняемых автономно службой здравоохранения. См. Отслеживание действий службы здоровья.
Автоматизация
В этом разделе описываются рабочие процессы, которые автоматизирует служба здравоохранения в жизненном цикле диска.
Жизненный цикл диска
Служба здравоохранения автоматизирует большинство этапов жизненного цикла физического диска. Предположим, что ваше развертывание изначально находится в идеальном состоянии, а именно, все физические диски работают должным образом.
Выходное пособие
Физические диски автоматически снимаются с учета, если их невозможно использовать. При этом создается соответствующее сообщение об ошибке. Причины этого могут быть разные:
- Сбой носителя: несомненный сбой или поломка физического диска, требуется замена диска.
- Потеря связи: физический диск теряет подключение более чем на 15 минут подряд.
- Отсутствие ответа: ответ от физического диска задерживался более чем на 5 секунд как минимум 3 раза за час.
Примечание.
Если утрачено соединение одновременно с несколькими физическими дисками, со всем узлом или дисковой полкой, служба мониторинга работоспособности не снимает диски с учета, так как, скорее всего, они не являются первопричиной проблемы.
Если снятый с учета диск выполнял функции кэша для нескольких других физических дисков, то для них автоматически назначается новый диск кэша (если он доступен). Никаких действий со стороны пользователя не требуется.
Восстановление устойчивости
После снятия с учета физического диска служба здоровья немедленно начинает копировать данные на оставшиеся физические диски, чтобы восстановить полную устойчивость. После завершения этой операции данные снова полностью защищены и отказоустойчивы.
Примечание.
Для такого немедленного восстановления требуется наличие достаточной емкости на оставшихся физических дисках.
Мигающий световой индикатор
Если возможно, служба здравоохранения начнёт мигать световым индикатором на выведенном из эксплуатации физическом диске или его слоте. Он будет продолжаться бесконечно, пока снятый с эксплуатации диск не будет заменён.
Примечание.
В некоторых случаях диск может выйти из строя таким образом, что даже индикаторная лампочка перестанет работать, например, при полной потере питания.
Физическая замена
Снятый с учета физический диск следует заменить как можно быстрее. Чаще всего это состоит из горячего переключения , т. е. выключения узла или корпуса хранилища не требуется. В описании ошибки представлена полезная информация о проблемной детали и ее расположении.
Проверка
При вставке диска замены оно будет проверено в документе поддерживаемых компонентов (см. следующий раздел).
Объединение
Если новый диск признается допустимым, он автоматически заменяет своего предшественника в пуле и начинает использоваться. На этом этапе система возвращается в исходное состояние идеальной работоспособности и ошибка исчезает.
Документ поддерживаемых компонентов
Служба здравоохранения предоставляет механизм принудительного применения для ограничения компонентов, используемых Storage Spaces Direct, до тех, которые указаны в документе поддерживаемых компонентов, предоставленном администратором или поставщиком решения. Благодаря этому можно предотвратить случайное использование неподдерживаемого оборудования, что помогает соблюсти условия гарантии или договора. Эта функция в настоящее время ограничена физическими дисками, включая диски SSD, жесткие диски и NVMe. Документ поддерживаемых компонентов может ограничить модель, изготовитель (необязательно) и версию встроенного ПО (необязательно).
Использование
В документе поддерживаемых компонентов используется синтаксис, вдохновленный XML. Мы рекомендуем использовать любимый текстовый редактор, например бесплатный Visual Studio Code или Блокнот, чтобы создать XML-документ, который можно сохранить и повторно использовать.
Разделы
В документе есть два независимых раздела: Disks
и Cache
.
Если этот Disks
раздел указан, только диски, указанные как Disk
, могут присоединяться к пулам. Любые незаписанные диски не могут присоединяться к пулам, что фактически исключает их использование в рабочей среде. Если этот раздел остается пустым, любой диск будет разрешен для объединения в пулы.
Если указан раздел Cache
, для кэширования используются только перечисленные диски (как CacheDisk
). Если этот раздел остается пустым, Storage Spaces Direct пытается определить настройки на основе типа носителя и типа шины. Диски, перечисленные здесь, также должны быть перечислены в Disks
.
Внимание
Документ поддерживаемых компонентов не применяется ретроактивно к дискам, уже объединенным в пул и используемым.
Пример
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
Чтобы вывести список нескольких дисков, просто добавьте дополнительные <Disk>
или <CacheDisk>
теги.
Чтобы вставить этот XML-код при развертывании Storage Spaces Direct, используйте параметр -XML
.
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
Чтобы задать или изменить документ поддерживаемых компонентов после развертывания Storage Spaces Direct:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
Примечание.
Модель, изготовитель и версия встроенного ПО должны полностью совпадать с теми значениями, которые возвращает командлет Get-PhysicalDisk. В некоторых случаях это может отличаться от вашого ожидания, основанного на "здравом смысле", в зависимости от реализации поставщика. Например, производитель может быть обозначен как "CONTOSO-LTD" вместо "Contoso", или это поле остается пустым, зато для модели указывается значение "Contoso-XZY9000".
Эти данные можно проверить с помощью командлета PowerShell:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
настройки службы здравоохранения
Измените параметры службы работоспособности, чтобы настроить интенсивность ошибок и действий, включать или отключать определенные функции и другие параметры. См. изменение параметров службы здоровья.