Поделиться через


Мониторинг кластеров с помощью служба работоспособности

Применимо к: Локальные версии Azure, версии 23H2 и 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Первый выпуск служба работоспособности в Windows Server 2016 улучшает повседневный мониторинг и операционный интерфейс кластеров, работающих Локальные дисковые пространства.

Необходимые компоненты

Служба работоспособности включена по умолчанию для локальных дисковых пространств. Не требуется никаких дополнительных действий для ее настройки и запуска. Дополнительные сведения о Локальные дисковые пространства см. в обзоре Локальные дисковые пространства.

История производительности кластеров

Получение сведений о производительности и емкости в реальном времени из кластера Локальные дисковые пространства. См . журнал производительности кластера.

Ошибки службы работоспособности

Отображение текущих ошибок, чтобы легко проверить работоспособность развертывания. Просмотр ошибок служба работоспособности.

действия служба работоспособности

Отслеживайте ход выполнения служба работоспособности действий, выполняемых автономно. См. статью "Отслеживание служба работоспособности действий".

Автоматизация

В следующем разделе описываются рабочие процессы жизненного цикла диска, которые автоматизирует служба работоспособности.

Жизненный цикл диска

Служба работоспособности автоматизирует практически все этапы жизненного цикла физического диска. Предположим, что изначально развертывание находится в идеальном состоянии, то есть все физические диски работают должным образом.

Выходное пособие

Физические диски автоматически снимаются с учета, если их невозможно использовать. При этом создается соответствующее сообщение об ошибке. Причины этого могут быть разные:

  • Сбой носителя: несомненный сбой или поломка физического диска, требуется замена диска.
  • Потеря связи: физический диск теряет подключение более чем на 15 минут подряд.
  • Отсутствие ответа: ответ от физического диска задерживался более чем на 5 секунд как минимум 3 раза за час.

Примечание.

Если утрачено соединение одновременно с несколькими физическими дисками, со всем узлом или дисковой полкой, служба работоспособности не снимает диски с учета, так как, скорее всего, они не являются главной проблемой.

Если снятый с учета диск выполнял функции кэша для нескольких других физических дисков, то для них автоматически назначается новый диск кэша (если он доступен). Никаких действий со стороны пользователя не требуется.

Восстановление устойчивости

После снятия с учета физического диска служба работоспособности немедленно начинает копировать данные на оставшиеся физические диски, чтобы восстановить полную устойчивость. После завершения этой операции данные снова полностью защищены и отказоустойчивы.

Примечание.

Для такого немедленного восстановления требуется наличие достаточной емкости на оставшихся физических дисках.

Мигающий световой индикатор

Если возможно, служба работоспособности активирует мигание светового индикатора на снятом с учета физическом диске или на его слоте. Мигание продолжается неограниченно долго, вплоть до замены снятого с учета диска.

Примечание.

При некоторых сбоях, например при полной потере питания, становится невозможным даже мигание индикатора.

Физическая замена

Снятый с учета физический диск следует заменить как можно быстрее. Чаще всего это состоит из горячего переключения , т. е. выключения узла или корпуса хранилища не требуется. В описании ошибки представлена полезная информация о проблемной детали и ее расположении.

Проверка

При вставке диска замены оно будет проверено в документе поддерживаемых компонентов (см. следующий раздел).

Объединение в пулы

Если новый диск признается допустимым, он автоматически занимает место своего предшественника в пуле и берет на себя его функции. На этом этапе система возвращается в исходное состояние идеальной работоспособности и ошибка исчезает.

Документ поддерживаемых компонентов

Служба работоспособности предоставляет механизм принудительного применения для ограничения компонентов, используемых Локальные дисковые пространства в документе поддерживаемых компонентов, предоставленном администратором или поставщиком решения. Благодаря этому можно предотвратить случайное использование неподдерживаемого оборудования, что помогает соблюсти условия гарантии или договора. Эта функция в настоящее время ограничена физическими дисками, включая диски SSD, жесткие диски и NVMe. Документ поддерживаемых компонентов может ограничить модель, изготовитель (необязательно) и версию встроенного ПО (необязательно).

Использование

В документе поддерживаемых компонентов используется синтаксис, вдохновленный XML. Мы рекомендуем использовать любимый текстовый редактор, например бесплатный Visual Studio Code или Блокнот, чтобы создать XML-документ, который можно сохранить и повторно использовать.

Разделы

В документе есть два независимых раздела: Disks и Cache.

Если этот Disks раздел указан, только диски, перечисленные (как Disk), могут присоединяться к пулам. Любые незаписанные диски не могут присоединяться к пулам, что фактически исключает их использование в рабочей среде. Если этот раздел остается пустым, все диски будут разрешены для объединения пулов.

Cache Если указан раздел, для кэширования используются только диски, перечисленные (какCacheDisk). Если этот раздел остается пустым, Локальные дисковые пространства пытается угадать данные на основе типа носителя и типа шины. Диски, перечисленные здесь, также должны быть перечислены в Disks.

Внимание

Документ поддерживаемых компонентов не применяется ретроактивно к дискам, уже объединенным в пул и используемым.

Пример

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Чтобы вывести список нескольких дисков, просто добавьте дополнительные <Disk> или <CacheDisk> теги.

Чтобы внедрить этот XML-код при развертывании Локальные дисковые пространства, используйте -XML параметр:

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Чтобы задать или изменить документ поддерживаемых компонентов после развертывания Локальные дисковые пространства:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Примечание.

Модель, изготовитель и версия встроенного ПО должны полностью совпадать с теми значениями, которые возвращает командлет Get-PhysicalDisk. В некоторых случаях эти значения отличаются от того, что подсказывает здравый смысл. Например, производитель может быть обозначен как "CONTOSO-LTD" вместо "Contoso", или это поле остается пустым, зато для модели указывается значение "Contoso-XZY9000".

Эти данные можно проверить с помощью командлета PowerShell:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

параметры служба работоспособности

Измените параметры служба работоспособности, чтобы настроить агрессивность ошибок или действий, включить или отключить определенные действия и многое другое. См. раздел "Изменение служба работоспособности параметров".

Дополнительные справочники