Поделиться через


Сценарии отработки отказа кластера на устройстве GPU Azure Stack Edge Pro

В этой статье описываются распространенные сценарии отработки отказа, реагирование устройства Azure Stack Edge и общее влияние на рабочие нагрузки, развернутые в кластере, в случае отработки отказа.

Сведения об отработке отказа

Azure Stack Edge можно настроить как отдельное устройство или кластер с двумя узлами. В кластере с двумя узлами кластеризованные узлы обеспечивают высокий уровень доступности для приложений и служб, работающих в кластере.

Если один из кластеризованных узлов завершается сбоем, другой узел начинает предоставлять службу . Этот процесс называется отработки отказа. Отработка отказа также может произойти, если аппаратные компоненты, связанные с одним или обоими узлами устройства, такими как диски, блоки питания (PSUS), или сбой сети или при обновлении узлов устройства.

Сценарии отработки отказа

Отработка отказа может произойти в результате сбоя аппаратного компонента, сбоя узла или при обновлении кластера Azure Stack Edge.

Аппаратные сбои

В этих таблицах приведены сценарии сбоя для физического аппаратного компонента, связанного с кластером устройств, например одного или нескольких дисков, питания или сети.

Сбои дискового диска

Узел A Узел B Отказоустойчивый кластер Отработка отказа Сведения
Сбой 1 диска Без сбоев Да No Кластер снижается до тех пор, пока диск не будет заменен.
Сбой 2 или нескольких дисков Без сбоев Да No Кластер снижается до тех пор, пока диск не будет заменен.
Сбой 1 или нескольких дисков Сбой 1 или нескольких дисков Нет Кластер переходит в автономный режим.

Сбои блока питания

Узел A Узел B Отказоустойчивый кластер Отработка отказа Сведения
Сбой 1 PSU Без сбоев Да No Другой сбой питания на узле A приведет к отработке отказа на узел B.
Сбой 1 PSU Сбой 1 PSU Да No Другой сбой питания на любом узле приведет к отработке отказа.
Сбой 2 ЦС Без сбоев Да Да Виртуальные машины на узле A отработка отказа на узел B.
Сбой 2 PSUs (ТБ C) Сбой 1 PSU Да Да Виртуальные машины на узле A отработка отказа на узел B.
Сбой 2 ЦС Сбой 2 ЦС Нет Кластер переходит в автономный режим.

Сбои сети

Узел A Узел B Отказоустойчивый кластер Отработка отказа Сведения
Сбой порта 1, порта 2, порта 5 или порта 6 Без сбоев Да No Сбой порта недоступен. Приложения, прослушивающие этот порт, влияют
Сбой 1 или обоих портов 3 и порта 4 Без сбоев Да Да Отработка отказа виртуальных машин на узле A на узел B

Сбои узлов и обновления

Сбой узла

В этой таблице приведены сценарии сбоя, когда в кластере произошел сбой всего узла.

Узел A Узел B Отказоустойчивый кластер Отработка отказа Сведения
Сбой всего узла Без сбоев Да Да Отработка отказа виртуальных машин с узла A на узел B
Сбой всего узла Сбой всего узла Нет - Кластер переходит в автономный режим
Перезагрузка Без сбоев Да Да Отработка отказа виртуальных машин с узла A на узел B
Перезагрузка Перезагрузка Нет - Кластер находится в автономном режиме до завершения перезагрузки
Основной компонент завершается ошибкой. Например, системная плата, диск DIMM и ОС. Без сбоев Да Да Отработка отказа виртуальных машин с узла A на узел B
Основной компонент завершается ошибкой. Например, системная плата, диск DIMM и ОС. Основной компонент завершается ошибкой. Например, системная плата, диск DIMM и ОС. Нет - Кластер переходит в автономный режим

Обновление узла

Узел A Узел B Отказоустойчивый кластер Отработка отказа Сведения
Обновление узла Без сбоев Да Да Отработка отказа виртуальных машин с узла A на узел B
Обновление узла Сбой 2 ЦС Нет - Кластер переходит в автономный режим
Обновление узла Сбой всего узла или переход в автономный режим Нет - Кластер переходит в автономный режим
Обновление узла Перезагрузка Нет - Кластер переходит в автономный режим
Обновление узла Основной компонент завершается ошибкой, например материнской платы, DIMM и диска ОС. Нет - Кластер переходит в автономный режим

Следующие шаги