Сценарии отработки отказа кластера на устройстве GPU Azure Stack Edge Pro
В этой статье описываются распространенные сценарии отработки отказа, реагирование устройства Azure Stack Edge и общее влияние на рабочие нагрузки, развернутые в кластере, в случае отработки отказа.
Сведения об отработке отказа
Azure Stack Edge можно настроить как отдельное устройство или кластер с двумя узлами. В кластере с двумя узлами кластеризованные узлы обеспечивают высокий уровень доступности для приложений и служб, работающих в кластере.
Если один из кластеризованных узлов завершается сбоем, другой узел начинает предоставлять службу . Этот процесс называется отработки отказа. Отработка отказа также может произойти, если аппаратные компоненты, связанные с одним или обоими узлами устройства, такими как диски, блоки питания (PSUS), или сбой сети или при обновлении узлов устройства.
Сценарии отработки отказа
Отработка отказа может произойти в результате сбоя аппаратного компонента, сбоя узла или при обновлении кластера Azure Stack Edge.
Аппаратные сбои
В этих таблицах приведены сценарии сбоя для физического аппаратного компонента, связанного с кластером устройств, например одного или нескольких дисков, питания или сети.
Сбои дискового диска
Узел A | Узел B | Отказоустойчивый кластер | Отработка отказа | Сведения |
---|---|---|---|---|
Сбой 1 диска | Без сбоев | Да | No | Кластер снижается до тех пор, пока диск не будет заменен. |
Сбой 2 или нескольких дисков | Без сбоев | Да | No | Кластер снижается до тех пор, пока диск не будет заменен. |
Сбой 1 или нескольких дисков | Сбой 1 или нескольких дисков | Нет | Кластер переходит в автономный режим. |
Сбои блока питания
Узел A | Узел B | Отказоустойчивый кластер | Отработка отказа | Сведения |
---|---|---|---|---|
Сбой 1 PSU | Без сбоев | Да | No | Другой сбой питания на узле A приведет к отработке отказа на узел B. |
Сбой 1 PSU | Сбой 1 PSU | Да | No | Другой сбой питания на любом узле приведет к отработке отказа. |
Сбой 2 ЦС | Без сбоев | Да | Да | Виртуальные машины на узле A отработка отказа на узел B. |
Сбой 2 PSUs (ТБ C) | Сбой 1 PSU | Да | Да | Виртуальные машины на узле A отработка отказа на узел B. |
Сбой 2 ЦС | Сбой 2 ЦС | Нет | Кластер переходит в автономный режим. |
Сбои сети
Узел A | Узел B | Отказоустойчивый кластер | Отработка отказа | Сведения |
---|---|---|---|---|
Сбой порта 1, порта 2, порта 5 или порта 6 | Без сбоев | Да | No | Сбой порта недоступен. Приложения, прослушивающие этот порт, влияют |
Сбой 1 или обоих портов 3 и порта 4 | Без сбоев | Да | Да | Отработка отказа виртуальных машин на узле A на узел B |
Сбои узлов и обновления
Сбой узла
В этой таблице приведены сценарии сбоя, когда в кластере произошел сбой всего узла.
Узел A | Узел B | Отказоустойчивый кластер | Отработка отказа | Сведения |
---|---|---|---|---|
Сбой всего узла | Без сбоев | Да | Да | Отработка отказа виртуальных машин с узла A на узел B |
Сбой всего узла | Сбой всего узла | Нет | - | Кластер переходит в автономный режим |
Перезагрузка | Без сбоев | Да | Да | Отработка отказа виртуальных машин с узла A на узел B |
Перезагрузка | Перезагрузка | Нет | - | Кластер находится в автономном режиме до завершения перезагрузки |
Основной компонент завершается ошибкой. Например, системная плата, диск DIMM и ОС. | Без сбоев | Да | Да | Отработка отказа виртуальных машин с узла A на узел B |
Основной компонент завершается ошибкой. Например, системная плата, диск DIMM и ОС. | Основной компонент завершается ошибкой. Например, системная плата, диск DIMM и ОС. | Нет | - | Кластер переходит в автономный режим |
Обновление узла
Узел A | Узел B | Отказоустойчивый кластер | Отработка отказа | Сведения |
---|---|---|---|---|
Обновление узла | Без сбоев | Да | Да | Отработка отказа виртуальных машин с узла A на узел B |
Обновление узла | Сбой 2 ЦС | Нет | - | Кластер переходит в автономный режим |
Обновление узла | Сбой всего узла или переход в автономный режим | Нет | - | Кластер переходит в автономный режим |
Обновление узла | Перезагрузка | Нет | - | Кластер переходит в автономный режим |
Обновление узла | Основной компонент завершается ошибкой, например материнской платы, DIMM и диска ОС. | Нет | - | Кластер переходит в автономный режим |
Следующие шаги
- Изучите раздел Размеры и типы виртуальных машин для Azure Stack Edge Pro.