Экземпляры масштабируемого набора виртуальных машин Azure не восстанавливаются даже при включении политики автоматического восстановления
Экземпляры Azure VMSS остаются в состоянии "Неработоспособный" и не восстанавливаются даже при включении политики автоматического восстановления. В этой статье приведены возможные причины и соответствующие решения для этой проблемы:
- Политика автоматического восстановления не включена в масштабируемом наборе.
- Мониторинг работоспособности неправильно настроен в масштабируемом наборе.
- Экземпляр помечается неработоспособным из-за сбоя подготовки.
- Автоматическое восстановление приостановлено в масштабируемом наборе из-за слишком большого количества неудачных исправлений.
- Экземпляр находится в его льготном периоде.
Политика автоматического восстановления не включена в масштабируемом наборе
Убедитесь, что vmSS настроена на автоматическое восстановление, просмотрев состояние службы.
В свойстве orchestrationServices
, если serviceState
для автоматического восстановления задано Running
значение, vmSS будет включена в автоматический ремонт.
serviceState
NotRunning
Если политика автоматического восстановления не отображается в свойствеorchestrationServices
, необходимо включить политику автоматического восстановления в масштабируемом наборе. Дополнительные сведения см. в разделе "Включение политики автоматического восстановления" при обновлении существующего масштабируемого набора.
Если это serviceState
Suspended
так, перейдите к автоматическому восстановлению в масштабируемом наборе из-за слишком большого количества неудачных исправлений.
Мониторинг работоспособности неправильно настроен в масштабируемом наборе
Если все экземпляры в масштабируемом наборе отображаются как "Неработоспособный", это может быть признак того, что проба мониторинга работоспособности настроена неправильно во время установки. Убедитесь, что приложение выдает ожидаемые ответы HTTP/HTTPS/TCP на настроенные конечные точки.
Чтобы достичь состояния работоспособности приложения, пробы расширения работоспособности приложения или пробы работоспособности подсистемы балансировки нагрузки требуют, как минимум, ответ 2xx HTTP(S) или успешное подтверждение TCP из приложения в настроенной конечной точке. Если ожидаемый ответ не получен, будет сообщено состояние "Неработоспособное". Убедитесь, что правильные сигналы работоспособности создаются приложением в указанную конечную точку.
Дополнительные сведения о ожидаемых ответах TCP/HTTP(S) для проб работоспособности подсистемы балансировки нагрузки см. в разделе "Пользовательские пробы Load Balancer".
Дополнительные сведения о ожидаемых ответах TCP/HTTP(S) для проб расширений работоспособности приложений см. в разделе "Настройка конечной точки для предоставления состояния работоспособности" раздела "Требования к использованию автоматического восстановления экземпляров".
Экземпляр помечается неработоспособным из-за сбоя подготовки
Используйте представление экземпляров с API версии 2019-12-01 или выше для VMSS, чтобы просмотреть состояние подготовки экземпляров из statusesSummary
virtualMachine
свойства.
REST API
GET '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Compute/virtualMachineScaleSets/{vmScaleSetName}/instanceView?api-version=2019-12-01'
"virtualMachine": {
"statusesSummary": [
{
"code": "ProvisioningState/succeeded",
"count": 2
}
]
}
Если у вас есть кодstatusesSummary
, удалите неудачный ProvisioningState/failed
экземпляр и добавьте новый экземпляр в масштабируемый набор. Восстановление экземпляров в настоящее время не поддерживает сценарии, в которых виртуальная машина помечена как "Неработоспособная" из-за сбоя подготовки.
Чтобы удалить неудачный экземпляр из масштабируемого набора, см. статью "Удаление виртуальных машин из масштабируемого набора".
Сведения о добавлении нового экземпляра в масштабируемый набор см. в разделе "Изменение емкости масштабируемого набора".
Автоматическое восстановление приостановлено в масштабируемом наборе из-за слишком большого количества неудачных исправлений
Если приложение продолжает выдавать сигнал "Неработоспособное" после повторных попыток восстановления, платформа в конечном итоге приостанавливает восстановление экземпляра Suspended
в качестве меры безопасности путем изменения serviceState
автоматического восстановления на .
Подтвердите serviceState
политику автоматического восстановления. Для этого просмотрите и обновите состояние службы политики автоматического восстановления экземпляров.
Если это serviceState
Suspended
так, возобновите автоматическое восстановление, обновив serviceState
обратно на Running
использование setOrchestrationServiceState
API и примеры командлетов в просмотре и обновлении состояния службы политики автоматического восстановления экземпляров.
Экземпляр находится в его льготном периоде
Если ни одна из указанных выше причин не применима к проблеме, экземпляр может находиться в его льготном периоде.
Льготный период — это период времени автоматического восстановления, который будет ожидать после любого изменения состояния экземпляра перед выполнением ремонта, что помогает избежать преждевременного или случайного восстановления. Действие исправления должно начаться, как только закончится отсчет периода отсрочки для экземпляра. Дополнительные сведения о настройке льготного периода для автоматического восстановления см. в разделе "Льготный период".
Свяжитесь с нами для получения помощи
Если у вас есть вопросы или вам нужна помощь, создайте запрос в службу поддержки или обратитесь за поддержкой сообщества Azure. Вы также можете отправить отзыв о продукте в сообщество отзывов Azure.