Поделиться через


Устранение неполадок с обновлениями решения для локальной версии Azure, версия 23H2

Область применения: Azure Local 2311.2 и более поздних версий

В этой статье описывается, как устранять неполадки с обновлениями решений, применяемыми к локальному каталогу Azure, чтобы обеспечить актуальность.

Сведения об устранении неполадок с обновлениями

Если система была создана с помощью нового развертывания Azure Local, версии 23H2, во время развертывания был установлен оркестратор. Оркестратор управляет всеми обновлениями платформы — ОС, драйверов и встроенного ПО, агентов и служб.

Новое решение обновления включает логику повтора и исправления. Эта логика пытается устранять проблемы с обновлением ненарушительным образом, например, попробовав заново выполнить Cluster-Aware обновления (CAU). Если выполнение обновления не удается исправить автоматически, происходит сбой. При сбое обновления корпорация Майкрософт рекомендует проверить сведения о сообщении об ошибке, чтобы определить соответствующее следующее действие. При необходимости можно попытаться возобновить обновление, чтобы определить, будет ли повторная попытка устранить эту проблему.

Устранение неполадок проверок на готовность

Проверки готовности являются важными для обеспечения плавности применения обновлений, поддержания систем up-to-date и поддержания правильной системной функциональности. Проверки готовности выполняются и передаются отдельно в двух сценариях:

  • Проверки работоспособности системы, которые выполняются раз в 24 часа.

  • Проверка готовности обновления, которая выполняется после скачивания содержимого обновления и перед началом установки.

Обычно результаты проверок работоспособности системы и проверки готовности к обновлению отличаются. Это происходит, так как проверки готовности обновления используют последнюю логику проверки из установленного обновления решения, а проверки работоспособности системы всегда используют логику проверки из установленной версии.

Проверки готовности системы и перед обновлением выполняют аналогичные проверки и классифицируют их на три типа: критические, предупреждающие и информационные.

  • Критичный: проверки готовности, которые препятствуют применению обновления. Это состояние указывает на проблемы, которые необходимо устранить перед продолжением обновления.
  • Предупреждение: проверки готовности, которые также могут предотвратить применение обновления, но их можно обойти с помощью PowerShell. Это состояние указывает на потенциальные проблемы, которые могут быть недостаточно серьезными для остановки обновления, но должны быть устранены для обеспечения плавного процесса обновления.
  • информационные: проверка готовности, которая не блокирует обновление. Это состояние содержит сведения о состоянии системы и о возможных проблемах, которые не должны влиять непосредственно на процесс обновления. Эти проверки предназначены для вашей осведомленности и могут не требовать немедленного действия.

Действия по устранению неполадок отличаются в зависимости от сценария проверки готовности.

Использование портала Azure

сценарии 1. Проверка работоспособности системы

Этот сценарий возникает при подготовке к установке обновлений системы в Диспетчере обновлений Azure:

  1. В списке систем просмотрите состояние критическогоготовности к обновлению.

    снимок экрана страницы Диспетчера обновлений.

  2. Выберите одну или несколько систем из списка, а затем выберите опцию "однократное обновление".

  3. На странице проверка готовности просмотрите список проверок готовности и их результатов.

    1. Выберите просмотреть сведения ссылки в разделе затронутых систем.

    2. Когда откроется окно деталей, вы можете просмотреть дополнительные сведения, отдельные результаты проверки системы и устранение неполадок для проверки работоспособности.

    снимок экрана: страница

    Следуйте инструкциям по исправлению, чтобы устранить ошибки.

    Заметка

    Проверки работоспособности системы выполняются каждые 24 часа, поэтому новые результаты могут потребоваться до 24 часов, чтобы синхронизироваться с порталом Azure после устранения сбоев. Чтобы инициировать новую проверку работоспособности системы немедленно или дополнительное устранение неполадок, ознакомьтесь с разделом PowerShell.

Сценарий 2: Проверки готовности обновлений

Этот сценарий возникает при установке и отслеживании обновлений системы в Azure Update Manager:

  1. В журналевыберите ошибочный запуск обновления из списка.

  2. На странице проверка готовности просмотрите список проверок готовности и их результатов.

    1. Выберите просмотреть сведения ссылки в разделе затронутых систем.

    2. Когда откроется окно деталей, вы можете просмотреть дополнительные сведения, отдельные результаты проверки системы и устранение неполадок для проверки работоспособности.

    снимок экрана страницы хода обновления.

    Следуйте инструкциям по исправлению, чтобы устранить сбои, а затем нажмите кнопку Попробуйте снова, чтобы повторить проверки готовности к обновлению, и кнопку Возобновить обновление.

    Дополнительные сведения об устранении неполадок см. в разделе PowerShell.

Использование PowerShell

сценарии 1. Проверка работоспособности системы

Чтобы устранить неполадки проверки работоспособности системы с помощью PowerShell, выполните следующие действия.

  1. Чтобы проверить, не удалось ли проверка работоспособности системы, выполните следующую команду на одном из компьютеров в вашей системе:

    Get-SolutionUpdateEnvironment
    

    Ниже приведен пример выходных данных.

    PS C:\Users\lcmuser> Get-SolutionUpdateEnvironment 
    ResourceId        : redmond  
    SbeFamily         : VirtualForTesting  
    HardwareModel     : Virtual Machine  
    LastChecked       : 9/12/2023 10:34:42 PM  
    PackageVersions   : {Solution: 10.2309.0.20, Services: 10.2309.0.20, Platform: 1.0.0.0, SBE: 4.0.0.0}  
    CurrentVersion    : 10.2309.0.20  
    CurrentSbeVersion : 4.0.0.0  
    LastUpdated       :  
    State             : AppliedSuccessfully  
    HealthState       : Failure 
    HealthCheckResult : {Storage Pool Summary, Storage Services Physical Disks Summary, Storage Services Physical Disks  
    
                    Summary, Storage Services Physical Disks Summary...}  
    
    HealthCheckDate   : 9/12/2023 7:03:32 AM  
    
    AdditionalData    : {[SBEAdditionalData, Solution Builder extension is partially installed. Please install the latest  
    
                    Solution Builder Extension provided by your hardware vendor.  
    
                    For more information, see https://aka.ms/SBE.]}  
    
    HealthState       : Success  
    HealthCheckResult : {}  
    HealthCheckDate   : 8/4/2022 9:10:36 PM 
    
    PS C:\Users\lcmuser>
    
  2. Проверьте HealthState в вашей системе и просмотрите значение Failure или Warning.

  3. Чтобы отфильтровать свойство HealthCheckResult для выявления неудачных тестов, выполните следующую команду:

    $result = Get-SolutionUpdateEnvironment 
    
    $result.HealthCheckResult | Where-Object {$_.Status -ne "SUCCESS"} | FL Title,Status,Severity,Description,Remediation
    

    Ниже приведен пример выходных данных.

    Title       : The machine proxy on each failover cluster node should be set to a local proxy server 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : `https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness`
    
    Title       : The CAU clustered role should be installed on the failover cluster to enable self-updating mode 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : `https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness`
    
  4. Просмотрите поле Remediation для неудачных тестов и выполните соответствующие действия, чтобы устранить сбои.

  5. После устранения сбоев снова вызовите проверки работоспособности системы, выполнив следующую команду:

    Invoke-SolutionUpdatePrecheck -SystemHealth
    
  6. Используйте Get-SolutionUpdateEnvironment, чтобы убедиться, что неисправности проверки состояния были устранены. Выполнение проверок работоспособности системы может занять несколько минут.

    Ниже приведен пример выходных данных.

    PS C:\Users\lcmuser>  Get-SolutionUpdateEnvironment | FL HealthState, HealthCheckResult, HealthCheckDate 
    
    HealthState       : InProgress 
    HealthCheckResult : 
    HealthCheckDate   : 1/1/0001 12:00:00 AM 
    
    PS C:\Users\lcmuser>  Get-SolutionUpdateEnvironment | FL HealthState, HealthCheckResult, HealthCheckDate
    
    HealthState       : Success 
    
    HealthCheckResult : {Storage Pool Summary, Storage Subsystem Summary, Storage Services Summary, Storage Services 
    
                    Summary...} 
    
    HealthCheckDate   : 10/18/2024 11:56:49 PM 
    

Сценарий 2: Проверки готовности обновлений

Если проверка готовности к обновлению завершается ошибкой, это приводит к сбою обновления в системе. Чтобы устранить неполадки проверки готовности к обновлению с помощью PowerShell, выполните следующие действия.

  1. Чтобы убедиться, что проверка готовности к обновлению завершилась сбоем, выполните следующую команду на одном из компьютеров в вашей системе:

    Get-SolutionUpdate | FT Version,State,HealthCheckResult
    

    Ниже приведен пример выходных данных.

    PS C:\Users\lcmuser> Get-SolutionUpdate | FT Version,State,HealthCheckResult 
    
    Version     State              HealthCheckResult 
    -------     -----              ----------------- 
    10.2405.2.7 HealthCheckFailed {Storage Subsystem Summary, Storage Pool Summary, Storage Services Physical Disks Summary, Stora...                       
    
    PS C:\Users\lcmuser>
    
  2. Просмотрите State для обновления и проверьте значение HealthCheckFailed.

  3. Чтобы отфильтровать свойство HealthCheckResult для выявления неудачных тестов, выполните следующую команду:

    $result = Get-SolutionUpdate 
    $result.HealthCheckResult | Where-Object {$_.Status -ne "SUCCESS"} | FL Title,Status,Severity,Description,Remediation
    

    Ниже приведен пример выходных данных.

    Title       : The machine proxy on each failover cluster node should be set to a local proxy server 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness 
    
    Title       : The CAU clustered role should be installed on the failover cluster to enable self-updating mode 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness
    
  4. Просмотрите поле Remediation для неудачных тестов и выполните соответствующие действия, чтобы устранить сбои.

  5. После устранения сбоев вызовите проверки готовности обновления снова, выполнив следующую команду:

    Get-SolutionUpdate -Id <some ID> | Start-SolutionUpdate -PrepareOnly
    

Устранение неполадок с обновлением

Если возникает проблема, из-за которой обновление завершается ошибкой, лучший способ определить, можно ли её устранить с помощью простой починки (и возобновления), это проанализировать подробный ход выполнения процесса, чтобы найти место сбоя, или требуется взаимодействие с поддержкой для решения проблемы. Ключевые моменты, которые следует отметить на этапе сбоя, включают:

  • Ошибка в имени и описании шага.

  • На каком компьютере или сервере произошел сбой шага (в случае проблемы с конкретным компьютером).

  • Строка сообщения об ошибке (может указывать на конкретную известную проблему с документированным решением).

Корпорация Майкрософт рекомендует использовать портал Azure для идентификации информации об ошибочном шаге, как показано в разделе "Возобновление обновления". Кроме того, см. следующий раздел по просмотру аналогичных сведений в PowerShell с помощью Start-MonitoringActionplanInstanceToComplete.

См. таблицу ниже для сценариев сбоя обновления и рекомендаций по исправлению.

Имена шагов Тип проблемы Исправление
Любой Потеря питания или другие аналогичные прерывания работы системы во время обновления. 1. Восстановление питания.
2. Выполните проверку работоспособности системы.
3. Возобновление обновления.
Обновления CAU Запуск обновления с учетом кластера (CAU) завершается неудачей с ошибкой max retries exceeded. Если есть признаки того, что несколько попыток CAU были сделаны и что все они завершились неудачно, рекомендуется изучить первый сбой.

Используйте время начала и окончания первого сбоя для сопоставления с правильными Get-CauReport выходными данными для дальнейшего изучения сбоя.
Любой Память, питание, драйвер загрузки или аналогичный критический сбой на одном или нескольких узлах. См. статью "Восстановление узла в локальной среде Azure версии 23H2" о том, как восстановить неработоспособный узел.
После восстановления узла можно возобновить обновление.

Сбор журналов обновлений

Вы также можете собирать журналы диагностики, чтобы помочь Корпорации Майкрософт определить и устранить проблемы.

Сведения о сборе журналов обновлений с помощью портала Azure см. в статье Возобновление обновления.

Чтобы собрать журналы о сбое обновления, см. раздел Сбор диагностических журналов для Azure Local, версия 23H2.

Просмотр сводного отчета об обновлении

Чтобы просмотреть подробный сводный отчет об обновлении с помощью PowerShell, выполните следующие действия на клиенте, который вы используете для доступа к системе:

  1. Установите удаленный сеанс PowerShell с компьютером. Запустите PowerShell от имени администратора и выполните следующую команду:

    Enter-PSSession -ComputerName <machine_IP_address> -Credential <username\password for the machine>
    
  2. Получите все обновления решений, а затем отфильтруйте обновления решения, соответствующие определенной версии. Используемая версия соответствует версии обновления решения, которое не удалось установить.

    $Update = Get-SolutionUpdate | ? Version -eq "<Version string>" -verbose
    
  3. Определите план действий для неудачного выполнения обновления решения.

    $Failure = $update | Get-SolutionUpdateRun
    
  4. Определите ResourceID для обновления.

    $Failure
    

    Ниже приведен пример выходных данных.

    PS C:\Users\lcmuser> $Update = Get-SolutionUpdate| ? Version -eq "10.2303.1.7" -verbose
    PS C:\Users\lcmuser> $Failure = $Update|Get-SolutionUpdateRun
    PS C:\Users\lcmuser> $Failure
    
    ResourceId      : redmond/Solution10.2303.1.7/6bcc63af-b1df-4926-b2bc-26e06f460ab0
    Progress        : Microsoft.AzureStack.Services.Update.ResourceProvider.UpdateService.Models.Step
    TimeStarted     : 4/21/2023 10:02:54 PM
    LastUpdatedTime : 4/21/2023 3:19:05 PM
    Duration        : 00:16:37.9688878
    State           : Failed
    

    Обратите внимание на ResourceID GUID. Этот GUID соответствует идентификатору ActionPlanInstanceID.

  5. Ознакомьтесь с ранее отмеченной вами сводкой по ActionPlanInstanceID.

    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID <Action Plan Instance ID>
    

    Ниже приведен пример выходных данных:

    PS C:\Users\lcmuser> Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID 6bcc63af-b1df-4926-b2bc-26e06f460ab0
    

    Снимок экрана с выходными данными журнала, собранными PowerShell.

Возобновление обновления

Чтобы возобновить ранее неудачное обновление, можно повторить запуск обновления с помощью портал Azure или PowerShell.

Портал Azure

Мы настоятельно рекомендуем использовать портал Azure, чтобы перейти к сбою обновления и нажмите кнопку "Повторить попытку". Эта функция доступна на этапах загрузки обновлений, проверки готовности и установки запуска обновления.

снимок экрана с кнопкой повторной попытки после неудачного обновления.

Если вы не можете успешно выполнить неудачное обновление или устранить ошибку еще раз, выполните следующие действия.

  1. Выберите Просмотреть детали ошибки.

  2. При открытии поля сведений можно просмотреть сведения об ошибке. Дополнительные сведения о сборе журналов диагностики можно получить, щелкнув на ссылку Инструкции по сбору журналов рядом с кнопкой «Открыть запрос в службу поддержки».

    снимок экрана, чтобы скачать журналы ошибок.

    Дополнительные сведения о получении журналов см. в статье Сбор журналов диагностики для локальногоAzure.

  3. Кроме того, можно выбрать кнопку Создать запрос в службу поддержки, заполнить соответствующие сведения и присоединить журналы, чтобы они были доступны для службы поддержки Майкрософт.

    снимок экрана, чтобы открыть запрос в службу поддержки.

Дополнительные сведения о создании запроса в службу поддержки см. в статье Создание запроса на поддержку.

PowerShell

Если вы используете PowerShell и хотите возобновить выполнение обновления, завершившейся ранее ошибкой, используйте следующую команду:

Get-SolutionUpdate | ? Version -eq "10.2302.0.31" | Start-SolutionUpdate

Чтобы возобновить обновление из-за сбоя обновления работоспособности в состоянии предупреждения , используйте следующую команду:

Get-SolutionUpdate | ? Version -eq "10.2302.0.31" | Start-SolutionUpdate -IgnoreWarnings

Следующие шаги

Дополнительные сведения о запуске обновлений с помощью PowerShell.

Узнайте больше о том, как запускать обновления с помощью портал Azure.