Partilhar via


Solucionar problemas de atualizações de solução para o Azure Local, versão 23H2

Aplica-se a: Azure Local, versão 23H2

Este artigo descreve como solucionar problemas de atualizações de solução aplicadas ao seu Azure Local para mantê-lo atualizado.

Sobre a solução de problemas de atualizações

Se o seu sistema foi criado por meio de uma nova implantação do Azure Local, versão 23H2, um orquestrador foi instalado durante a implantação. O orquestrador gerencia todas as atualizações para a plataforma - SO, drivers e firmware, agentes e serviços.

A nova solução de atualização inclui uma lógica de repetição e correção. Essa lógica tenta corrigir problemas de atualização de forma sem interrupções, como tentar novamente uma execução de CAU (Cluster-Aware Update). Se uma execução de atualização não puder ser remediada automaticamente, falhará. Quando uma atualização falha, a Microsoft recomenda inspecionar os detalhes da mensagem de falha para determinar a próxima ação apropriada. Você pode tentar retomar a atualização, se apropriado, para determinar se uma nova tentativa resolverá o problema.

Solucionar problemas de verificações de prontidão

As verificações de prontidão são essenciais para garantir que você aplique as atualizações sem problemas, mantenha seus sistemas up-toatualizados e mantenha a funcionalidade correta do sistema. As verificações de prontidão são realizadas e relatadas separadamente em dois cenários:

  • Verificações de integridade do sistema que são executadas uma a cada 24 horas.

  • Verificações de preparação para atualização que são executadas após o download do conteúdo da atualização e antes de iniciar a instalação.

É comum que os resultados das verificações de integridade do sistema e das verificações de prontidão de atualização sejam diferentes. Isso acontece porque as verificações de preparação de atualização usam a lógica de validação mais recente da atualização de solução a ser instalada, enquanto as verificações de integridade do sistema sempre usam a lógica de validação da versão instalada.

As verificações de prontidão do sistema e pré-atualização executam validações semelhantes e categorizam três tipos de verificações de prontidão: Crítica, Aviso e Informativa.

  • Crítico: Verificações de prontidão que impedem a atualização. Esse status indica problemas que você deve resolver antes de prosseguir com a atualização.
  • Aviso: Verificações de preparação que também impedem a aplicação da atualização, mas você pode ignorá-las usando PowerShell. Esse status indica possíveis problemas que podem não ser graves o suficiente para interromper a atualização, mas devem ser resolvidos para garantir um processo de atualização suave.
  • Informativo: verificações de prontidão que não bloqueiam a atualização. Esse status fornece informações sobre o estado do sistema e quaisquer problemas potenciais que não devem afetar o processo de atualização diretamente. Essas verificações são para seu conhecimento e podem não exigir uma ação imediata.

As etapas de solução de problemas diferem dependendo do cenário de onde provêm as verificações de prontidão.

Usando o portal do Azure

Cenário 1: Verificações de integridade do sistema

Este cenário ocorre ao preparar para instalar atualizações do sistema no Azure Update Manager:

  1. Na lista do sistema, exiba o estado Critical do de preparação para atualização.

    Captura de ecrã da página Gestor de Atualizações.

  2. Selecione um ou mais sistemas na lista e, em seguida, selecione Atualização única.

  3. Na página Verificação de prontidão, reveja a lista de verificações de prontidão e seus resultados.

    1. Selecione o Exibir detalhes links em Sistemas afetados.

    2. Quando a caixa de detalhes é aberta, você pode exibir mais detalhes, resultados individuais do sistema e o de correção de para falhas nas verificações de integridade.

    Captura de ecrã da página Instalar atualizações.

    Siga as instruções de correção para resolver as falhas.

    Observação

    As verificações de integridade do sistema são executadas a cada 24 horas, portanto, pode levar até 24 horas para que os novos resultados sejam sincronizados com o portal do Azure após a correção das falhas. Para iniciar uma nova verificação de integridade do sistema imediatamente ou solucionar problemas adicionais, consulte a seção PowerShell.

Cenário 2: Atualizar verificações de preparação

Este cenário ocorre ao instalar e controlar atualizações do sistema no Azure Update Manager:

  1. No Histórico, selecione a execução falhada da atualização na lista.

  2. Na página Verificação de prontidão, reveja a lista de verificações de prontidão e seus resultados.

    1. Selecione o Exibir detalhes links em Sistemas afetados.

    2. Quando a caixa de detalhes é aberta, você pode exibir mais detalhes, resultados individuais do sistema e o de correção de para falhas nas verificações de integridade.

    Captura de ecrã da página Progresso da atualização.

    Siga as instruções de correção para resolver as falhas e, em seguida, selecione o botão Tentar novamente para repetir as verificações de prontidão antes da atualização e Retomar a atualização.

    Para solucionar problemas adicionais, consulte a seção do PowerShell.

Usando o PowerShell

Cenário 1: Verificações de integridade do sistema

Para solucionar problemas de verificações de integridade do sistema por meio do PowerShell:

  1. Para validar que as verificações de integridade do sistema falharam, execute o seguinte comando em uma das máquinas do sistema:

    Get-SolutionUpdateEnvironment
    

    Aqui está um exemplo de saída:

    PS C:\Users\lcmuser> Get-SolutionUpdateEnvironment 
    ResourceId        : redmond  
    SbeFamily         : VirtualForTesting  
    HardwareModel     : Virtual Machine  
    LastChecked       : 9/12/2023 10:34:42 PM  
    PackageVersions   : {Solution: 10.2309.0.20, Services: 10.2309.0.20, Platform: 1.0.0.0, SBE: 4.0.0.0}  
    CurrentVersion    : 10.2309.0.20  
    CurrentSbeVersion : 4.0.0.0  
    LastUpdated       :  
    State             : AppliedSuccessfully  
    HealthState       : Failure 
    HealthCheckResult : {Storage Pool Summary, Storage Services Physical Disks Summary, Storage Services Physical Disks  
    
                    Summary, Storage Services Physical Disks Summary...}  
    
    HealthCheckDate   : 9/12/2023 7:03:32 AM  
    
    AdditionalData    : {[SBEAdditionalData, Solution Builder extension is partially installed. Please install the latest  
    
                    Solution Builder Extension provided by your hardware vendor.  
    
                    For more information, see https://aka.ms/SBE.]}  
    
    HealthState       : Success  
    HealthCheckResult : {}  
    HealthCheckDate   : 8/4/2022 9:10:36 PM 
    
    PS C:\Users\lcmuser>
    
  2. Revise o HealthState em seu sistema e visualize o valor Failure ou Warning.

  3. Para filtrar a propriedade HealthCheckResult para identificar testes com falha, execute o seguinte comando:

    $result = Get-SolutionUpdateEnvironment 
    
    $result.HealthCheckResult | Where-Object {$_.Status -ne "SUCCESS"} | FL Title,Status,Severity,Description,Remediation
    

    Aqui está um exemplo de saída:

    Title       : The machine proxy on each failover cluster node should be set to a local proxy server 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : `https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness`
    
    Title       : The CAU clustered role should be installed on the failover cluster to enable self-updating mode 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : `https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness`
    
  4. Revise o campo Remediation para os testes com falha e tome as medidas apropriadas para resolver as falhas.

  5. Depois de resolver as falhas, invoque as verificações de integridade do sistema novamente executando o seguinte comando:

    Invoke-SolutionUpdatePrecheck -SystemHealth
    
  6. Utilize o Get-SolutionUpdateEnvironment para confirmar que as falhas na verificação de integridade foram resolvidas. Pode levar alguns minutos para que as verificações de integridade do sistema sejam executadas.

    Aqui está um exemplo de saída:

    PS C:\Users\lcmuser>  Get-SolutionUpdateEnvironment | FL HealthState, HealthCheckResult, HealthCheckDate 
    
    HealthState       : InProgress 
    HealthCheckResult : 
    HealthCheckDate   : 1/1/0001 12:00:00 AM 
    
    PS C:\Users\lcmuser>  Get-SolutionUpdateEnvironment | FL HealthState, HealthCheckResult, HealthCheckDate
    
    HealthState       : Success 
    
    HealthCheckResult : {Storage Pool Summary, Storage Subsystem Summary, Storage Services Summary, Storage Services 
    
                    Summary...} 
    
    HealthCheckDate   : 10/18/2024 11:56:49 PM 
    

Cenário 2: Atualizar verificações de preparação

Quando as verificações de preparação da atualização falham, isso faz com que a atualização falhe no sistema. Para solucionar problemas de verificações de prontidão de atualização por meio do PowerShell:

  1. Para validar se as verificações de preparação para atualização falharam, execute o seguinte comando em uma das máquinas do sistema:

    Get-SolutionUpdate | FT Version,State,HealthCheckResult
    

    Aqui está um exemplo de saída:

    PS C:\Users\lcmuser> Get-SolutionUpdate | FT Version,State,HealthCheckResult 
    
    Version     State              HealthCheckResult 
    -------     -----              ----------------- 
    10.2405.2.7 HealthCheckFailed {Storage Subsystem Summary, Storage Pool Summary, Storage Services Physical Disks Summary, Stora...                       
    
    PS C:\Users\lcmuser>
    
  2. Reveja o State da atualização e veja o valor HealthCheckFailed.

  3. Para filtrar a propriedade HealthCheckResult para identificar testes com falha, execute o seguinte comando:

    $result = Get-SolutionUpdate 
    $result.HealthCheckResult | Where-Object {$_.Status -ne "SUCCESS"} | FL Title,Status,Severity,Description,Remediation
    

    Aqui está um exemplo de saída:

    Title       : The machine proxy on each failover cluster node should be set to a local proxy server 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness 
    
    Title       : The CAU clustered role should be installed on the failover cluster to enable self-updating mode 
    Status      : FAILURE 
    Severity    : INFORMATIONAL 
    Description : Validating cluster setup for update. 
    Remediation : https://learn.microsoft.com/en-us/windows-server/failover-clustering/cluster-aware-updating-requirements# 
              tests-for-cluster-updating-readiness
    
  4. Revise o campo Remediation para os testes com falha e tome as medidas apropriadas para resolver as falhas.

  5. Depois de resolver as falhas, invoque as verificações de preparação de atualização novamente executando o seguinte comando:

    Get-SolutionUpdate -Id <some ID> | Start-SolutionUpdate -PrepareOnly
    

Solucionar problemas de falhas de atualização

Se houver um problema que faça com que uma atualização falhe, revisar o progresso detalhado da etapa para identificar onde ela falhou geralmente é a melhor maneira de determinar se o problema é algo que pode ser corrigido por meio de um simples reparo (e retomada) ou se um compromisso de suporte é necessário para resolver o problema. Os principais itens a serem observados para a etapa de falha incluem:

  • Falha no nome e descrição da etapa.

  • Em qual máquina ou servidor a etapa falhou (em caso de um problema específico da máquina).

  • Cadeia de caracteres de mensagem de falha (pode identificar o problema para um problema conhecido específico com correção documentada).

A Microsoft recomenda usar o portal do Azure para identificar as informações sobre a etapa que falhou, conforme mostrado em Retomar uma atualização. Como alternativa, consulte a próxima seção para saber como exibir detalhes semelhantes no PowerShell usando Start-MonitoringActionplanInstanceToComplete.

Consulte a tabela abaixo para obter cenários de falha de atualização e diretrizes de correção.

Nomes das etapas Tipo de emissão Reparação dos danos
Qualquer Perda de energia ou outra interrupção semelhante do sistema durante a atualização. 1. Restaure a energia.
2. Execute uma verificação de integridade do sistema.
3. Retome a atualização.
Atualizações do CAU A execução da Atualização Consciente de Cluster (CAU) falha com um erro max retries exceeded. Se houver uma indicação de que várias tentativas de CAU foram feitas e que todas falharam, geralmente é melhor investigar a primeira falha.

Utilize as horas de início e término da primeira falha para corresponder à saída correta de Get-CauReport e, assim, investigar melhor a falha.
Qualquer Memória, fonte de alimentação, driver de inicialização ou falha crítica semelhante em um ou mais nós. Consulte Reparar um nó no Azure Local, versão 23H2 para saber como reparar o nó com falha.
Uma vez que o nó tenha sido reparado, a atualização pode ser retomada.

Coletar logs de atualização

Você também pode coletar logs de diagnóstico para ajudar a Microsoft a identificar e corrigir os problemas.

Para coletar logs para atualizações usando o portal do Azure, consulte Retomar uma atualização.

Para coletar logs para as falhas de atualização, consulte Coletar logs de diagnóstico para o Azure Local, versão 23H2.

Ver relatório de resumo da atualização

Para exibir um relatório de resumo de atualização detalhado usando o PowerShell, siga estas etapas no cliente que você está usando para acessar seu sistema:

  1. Estabeleça uma sessão remota do PowerShell com a máquina. Execute o PowerShell como administrador e execute o seguinte comando:

    Enter-PSSession -ComputerName <machine_IP_address> -Credential <username\password for the machine>
    
  2. Obtenha todas as atualizações de soluções e, em seguida, filtre as correspondentes a uma versão específica. A versão utilizada corresponde à versão da atualização da solução que não foi instalada.

    $Update = Get-SolutionUpdate | ? Version -eq "<Version string>" -verbose
    
  3. Identifique o plano de ação para a execução da atualização da solução falhada.

    $Failure = $update | Get-SolutionUpdateRun
    
  4. Identifique o ResourceID para a atualização.

    $Failure
    

    Aqui está um exemplo de saída:

    PS C:\Users\lcmuser> $Update = Get-SolutionUpdate| ? Version -eq "10.2303.1.7" -verbose
    PS C:\Users\lcmuser> $Failure = $Update|Get-SolutionUpdateRun
    PS C:\Users\lcmuser> $Failure
    
    ResourceId      : redmond/Solution10.2303.1.7/6bcc63af-b1df-4926-b2bc-26e06f460ab0
    Progress        : Microsoft.AzureStack.Services.Update.ResourceProvider.UpdateService.Models.Step
    TimeStarted     : 4/21/2023 10:02:54 PM
    LastUpdatedTime : 4/21/2023 3:19:05 PM
    Duration        : 00:16:37.9688878
    State           : Failed
    

    Observe o ResourceID GUID. Este GUID corresponde ao ActionPlanInstanceID.

  5. Consulte o resumo do ActionPlanInstanceID que anotaste anteriormente.

    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID <Action Plan Instance ID>
    

    Aqui está o resultado de exemplo:

    PS C:\Users\lcmuser> Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID 6bcc63af-b1df-4926-b2bc-26e06f460ab0
    

    Imagem da saída de logs de coleta do Powershell.

Retomar uma atualização

Para retomar uma execução de atualização com falha anterior, você pode repetir a execução da atualização por meio do portal do Azure ou do PowerShell.

O portal do Azure

É altamente recomendável usar o portal do Azure para navegar até a atualização com falha e selecionar o botão Tentar novamente . Essa funcionalidade está disponível nos estágios Baixar atualizações, Verificar prontidão e Instalar de uma atualização em execução.

Captura de tela do botão de tentar novamente a atualização falhada.

Se você não conseguir executar novamente com êxito uma atualização com falha ou precisar solucionar um erro ainda mais, siga estas etapas:

  1. Selecione a Exibir detalhes de um erro.

  2. Quando a caixa de detalhes for aberta, você poderá revisar os detalhes do erro. Para obter mais informações sobre como recolher logs de diagnóstico, pode clicar no link Como recolher logs junto ao botão Abrir um pedido de suporte.

    Captura de tela para baixar logs de erro.

    Para obter mais informações sobre como recuperar logs, consulte Recolher logs de diagnóstico para o Azure Local.

  3. Além disso, você pode selecionar o botão Abrir um pedido de suporte, preencher as informações apropriadas e anexar os seus logs para que fiquem disponíveis para o Suporte da Microsoft.

    Captura de tela para abrir um pedido de suporte.

Para obter mais informações sobre como criar um tíquete de suporte, consulte Criar uma solicitação de suporte.

PowerShell

Se você estiver usando o PowerShell e precisar retomar uma execução de atualização com falha anterior, use o seguinte comando:

Get-SolutionUpdate | ? Version -eq "10.2302.0.31" | Start-SolutionUpdate

Para retomar uma atualização com falha anterior devido a verificações de integridade de atualização em um estado de Aviso , use o seguinte comando:

Get-SolutionUpdate | ? Version -eq "10.2302.0.31" | Start-SolutionUpdate -IgnoreWarnings

Próximos passos

Saiba mais sobre como Executar atualizações via PowerShell.

Saiba mais sobre como Executar atualizações através do portal do Azure.