Solucionar problemas da ponte de recursos do Azure Arc
Este artigo fornece informações sobre como solucionar e solucionar problemas que podem ocorrer ao tentar implantar, usar ou remover a ponte de recursos do Azure Arc. A ponte de recursos é uma máquina virtual empacotada, que hospeda um cluster Kubernetes de gerenciamento . Para obter informações gerais, consulte Visão geral da ponte de recursos do Azure Arc.
Para solucionar problemas com o System Center Virtual Machine Manager habilitado para Arc, consulte o guia de solução de problemas do SCVMM habilitado para Arc.
Problemas gerais
Recolha de registos
Para problemas encontrados com a ponte de recursos do Arc, colete logs para investigação adicional usando o comando da CLI az arcappliance logs
do Azure. Este comando precisa ser executado a partir da máquina de gerenciamento usada para implantar a ponte de recursos Arc. Se você estiver usando uma máquina diferente, a máquina deve atender aos requisitos da máquina de gerenciamento.
Se houver um problema ao coletar logs, provavelmente a máquina de gerenciamento não consegue acessar a VM do Appliance. Entre em contato com o administrador da rede para permitir a comunicação SSH da máquina de gerenciamento para a VM do dispositivo na porta TCP 22.
Você pode coletar os logs da ponte de recursos do Arc passando o IP da VM do dispositivo ou o kubeconfig no comando logs.
Para coletar logs de ponte de recursos do Arc no VMware usando o endereço IP da VM do dispositivo:
az arcappliance logs vmware --ip <appliance VM IP> --username <vSphere username> --password <vSphere password> --address <vCenter address> --out-dir <path to output directory>
Para coletar logs do Arc Resource Bridge para o Azure Local, consulte Coletar logs.
Se você não tiver certeza do IP da VM do seu dispositivo, também há a opção de usar o kubeconfig. Você pode recuperar o kubeconfig executando o comando get-credentials e, em seguida, executar o comando logs.
Para recuperar o kubeconfig e a chave de log, colete logs para o VMware habilitado para Arc de uma máquina diferente da usada para implantar a ponte de recursos do Arc para VMware habilitado para Arc:
az account set -s <subscription id>
az arcappliance get-credentials -n <Arc resource bridge name> -g <resource group name>
az arcappliance logs vmware --kubeconfig kubeconfig --out-dir <path to specified output directory>
A conectividade de download/upload não foi bem-sucedida
Se a velocidade da rede estiver lenta, talvez não seja possível baixar com êxito a imagem da VM da ponte de recursos Arc, resultando neste erro: ErrorCode: ValidateKvaError, Error: Pre-deployment validation of your download/upload connectivity was not successful. Timeout error occurred during download and preparation of appliance image to the on-premises fabric storage. Common causes of this timeout error are slow network download/upload speeds, a proxy limiting the network speed or slow storage performance.
Como solução alternativa, tente criar uma VM diretamente na nuvem privada local e, em seguida, execute o script de implantação da ponte de recursos Arc a partir dessa VM. Isso deve resultar em um upload mais rápido da imagem para o armazenamento de dados.
Tempo limite de contexto expirado durante a fase ApplyingKvaImageOperator
Ao implantar a ponte de recursos do Arc, você pode ver este erro: Deployment of the Arc resource bridge appliance VM timed out. Collect logs with _az arcappliance logs_ and create a support ticket for help. To troubleshoot the error, refer to aka.ms/arc-rb-error { _errorCode_: _ContextError_, _errorResponse_: _{\n\_message\_: \_Context timed out during phase _ApplyingKvaImageOperator_\_\n}_ }
Este erro normalmente ocorre ao tentar baixar a imagem (400 MB compactados) através de uma rede que está lenta KVAIO
ou experimentando conectividade intermitente. O KVAIO
gerenciador do controlador aguarda a conclusão do download da imagem e expira.
Verifique se a velocidade da rede entre a VM da ponte de recursos Arc e o Microsoft Container Registry (mcr.microsoft.com
) está estável e com pelo menos 2 Mbps. Se a conectividade e a velocidade da rede estiverem estáveis e você ainda estiver recebendo esse erro, aguarde pelo menos 30 minutos antes de tentar novamente, pois pode ser devido ao Microsoft Container Registry receber um alto volume de tráfego.
Tempo limite de contexto expirado durante a fase WaitingForAPIServer
Ao implantar a ponte de recursos do Arc, você pode ver este erro: Deployment of the Arc resource bridge appliance VM timed out. Collect logs with _az arcappliance logs_ and create a support ticket for help. To troubleshoot the error, refer to aka.ms/arc-rb-error { _errorCode_: _ContextError_, _errorResponse_: _{\n\_message\_: \_Context timed out during phase _WaitingForAPIServer
Esse erro indica que a máquina de implantação não pode entrar em contato com o IP do plano de controle para a ponte de recursos Arc dentro do limite de tempo. As causas comuns do erro geralmente estão relacionadas à rede, como a comunicação entre a máquina de implantação e o IP do plano de controle que está sendo roteado por meio de um proxy. O tráfego da máquina de implantação para o plano de controle e os IPs da VM do dispositivo não deve passar pelo proxy. Se o tráfego estiver sendo intermediado, configure as configurações de proxy em sua rede ou máquina de implantação para não fazer proxy de tráfego entre a máquina de implantação para o IP do plano de controle e os IPs da VM do dispositivo. Outra causa para esse erro é se um firewall estiver fechando o acesso à porta 6443 e à porta 22 entre o IP da máquina de implantação e do plano de controle ou os IPs da VM da máquina de implantação e do dispositivo.
403 Proibido ou 404 Site Não Encontrado
Ao implantar a ponte de recursos do Arc, você pode ver este erro: { _errorCode_: _UploadError_, _errorResponse_: _{\n\_message\_: \_Pre-deployment validation of your download/upload connectivity was not successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_403 Forbidden
ou { _errorCode_: _UploadError_, _errorResponse_: _{\n\_message\_: \_Pre-deployment validation of your download/upload connectivity was not successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_404 Site Not Found
Esse erro ocorre quando as imagens precisam ser baixadas dos registros da Microsoft para a máquina de implantação, mas um proxy ou firewall bloqueia o download. Analise os requisitos de rede e verifique se todas as URLs necessárias estão acessíveis. Talvez seja necessário atualizar as configurações sem proxy para garantir que o tráfego da máquina de implantação para as URLs necessárias da Microsoft não passe por um proxy.
Acesso à pasta SSH negado
A CLI requer permissão para acessar a pasta SSH durante a implantação ou operações que envolvem o acesso a arquivos dentro da pasta. Esta pasta contém arquivos essenciais, como a chave kubeconfig e logs para a VM do dispositivo. Por exemplo, a CLI precisa acessar a chave de logs armazenada na pasta SSH para coletar logs da VM do dispositivo.
Poderá ver este erro: Access to the file in the SSH folder was denied. This may occur if the CLI doesn't have permission to the SSH folder or if another CLI instance is using the file
. Há duas causas comuns para esse problema:
- Permissões insuficientes: A CLI não tem as permissões necessárias para acessar a pasta SSH. Verifique se a conta de usuário que executa a CLI tem permissões apropriadas para acessar a pasta SSH.
- Acesso simultâneo a arquivos: outra instância da CLI pode estar usando o arquivo na pasta SSH. Isso geralmente acontece em estações de trabalho com perfis compartilhados. Certifique-se de que qualquer outra instância da CLI conclua ou encerre sua operação antes de prosseguir.
A ponte de recursos do Arc está offline
As alterações de rede na infraestrutura, no ambiente ou no cluster podem impedir que a VM do dispositivo possa se comunicar com seu recurso equivalente do Azure. Se não conseguir determinar o que mudou, você pode reiniciar a VM do dispositivo, coletar logs e enviar um tíquete de suporte para investigação adicional.
O PowerShell remoto não é suportado
Se você executar az arcappliance
comandos da CLI para a ponte de recursos do Arc por meio do PowerShell remoto, poderá ver um erro de falha de handshake de autenticação ao tentar instalar a ponte de recursos em uma instância local do Azure ou outro tipo de erro.
Atualmente, não há suporte para o uso az arcappliance
de comandos do PowerShell remoto. Em vez disso, inicie sessão no nó através do protocolo RDP (Remote Desktop Protocol) ou utilize uma sessão de consola.
As configurações da ponte de recursos não podem ser atualizadas
Nesta versão, todos os parâmetros são especificados no momento da criação. Para atualizar a ponte de recursos do Arc, você deve excluí-la e reimplantá-la novamente.
Por exemplo, se você especificar o local ou a assinatura errados durante a implantação, a criação de recursos falhará. Se você tentar apenas recriar o recurso sem reimplantar a VM da ponte de recursos, o status ficará preso em WaitForHeartBeat
.
Para resolver esse problema, exclua o appliance e atualize o arquivo YAML do appliance. Depois disso, reimplante e crie a ponte de recursos.
Rede de dispositivos indisponível
Se a ponte de recursos Arc tiver problemas de rede, você poderá ver um Appliance Network Unavailable
erro. Em geral, qualquer problema de conectividade de rede ou infraestrutura com a VM do dispositivo pode causar esse erro. Este erro também pode aparecer como Error while dialing dial tcp xx.xx.xxx.xx:55000: connect: no route to host
. O problema pode ser que a comunicação do host para a VM da ponte de recursos Arc precisa ser aberta pela porta TCP 22 com a ajuda do administrador da rede. Um problema de rede temporário pode não permitir que o host alcance a VM da ponte de recursos Arc. Uma vez resolvido o problema de rede, você pode repetir a operação. Você também pode verificar se a ponte de recursos da VM do dispositivo para Arc não está parada ou offline. Com o Azure Local, esse erro pode ser causado quando o armazenamento do host está cheio.
Erro de atualização do token
Quando executa comandos da CLI do Azure, poderá ver o seguinte erro: The refresh token has expired or is invalid due to sign-in frequency checks by conditional access.
Este erro ocorre porque quando inicia sessão no Azure, o token tem um tempo de vida máximo. Quando esse tempo de vida for excedido, você precisará entrar no Azure novamente usando o az login
comando.
Os pools de recursos de host padrão não estão disponíveis para implantação
Quando você usa o az arcappliance createconfig
comando or az arcappliance run
, uma experiência interativa mostra a lista de entidades VMware que você pode selecionar para implantar o dispositivo virtual. Esta lista mostra todos os pools de recursos criados pelo usuário juntamente com os pools de recursos de cluster padrão, mas os pools de recursos de host padrão não estão listados. Quando o dispositivo é implantado em um pool de recursos de host, não há alta disponibilidade se o hardware do host falhar. Recomendamos que você não implante o dispositivo em um pool de recursos de host.
O status da ponte de recursos é Offline e o Estado de Provisionamento é Falha
Quando você implanta a ponte de recursos do Arc, a ponte pode parecer ter sido implantada com êxito porque nenhum erro foi encontrado durante a execução az arcappliance deploy
ou az arcappliance create
. No entanto, ao exibir a ponte no portal do Azure, você pode ver o status mostrando como Offline
, e az arcappliance show
pode mostrar o provisioningState
como Failed
. Esse problema acontece quando os provedores necessários não são registrados antes que a ponte seja implantada.
Para o Azure Local, versão 23H2 e posterior, o Arc Resource Bridge é implantado automaticamente durante a implantação do cluster e a instalação manual não é mais necessária.
Se o Arc Resource Bridge estiver offline, tente reiniciar a VM do Arc Resource Bridge. Se o problema persistir, contacte o Suporte da Microsoft.
Nota
Reinstalar o Arc Resource Bridge no Azure Local pode causar problemas com seus recursos existentes do Azure.
Para resolver esse problema, exclua a ponte de recurso, registre os provedores e, em seguida, reimplante a ponte de recurso.
Exclua a ponte de recursos:
az arcappliance delete <fabric> --config-file <path to appliance.yaml>
Registe os fornecedores:
az provider register --namespace Microsoft.ExtendedLocation –-wait az provider register --namespace Microsoft.ResourceConnector –-wait
Reimplante a ponte de recursos.
Nota
Os produtos de parceiros (como o VMware vSphere habilitado para Arc) podem ter seus próprios provedores necessários para se registrar. Para obter informações sobre esses provedores adicionais, consulte a documentação do produto.
Credenciais expiradas na VM do dispositivo
A ponte de recursos do Arc consiste em uma VM de dispositivo que é implantada na infraestrutura local. A VM do dispositivo mantém uma conexão com o ponto de extremidade de gerenciamento da infraestrutura local usando credenciais armazenadas localmente. Se essas credenciais não forem atualizadas, a ponte de recursos não poderá mais se comunicar com o ponto de extremidade de gerenciamento. Isso pode causar problemas ao tentar atualizar a ponte de recursos ou gerenciar VMs por meio do Azure.
Para corrigir esse problema, as credenciais na VM do dispositivo precisam ser atualizadas. Para obter mais informações, consulte Atualizar credenciais na VM do dispositivo.
O link privado não é suportado
A ponte de recursos do Arc não suporta link privado. As chamadas provenientes da VM do dispositivo não devem passar pela configuração do link privado. Os IPs de link privado podem entrar em conflito com o intervalo do pool de IP do dispositivo, que não é configurável na ponte de recursos. A ponte de recursos do Arc alcança as URLs necessárias que não devem passar por uma conexão de link privado. Você deve implantar a ponte de recursos Arc em um segmento de rede separado não relacionado à configuração do link privado.
Problemas de rede
Erro de imagem de retirada de back-off
Ao tentar implantar a ponte de recursos do Arc, você pode ver um erro que contém back-off pulling image \\\"url"\\\: FailFastPodCondition
. Este erro é causado quando a VM do dispositivo não consegue alcançar o URL especificado no erro. Para resolver esse problema, verifique se a VM do dispositivo atende aos requisitos do sistema, incluindo conectividade de acesso à Internet para URLs de lista de permissões necessárias.
Máquina de gerenciamento incapaz de alcançar o aparelho
Ao tentar implantar a ponte de recursos do Arc, você pode receber uma mensagem de erro semelhante a:
{ _errorCode_: _PostOperationsError_, _errorResponse_: _{\n\_message\_: \_Timeout occurred due to management machine being unable to reach the appliance VM IP, 10.2.196.170. Ensure that the requirements are met: https://aka.ms/arb-machine-reqs: dial tcp 10.2.196.170:22: connectex: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond.\_\n}_, _errorMetadata_: { _errorCategory_: __ }
Este erro ocorre quando a máquina de gerenciamento não consegue acessar o IP da VM da ponte de recursos Arc por SSH (Porta 22) ou Servidor de API (Porta 6443). Também pode ocorrer se o servidor Arc resource bridge API estiver sendo intermediado por proxy; o servidor Arc resource bridge API precisa ser adicionado às configurações noproxy. Para obter mais informações, consulte Requisitos de rede da ponte de recursos do Azure Arc.
Não é possível conectar-se ao URL
Se você receber um erro que contenha Not able to connect to https://example.url.com
o , verifique com o administrador da rede se a rede permite que todas as URLs de firewall e proxy necessárias implantem a ponte de recursos do Arc. Para obter mais informações, consulte Requisitos de rede da ponte de recursos do Azure Arc.
Não é possível conectar-se - falha na validação da conectividade de rede e Internet
Ao implantar a ponte de recursos Arc, você pode receber um erro com errorCode
como PostOperationsError
, errorResponse
como código GuestInternetConnectivityError
com uma URL especificando a porta 53 (DNS). Este erro pode dever-se ao facto de os IPs da VM do dispositivo não conseguirem aceder aos servidores DNS, pelo que não conseguem resolver o ponto de extremidade especificado no erro.
Exemplos de erros:
{ _errorCode_: _PostOperationsError_, _errorResponse_: _{\n\_message\_: \_{\\n \\\_code\\\_:\\\_GuestInternetConnectivityError\\\_,\\n\\\_message\\\_:\\\_Not able to connect to http://aszhcitest01.company.org:55000. Error returned: action failed after 5 attempts: Get \\\\\\\_http://aszhcitest01.company.org:55000\\\\\\\_: dial tcp: lookup aszhcitest01.company.org on 127.0.0.53:53: read udp 127.0.0.1:32975-\\u003e127.0.0.53:53: i/o timeout. Arc Resource Bridge network and internet connectivity validation failed: cloud-agent-connectivity-test. 1. check your networking setup and ensure the URLs mentioned in : https://aka.ms/AAla73m are reachable from the Appliance VM. 2. Check firewall/proxy settings\\\_\\n }\_\n}_ }
{ _errorCode_: _PostOperationsError_, _errorResponse_: _{\n\_message\_: \_{\\n \\\_code\\\_: \\\_GuestInternetConnectivityError\\\_,\\n \\\_message\\\_: \\\_Not able to connect to https://linuxgeneva-microsoft.azurecr.io. Error returned: action failed after 5 attempts: Get \\\\\\\_https://linuxgeneva-microsoft.azurecr.io\\\\\\\_: dial tcp: lookup linuxgeneva-microsoft.azurecr.io on 127.0.0.53:53: server misbehaving. Arc Resource Bridge network and internet connectivity validation failed: http-connectivity-test-arc. 1. Please check your networking setup and ensure the URLs mentioned in : https://aka.ms/AAla73m are reachable from the Appliance VM. 2. Check firewall/proxy settings\\\_\\n }\_\n}_ }
Para resolver esses erros, trabalhe com o administrador da rede para permitir que os IPs da VM do dispositivo alcancem os servidores DNS. Para obter mais informações, consulte Requisitos de rede da ponte de recursos do Azure Arc.
Servidor Http2 enviado GOAWAY
Ao tentar implantar a ponte de recursos do Arc, você pode receber mensagens de erro semelhantes às abaixo:
"errorResponse": "{\n\"message\": \"Post \\\"https://region.dp.kubernetesconfiguration.azure.com/azure-arc-appliance-k8sagents/GetLatestHelmPackagePath?api-version=2019-11-01-preview\\u0026releaseTrain=stable\\\": http2: server sent GOAWAY and closed the connection; LastStreamID=1, ErrCode=NO_ERROR, debug=\\\"\\\"\"\n}"
ou
Post \_https://canadacentral.dp.kubernetesconfiguration.azure.com/azure-arc-appliance-k8sagents/GetLatestHelmPackagePath?api-version=2019-11-01-preview\u0026releaseTrain=stable\_: read tcp 10.128.131.173:52425-\u003e52.228.84.81:443: wsarecv: An existing connection was forcibly closed by the remote host.
Esses erros podem ocorrer quando um firewall ou proxy tem a inspeção SSL/TLS habilitada e bloqueia chamadas http2 da máquina usada para implantar a ponte de recursos. Para confirmar o problema, execute o seguinte cmdlet do PowerShell para invocar a solicitação da Web com http2 (requer o PowerShell versão 7 ou superior), substituindo a região na URL e api-version
(por exemplo, 2019-11-01
) por valores do erro:
Invoke-WebRequest -HttpVersion 2.0 -UseBasicParsing -Uri https://region.dp.kubernetesconfiguration.azure.com/azure-arc-appliance-k8sagents/GetLatestHelmPackagePath?api-version=2019-11-01-preview"&"releaseTrain=stable -Method Post -Verbose
Se o resultado for The response ended prematurely while waiting for the next frame from the server
, então a chamada http2 está sendo bloqueada e precisa ser permitida. Trabalhe com o administrador da rede para desativar a inspeção SSL/TLS para permitir chamadas http2 da máquina usada para implantar a ponte.
Nenhum host - .local
não suportado
Ao tentar definir a configuração para a ponte de recursos Arc, você pode receber uma mensagem de erro semelhante a:
"message": "Post \"https://esx.lab.local/52c-acac707ce02c/disk-0.vmdk\": dial tcp: lookup esx.lab.local: no such host"
Este erro ocorre quando um .local
caminho é fornecido para uma definição de configuração, como proxy, dns, armazenamento de dados ou ponto de extremidade de gerenciamento (como vCenter). A VM do dispositivo Arc resource bridge usa o sistema operacional Linux do Azure, que não oferece suporte .local
por padrão. Uma solução alternativa pode ser fornecer o endereço IP, quando aplicável.
A ponte de recursos do Azure Arc está inacessível
A ponte de recursos do Azure Arc executa um cluster do Kubernetes e seu plano de controle requer um endereço IP estático. O endereço IP é especificado no infra.yaml
arquivo. Se o endereço IP for atribuído a partir de um servidor DHCP, o endereço pode mudar se não estiver reservado. Reinicializar a ponte de recursos ou VM do Azure Arc pode disparar uma alteração de endereço IP e resultar em serviços com falha.
A ponte de recursos Arc pode perder intermitentemente a configuração de IP reservado. Esta perda deve-se ao comportamento descrito na perda de VIPs quando systemd-networkd
é reiniciado. Quando o endereço IP não é atribuído à VM da ponte de recursos do Azure Arc, qualquer chamada para o servidor de API da ponte de recursos falha. As operações principais, como a criação de um novo recurso, a ligação à sua nuvem privada a partir do Azure ou a criação de uma localização personalizada, não funcionarão como esperado.
Para resolver esse problema, reinicialize a VM de ponte de recursos e ela deve recuperar seu endereço IP. Se o endereço for atribuído a partir de um servidor DHCP, reserve o endereço IP associado à ponte de recursos.
A ponte de recursos Arc também pode estar inacessível devido ao acesso lento ao disco. A ponte de recursos do Azure Arc usa a árvore de configuração estendida (ETCD) do Kubernetes, que requer latência de 10 ms ou menos. Se o disco subjacente tiver baixo desempenho, as operações serão afetadas e poderão ocorrer falhas.
Problemas de configuração de proxy SSL
Certifique-se de que o servidor proxy em sua máquina de gerenciamento confia no certificado SSL para seu proxy SSL e no certificado SSL dos servidores de download da Microsoft. Para obter mais informações, consulte Configuração de proxy SSL.
Nenhum anfitrião - dp.kubernetesconfiguration.azure.com
Um erro que contém dial tcp: lookup westeurope.dp.kubernetesconfiguration.azure.com: no such host
durante a implantação da ponte de recursos Arc significa que o plano de dados de configuração está atualmente indisponível na região especificada. O serviço pode estar temporariamente indisponível. Aguarde até que o serviço esteja disponível e, em seguida, tente novamente a implantação.
Proxy connect tcp - Nenhum host para Arc resource bridge URL necessário
Um erro que contém uma URL necessária da ponte de recursos Arc com a mensagem proxyconnect tcp: dial tcp: lookup http: no such host
indica que o DNS não consegue resolver a URL. O erro pode ser semelhante a este exemplo, onde o URL necessário é https://msk8s.api.cdp.microsoft.com
:
Error: { _errorCode_: _InvalidEntityError_, _errorResponse_: _{\n\_message\_: \_Post \\\_https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/arc-appliance-stable-catalogs-ext/versions/latest?action=select\\\_: POST https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/arc-appliance-stable-catalogs-ext/versions/latest?action=select giving up after 6 attempt(s): Post \\\_https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/arc-appliance-stable-catalogs-ext/versions/latest?action=select\\\_: proxyconnect tcp: dial tcp: lookup http: no such host\_\n}_ }
Esse erro pode ocorrer se as configurações de DNS fornecidas durante a implantação não estiverem corretas ou se houver um problema com os servidores DNS. Você pode verificar se o servidor DNS é capaz de resolver a url executando o seguinte comando da máquina de gerenciamento ou de uma máquina que tenha acesso aos servidores DNS:
nslookup
> set debug
> <hostname> <DNS server IP>
Para resolver o erro, configure seus servidores DNS para resolver todas as URLs necessárias da ponte de recursos Arc. Os servidores DNS devem ser fornecidos corretamente quando você implanta a ponte de recursos Arc.
Erro de tempo limite do KVA
O erro de tempo limite do KVA é um erro genérico causado por várias configurações incorretas de rede que envolvem a máquina de gerenciamento, Por exemplo, a VM do dispositivo ou o IP do plano de controle podem não ter comunicação entre si, com a Internet ou com as URLs necessárias. Essas falhas de comunicação geralmente são devidas a problemas com a resolução de DNS, configurações de proxy, configuração de rede ou acesso à Internet.
Para maior clareza, a máquina de gerenciamento refere-se à máquina onde os comandos da CLI de implantação estão sendo executados. Appliance VM é a VM que hospeda a ponte de recursos Arc. O IP do Plano de Controle é o IP do plano de controle para o cluster de gerenciamento do Kubernetes na VM do Dispositivo.
Principais causas do erro de tempo limite do KVA
- A máquina de gerenciamento não consegue se comunicar com o IP do Plano de Controle e o IP da VM do Aparelho.
- A VM do dispositivo não consegue se comunicar com a máquina de gerenciamento, o ponto de extremidade vCenter (para VMware) ou o ponto de extremidade do agente de nuvem MOC (para o Azure Local).
- A VM do aparelho não tem acesso à Internet.
- A VM do dispositivo tem acesso à Internet, mas a conectividade com uma ou mais URLs necessárias está sendo bloqueada, possivelmente devido a um proxy ou firewall.
- A VM do dispositivo não consegue acessar um servidor DNS que possa resolver nomes internos, como ponto de extremidade vCenter para vSphere ou ponto de extremidade do agente de nuvem para Azure Local. O servidor DNS também deve ser capaz de resolver endereços externos, como endereços de serviço do Azure e nomes de registro de contêiner.
- A configuração do servidor proxy na máquina de gerenciamento ou nos arquivos de configuração da ponte de recursos Arc está incorreta. Isso pode afetar a máquina de gerenciamento e a VM do Appliance. Quando o
az arcappliance prepare
comando é executado e o proxy do host não está configurado corretamente, a máquina de gerenciamento não pode se conectar e baixar imagens do sistema operacional. O acesso à Internet na VM do Appliance pode ser interrompido pela configuração de proxy incorreta ou ausente, o que afeta a capacidade da VM de extrair imagens de contêiner.
Solucionar problemas de erro de tempo limite do KVA
Para resolver o erro, uma ou mais configurações incorretas de rede podem precisar ser resolvidas.
A primeira etapa é coletar logs por IP da VM do Appliance (não por kubeconfig, pois o kubeconfig pode estar vazio se o comando deploy não for concluído). Os problemas na coleta de logs são provavelmente devido à incapacidade da máquina de gerenciamento de acessar a VM do Appliance.
Uma vez que os logs são coletados, extraia a pasta e abra
kva.log
o . Revise o log para obter informações que possam ajudar a identificar a causa do erro de tempo limite do KVA.A máquina de gerenciamento deve ser capaz de se comunicar com o IP da VM do dispositivo e o IP do plano de controle. Execute ping no IP do Plano de Controle e no IP da VM do Dispositivo a partir da máquina de gerenciamento e verifique se há uma resposta de ambos os IPs.
Se uma solicitação expirar, a máquina de gerenciamento não poderá se comunicar com os IPs. Esse problema pode ser causado por uma porta fechada, configuração incorreta de rede ou bloqueio de firewall. Trabalhe com o administrador da rede para permitir a comunicação entre a máquina de gerenciamento e o IP do plano de controle e o IP da VM do aparelho.
O IP da VM do dispositivo e o IP do Plano de Controle devem ser capazes de se comunicar com a máquina de gerenciamento e o ponto de extremidade do vCenter (para VMware) ou o ponto de extremidade do agente de nuvem MOC (para o Azure Local. Trabalhe com o administrador da rede para garantir que a rede está configurada para permitir essa comunicação. Talvez seja necessário adicionar uma regra de firewall para abrir a porta 443 do IP da VM do Appliance e do IP do Plano de Controle para o vCenter ou para abrir as portas 65000 e 55000 para o agente de nuvem MOC Local do Azure. Analise os requisitos de rede para a ponte de recursos do Azure Local e do VMware for Arc.
O IP da VM do dispositivo e o IP do Plano de Controle precisam de acesso à Internet para essas URLs necessárias. O Azure Local requer URLs adicionais. Trabalhe com o administrador da rede para garantir que os IPs possam acessar as URLs necessárias.
Em um ambiente sem proxy, a máquina de gerenciamento deve ter resolução DNS externa e interna. A máquina de gerenciamento deve ser capaz de alcançar um servidor DNS que possa resolver nomes internos, como ponto de extremidade vCenter para vSphere ou ponto de extremidade de agente de nuvem para Azure Local. O servidor DNS também precisa ser capaz de resolver endereços externos, como URLs do Azure e URLs de download de imagens do sistema operacional. Trabalhe com o administrador do sistema para garantir que a máquina de gerenciamento tenha resolução DNS interna e externa. Em um ambiente de proxy, a resolução DNS no servidor proxy deve resolver pontos de extremidade internos e endereços externos necessários.
Para testar a resolução DNS para um endereço interno da máquina de gerenciamento em um cenário sem proxy, abra um prompt de comando e execute
nslookup <vCenter endpoint or HCI MOC cloud agent IP>
. Você deve receber uma resposta se a máquina de gerenciamento tiver resolução DNS interna em um cenário sem proxy.
A VM do dispositivo precisa ser capaz de alcançar um servidor DNS que possa resolver nomes internos, como ponto de extremidade vCenter para vSphere ou ponto de extremidade de agente de nuvem para Azure Local. O servidor DNS também precisa ser capaz de resolver endereços externos/internos, como endereços de serviço do Azure e nomes de registro de contêiner para download das imagens de contêiner da ponte de recursos Arc da nuvem.
Verifique se o IP do servidor DNS usado para criar os arquivos de configuração tem resolução de endereço interno e externo. Caso contrário, exclua o dispositivo, recrie os arquivos de configuração da ponte de recursos Arc com as configurações corretas do servidor DNS e, em seguida, implante a ponte de recursos Arc usando os novos arquivos de configuração.
Mover o local da ponte de recursos do Arc
A movimentação de recursos da ponte de recursos Arc não é suportada no momento. Em vez disso, exclua a ponte de recursos Arc e reimplante-a no local desejado.
VMs habilitadas para Azure Arc em problemas do Azure Local
Para obter ajuda geral para resolver problemas relacionados a VMs habilitadas para Azure Arc no Azure Local, consulte Solucionar problemas de gerenciamento de VM do Azure Arc para Azure Local.
Se você estiver executando o Azure Local, versão 23H2 ou posterior, e seu Arc Resource Bridge estiver offline, não tente reinstalar ou excluir o Arc Resource Bridge. Em vez disso, tente reiniciar a VM do Arc Resource Bridge para colocá-la online novamente. Se o problema persistir, contacte o Suporte da Microsoft para obter assistência.
Falha na ação - nenhum host
Quando você implanta a ponte de recursos Arc, se você receber um erro com errorCode
como PostOperationsError
, errorResponse
como código GuestInternetConnectivityError
e no such host
, os IPs da VM do dispositivo podem não conseguir alcançar o ponto de extremidade especificado no erro.
Exemplo de erro:
{ _errorCode_: _PostOperationsError_, _errorResponse_: _{\n\_message\_: \_{\\n \\\_code\\\_: \\\_GuestInternetConnectivityError\\\_,\\n \\\_message\\\_: \\\_Not able to connect to http://aszhcitest01.company.org:55000. Error returned: action failed after 5 attempts: Get \\\\\\\_http://aszhcitest01.company.org:55000\\\\\\\_: dial tcp: lookup aszhcitest01.company.org: on 127.0.0.53:53: no such host. Arc Resource Bridge network and internet connectivity validation failed: cloud-agent-connectivity-test. 1. check your networking setup and ensure the URLs mentioned in : https://aka.ms/AAla73m are reachable from the Appliance VM. 2. Check firewall/proxy settings
No exemplo, os IPs da VM do dispositivo não conseguem acessar http://aszhcitest01.company.org:55000
o , que é o ponto de extremidade MOB. Trabalhe com o administrador da rede para se certificar de que o servidor DNS consegue resolver os URLs necessários.
Para testar a conectividade com o servidor DNS:
ping <dns-server.com>
Para verificar se o servidor DNS é capaz de resolver um endereço, execute este comando a partir de uma máquina que possa alcançar os servidores DNS:
Resolve-DnsName -Name "http://aszhcitest01.company.org:55000" -Server "<dns-server.com>"
Problemas do VMware VCenter habilitado para Azure Arc
errorResponse: error getting the vsphere sdk client
Erros com errorCode: CreateConfigKvaCustomerError
e errorResponse: error getting the vsphere sdk client
ocorrem quando sua máquina de implantação está tentando estabelecer uma conexão TCP com seu endereço vCenter, mas encontra um problema. Isso pode acontecer quando seu endereço vCenter está incorreto (erro 403 ou 404) ou porque uma configuração de rede/proxy/firewall o bloqueia (falha na tentativa de conexão).
Se você inserir seu endereço vCenter como um nome de host e receber o erro no such host
, sua máquina de implantação não poderá resolver o nome de host do vCenter por meio do DNS do cliente. Isso pode ocorrer quando a máquina de implantação consegue resolver o nome de host do vCenter, mas a máquina de implantação não consegue acessar o endereço IP que recebeu do DNS. Você também poderá ver esse erro se o ponto de extremidade retornado pelo DNS não for seu endereço vCenter ou se o tráfego foi intercetado por proxy. Se sua máquina de implantação for capaz de se comunicar com seu endereço vCenter, confirme se seu nome de usuário e senha estão corretos.
Cliente vSphere SDK - Falha na tentativa de conexão
Se você receber um erro durante a implantação que indique: errorCode_: _CreateConfigKvaCustomerError_, _errorResponse_: _error getting the vsphere sdk client: Post \_https://ip.address/sdk\_: dial tcp ip.address:443: connectex: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond._ }
sua máquina de gerenciamento não consegue se comunicar com o servidor vCenter.
Para resolver esse problema, verifique se a máquina de gerenciamento atende aos requisitos da máquina de gerenciamento e se não há um firewall ou proxy bloqueando a comunicação.
Cliente vSphere SDK - 403 Proibido ou 404 não encontrado
Os erros que contêm errorCode_: _CreateConfigKvaCustomerError_, _errorResponse_: _error getting the vsphere sdk client: POST \_/sdk\_: 403 Forbidden
ou 404 not found
durante a implantação da ponte de recursos Arc são provavelmente devido a um endereço vCenter incorreto. Esse endereço é fornecido durante a criação do arquivo de configuração, quando você é solicitado a inserir o endereço vCenter como um nome de host ou endereço IP.
Há diferentes maneiras de encontrar seu endereço vCenter. Uma opção é acessar o cliente vSphere através de sua interface web. O nome de host ou endereço IP do vCenter é normalmente o que você usa no navegador para acessar o cliente vSphere. Se você já estiver conectado, você pode olhar para a barra de endereço do navegador, onde o URL que você usa para acessar o vSphere é o nome de host ou endereço IP do seu servidor vCenter. Verifique o endereço do vCenter e tente a implantação novamente.
Cliente vSphere SDK - nenhum host
O erro{ _errorCode_: _CreateConfigKvaCustomerError_, _errorResponse_: _error getting the vsphere sdk client: Post \_https://your.vcenter.hostname/sdk\_: dial tcp: lookup your.vcenter.hostname: no such host_ }
pode ocorrer durante a implantação quando a máquina de implantação não consegue resolver o nome do host vCenter para um endereço IP. Esse problema surge porque o processo de implantação está tentando estabelecer uma conexão TCP da sua máquina de implantação para o nome de host do vCenter, mas a conexão falha devido a problemas de resolução de DNS.
Para corrigir esse erro, verifique se a configuração de DNS na máquina de implantação está correta, verifique se o servidor DNS está online e verifique se há uma entrada DNS ausente para o nome de host do vCenter. Você pode testar a resolução DNS executando nslookup your.vcenter.hostname
ou ping your.vcenter.hostname
a partir da máquina de implantação. Se você especificou seu endereço vCenter como um nome de host, considere usar o endereço IP diretamente.
Erros de validação pré-implantação
Ao implantar a ponte de recursos do Arc, você pode ver vários pre-deployment validation of your download\upload connectivity wasn't successful
erros, como:
Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: Service Unavailable
Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: dial tcp 172.16.60.10:443: connectex: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond.
Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: use of closed network connection.
Pre-deployment validation of your download/upload connectivity wasn't successful. {\\n \\\_code\\\_: \\\_ImageProvisionError\\\_,\\n \\\_message\\\_: \\\_Post \\\\\\\_https://vcenter-server.com/nfc/unique-identifier/disk-0.vmdk\\\\\\\_: dial tcp: lookup hostname.domain: no such host
Uma combinação desses erros geralmente indica que a máquina de gerenciamento perdeu a conexão com o armazenamento de dados ou que há um problema de rede que faz com que o armazenamento de dados fique inacessível. Essa conexão é necessária para carregar o OVA da máquina de gerenciamento usada para criar a VM do dispositivo no vCenter.
Para corrigir o problema, restabeleça a conexão entre a máquina de gerenciamento e o armazenamento de dados e tente implantar a ponte de recursos Arc novamente.
O certificado x509 expirou ou ainda não é válido
Ao implantar a ponte de recursos do Arc, você pode encontrar o erro:
Error: { _errorCode_: _PostOperationsError_, _errorResponse_: _{\n\_message\_: \_{\\n \\\_code\\\_: \\\_GuestInternetConnectivityError\\\_,\\n \\\_message\\\_: \\\_Not able to connect to https://msk8s.api.cdp.microsoft.com. Error returned: action failed after 3 attempts: Get \\\\\\\_https://msk8s.api.cdp.microsoft.com\\\\\\\_: x509: certificate has expired or isn't yet valid: current time 2022-01-18T11:35:56Z is before 2023-09-07T19:13:21Z. Arc Resource Bridge network and internet connectivity validation failed: http-connectivity-test-arc. 1. check your networking setup and ensure the URLs mentioned in : https://aka.ms/AAla73m are reachable from the Appliance VM. 2. Check firewall/proxy settings
Este erro é causado quando há uma diferença de relógio/hora entre os hosts ESXi e a máquina de gerenciamento que executa os comandos de implantação para a ponte de recursos Arc. Para resolver esse problema, ative a sincronização de tempo NTP nos hosts ESXi, confirme se a máquina de gerenciamento também está sincronizada com o NTP e tente a implantação novamente.
Resolve para várias redes
Ao implantar ou atualizar a ponte de recursos do Arc, você pode encontrar um erro semelhante a:
{ "ErrorCode": "PreflightcheckErrorOnPrem", "ErrorDetails": "Upgrade Operation Failed with error: \"{\\n \\\"code\\\": \\\"PreflightcheckError\\\",\\n \\\"message\\\": \\\"{\\\\n \\\\\\\"code\\\\\\\": \\\\\\\"InvalidEntityError\\\\\\\",\\\\n \\\\\\\"message\\\\\\\": \\\\\\\"Cannot retrieve vSphere Network 'vmware-azure-arc-01': path 'vmware-azure-arc-01' resolves to multiple networks\\\\\\\",\\\\n \\\\\\\"category\\\\\\\": \\\\\\\"\\\\\\\"\\\\n }\\\",\\n \\\"category\\\": \\\"\\\"\\n }\"" }
Este erro ocorre quando o segmento de rede vSphere resolve para várias redes, devido a vários segmentos de rede vSphere usando o mesmo nome especificado no erro. Para corrigir esse erro, altere o nome de rede duplicado no vCenter (não a rede com a VM do dispositivo) ou implante a ponte de recursos Arc em uma rede diferente.
O status da ponte de recursos do Arc está desconectado
Ao executar o script inicial de integração do VMware habilitado para Arc, você será solicitado a fornecer uma conta do vSphere. Essa conta é armazenada localmente dentro da ponte de recursos Arc como um segredo criptografado do Kubernetes. A conta é usada para permitir que a ponte de recursos Arc interaja com o vCenter.
Se a conta do vSphere armazenada localmente na ponte de recursos expirar, o status da ponte de recursos do Arc poderá ser desconectado. Atualize as credenciais dentro do Arc resource bridge e para o VMware habilitado para Arc seguindo as instruções de atualização das credenciais da conta vSphere.
Erro durante a configuração do host
Se você usar o mesmo modelo para implantar e excluir a ponte de recursos Arc várias vezes, poderá encontrar o seguinte erro:
Appliance cluster deployment failed with error: Error: An error occurred during host configuration
Para resolver esse problema, exclua manualmente o modelo existente. Em seguida, execute az arcappliance prepare
para baixar um novo modelo para implantação.
Não é possível localizar pastas
Ao implantar o Arc resource bridge no VMware, você especifica a pasta na qual o modelo e a VM são criados. A pasta selecionada deve ser uma VM e um tipo de pasta modelo. Outros tipos de pasta, como pastas de armazenamento, pastas de rede ou pastas de host e cluster, não podem ser usados para a implantação da ponte de recursos.
Não é possível recuperar recurso - não encontrado ou não existe
Ao implantar a ponte de recursos do Arc, você especifica onde a VM do dispositivo é implantada. A VM do dispositivo não pode ser movida desse caminho de local. Se a VM do dispositivo mover o local e você tentar atualizar, poderá ver erros semelhantes aos seguintes:
{\n \"code\": \"PreflightcheckError\",\n \"message\": \"{\\n \\\"code\\\": \\\"InvalidEntityError\\\",\\n \\\"message\\\": \\\"Cannot retrieve <resource> 'resource-name': <resource> 'resource-name' not found\\\"\\n }\"\n }"
{\n \"code\": \"PreflightcheckError\",\n \"message\": \"{\\n \\\"code\\\": \\\"InvalidEntityError\\\",\\n \\\"message\\\": \\\"The specified vSphere Datacenter '/VxRail-Datacenter' does not exist\\\"\\n }\"\n }"
Para corrigir esses erros, use uma destas opções:
- Mova a VM do dispositivo de volta ao local original e verifique se as credenciais RBAC estão atualizadas para a alteração de local.
- Crie um recurso com o mesmo nome e, em seguida, mova a ponte de recursos do Arc para esse novo recurso.
- Para VMware habilitado para Arc, execute o script de recuperação de desastres VMware habilitado para Arc. O script exclui o dispositivo, implanta um novo dispositivo e reconecta o dispositivo com o local personalizado implantado anteriormente, a extensão de cluster e as VMs habilitadas para Arc.
- Exclua e reimplante a ponte de recursos Arc.
Privilégios insuficientes
Ao implantar ou atualizar a ponte de recursos no VMware vCenter, você pode ver um erro semelhante a:
{ ""code"": ""PreflightcheckError"", ""message"": ""{\n \""code\"": \""InsufficientPrivilegesError\"",\n \""message\"": \""The provided vCenter account is missing required vSphere privileges on the resource 'root folder (MoRefId: Folder:group-d1)'. Missing privileges: [Sessions.ValidateSession]. add the privileges to the vCenter account and try again. To review the full list of required privileges, go to https://aka.ms/ARB-vsphere-privilege.\""\n }
Ao implantar a ponte de recursos do Arc, você fornece credenciais do vCenter. A ponte de recursos do Arc armazena essas credenciais do vCenter localmente para interagir com o vCenter. Para resolver o problema de privilégios ausentes, a conta do vCenter usada pela ponte de recursos precisa dos seguintes privilégios no VMware vCenter:
Armazenamento de dados:
- Alocar espaço
- Procurar armazenamento de dados
- Operações de arquivo de baixo nível
Pasta:
- Criar pasta
Marcação vSphere:
- Atribuir ou cancelar a atribuição da tag vSphere
Rede:
- Atribuir rede
Recurso:
- Atribuir máquina virtual ao pool de recursos
- Migrar máquina virtual desligada
- Migrar com tecnologia de máquina virtual
Sessões:
- Validar sessão
vApp:
- Atribuir pool de recursos
- Importar
Máquina virtual:
- Alterar configuração
- Adquirir locação de disco
- Adicionar disco existente
- Adicionar novo disco
- Adicionar ou remover dispositivo
- Configuração avançada
- Alterar a contagem de CPU
- Alterar memória
- Alterar configurações
- Alterar recurso
- Configurar managedBy
- Exibir configurações de conexão
- Estender disco virtual
- Modificar as configurações do dispositivo
- Compatibilidade com tolerância a falhas de consulta
- Consultar arquivos sem propriedade
- Recarregar a partir do caminho
- Remover disco
- Mudar o nome
- Redefinir informações do hóspede
- Definir anotação
- Alternar o controle de alterações de disco
- Alternar pai de garfo
- Atualizar a compatibilidade da máquina virtual
- Editar inventário
- Criar a partir do existente
- Criar nova
- Registar
- Remover
- Anular o Registo
- Operações com hóspedes
- Modificação do alias de operação do convidado
- Modificações na operação do convidado
- Execução do programa de operação convidado
- Consultas de operação de convidado
- Interação
- Ligar dispositivos
- Interação com o console
- Gerenciamento de sistema operacional convidado pela API VIX
- Instalar o VMware Tools
- Desligamento
- Ligar
- Reset
- Suspender
- Provisionamento
- Permitir acesso ao disco
- Permitir acesso a ficheiros
- Permitir acesso somente leitura ao disco
- Permitir download de máquina virtual
- Permitir o carregamento de arquivos de máquina virtual
- Clonar máquina virtual
- Implementar o modelo
- Marcar como modelo
- Marcar como máquina virtual
- Personalizar convidado
- Gerenciamento de snapshots
- Criar instantâneo
- Remover instantâneo
- Reverter para snapshot
Próximos passos
Se não vir o problema aqui ou não conseguir resolvê-lo, experimente um dos seguintes canais de suporte:
- Obtenha respostas de especialistas do Azure através das Perguntas e Respostas da Microsoft.
- Conecte-se com @AzureSupport, a conta oficial do Microsoft Azure para melhorar a experiência do cliente. O Suporte do Azure conecta a comunidade do Azure a respostas, suporte e especialistas.
- Abra uma solicitação de suporte do Azure.