有关 VMware 上的 Azure Arc 启用的 AKS 中的问题故障排除指南
适用于:Azure Arc 在 VMware 上启用的 AKS(预览版)
本文概述了在 VMware 预览版上部署 Azure Arc 启用的 AKS 时可能出现的已知问题和错误的故障排除步骤。 还可以 在此处 查看已知问题,或按照 故障排除概述 报告 bug 或提供产品反馈。
此页面会不断更新,因此请在此处查看新信息。 当我们确定需要解决方法的关键问题时,我们将添加它们。 在 VMware 预览版上部署 AKS Arc 之前,请仔细查看此信息。
Arc 资源网桥
Azure Arc 资源网桥问题
有关 Azure Arc 资源网桥问题,请参阅此处的故障排除指南。
从 Arc 资源桥的失败部署中恢复
请参阅此处的故障排除指南。
与 Azure 的 vCenter 连接
如果出现错误消息,指出“与此 vCenter 关联的资源桥 <名称> 当前不可用。 为此 vCenter 执行的操作可能会失败,“它指示用于连接 vCenter 的资源桥已关闭或删除。
若要解决该问题,请执行以下步骤:
- 如果删除 Arc 资源桥,请再次部署它。
- 如果 Arc 资源桥已关闭(脱机),请执行执行灾难恢复操作 - Azure Arc 中列出的灾难恢复步骤。
收集日志
如果遇到问题,可以与支持工程师共享日志文件和 CLI 版本,以便进行调试。
Arc 资源桥部署前的问题
从系统检索 c:\programdata\kva\kva.log 中的kva.log文件以获取更详细的信息。
Arc 资源桥部署期间的问题
若要收集日志,请从以前用于尝试部署 Arc 资源桥的计算机执行以下命令。 从 CLI 版本 1.0.0 开始,必须先运行命令 az arcappliance get-credentials
。 这可确保将日志收集的所有必需凭据拉取到计算机上。 有关此命令的详细信息,请参阅 CLI 文档:
az arcappliance get-credentials –name <name of Arc Resource Bridge> --resource-group <name of resource group>
运行该az arcappliance get-credentials
命令后,可以使用以下命令继续日志收集az arcappliance logs vmware
:
az arcappliance logs vmware --ip <Arc Resource Bridge VM control plane IP endpoint> --address <vCenter FQDN/IP address, same one used when creating config files> --username <vcenter username> --password <vcenter password>
如果尚未创建设备 VM,该 az arcappliance logs vmware
命令将不起作用,并且不会生成日志文件。
Arc 资源桥启动并运行时出现的问题
若要收集日志,请从用于部署 Arc 资源桥的同一台计算机运行 az arcappliance logs vmware
命令 :
如果设备具有 kubeconfig,并且设备 VM 正在使用可访问的 API 服务器运行,以下命令将从设备收集日志,并输出当前工作目录中的.zip文件:
az arcappliance logs vmware --kubeconfig='<path to your kubeconfig>'
如果没有 kubeconfig 或 API 服务器无法访问,以下命令将使用指定的设备 VM IP 地址收集日志(检查虚拟化结构;例如,Hyper-V 管理器)来查找设备 VM IP 地址。 请注意,
kubeconfig
如果还提供了 IP,则参数仍是必需的,但可以作为空字符串传递:az arcappliance logs vmware --kubeconfig='' --ip='<IP address of Arc Resource Bridge VM>'
填充值的示例
az arcappliance logs vmware --kubeconfig .\resourcebridge\kubeconfig
az arcappliance logs vmware --kubeconfig='kubeconfig'
az arcappliance logs vmware --kubeconfig='' --ip=10.0.1.166
获取 CLI 扩展版本
可以通过运行以下命令返回设备 CLI 扩展版本:
az extension show --name arcappliance -o table
必须在物理群集中的所有节点上安装最新版本的 Az CLI 。
- 通过运行
az -v
验证是否具有 Az CLI。 - 通过运行
az upgrade
升级到最新版本。
错误消息和故障排除步骤
本部分提供常见错误消息及其故障排除步骤的列表。
错误:“AlreadyDeployedError”
- 根本原因:发生此错误的原因是,在尝试再次部署之前,环境尚未从上一个部署中清除。
- 解决方法:若要解决此问题,请卸载 Arc 资源桥,然后重试部署。
错误:x509:证书已过期或尚无效:当前时间1 在 time2 <>之前<。> 检查失败
- 根本原因:当证书由于客户端计算机与 VM(或 ESXi 服务器)之间的时间不匹配而过期时,会发生此错误。 其中一个未启用 NTP。
- 解决方法:
- 检查 VM 上的时间是否与用于 ARB 部署的计算机上的时间匹配。
- 将 ESXi 服务器连接到 NTP 服务器以同步其时间并解决问题。
错误:术语“az”无法识别为 cmdlet、函数、脚本文件或可操作程序的名称。 检查名称的拼写,或者是否包含路径,请验证路径是否正确,然后重试
- 根本原因:无法识别 Az CLI,因为以前的 PowerShell 窗口已关闭,并且未与 Azure CLI 的安装同步。
- 解决方法:
- 打开新的 PowerShell 窗口并导航到存储 Arc 资源桥载入脚本的文件夹。
- 执行
.temp\.env\Scripts\Activate.ps1
以安装 Python venv。