排查 AKS Edge Essentials 中的常见问题
本文介绍如何查找使用 AKS Edge Essentials 时遇到的问题的解决方案。 已知问题和错误按功能区域进行组织。 可以使用本文中提供的链接查找解决方案和解决方法来解决它们。
提出支持请求
有关如何使用Azure 门户获取支持或为 AKS Edge Essentials 提出支持请求的信息,请参阅“获取支持”一文。
部署问题
不受信任的发布者问题
错误消息:“是否要从此不受信任的发布者运行软件? ....."
解决方法:将 PowerShell 执行策略更新为 RemoteSigned:
# Get the execution policy on the system
Get-ExecutionPolicy
# Set the execution policy for this process only
if ((Get-ExecutionPolicy) -ne "RemoteSigned") { Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process -Force }
磁盘空间不足导致删除以前缓存的容器映像
当节点耗尽磁盘空间时,运行时会垃圾收集 containerd
一些预加载映像。 在这种情况下,请先释放一些磁盘空间,然后运行以下命令再次拉取缓存的映像:
Invoke-AksEdgeNodeCommand -NodeType Linux -command "sudo /path/to/script/reimport-ci.sh
此脚本检查缺少的图像,并根据需要重新导入它们。
Azure Arc 连接
问题:
Disconnect-AksEdgeArc
不会从群集中删除 Pod。解决方法:如果未清理 Pod,请运行以下命令,在尝试重新连接之前手动清理现有的 Azure Arc 相关资源:
kubectl delete ns azure-arc kubectl delete clusterrolebinding azure-arc-operator kubectl delete secret sh.helm.release.v1.azure-arc.v1
问题:Azure Arc 连接在代理环境中不起作用。
解决方法:可以通过以下 Internet 选项>“连接 > LAN 设置”来启用系统范围的代理设置。
脱机部署
未能获取 nodeagent 证书:找不到
检查网络适配器配置。 在部署期间,AKS Edge Essentials 需要启用并具有正确的 IP 地址、子网和默认网关的适配器。 这些值在 DHCP 环境中自动填充。 如果要手动设置,请确保已设置这三者。 在许多情况下,未设置默认网关,这会导致此错误。
Kubernetes
Kube-vip pod 持续重启
在某些情况下, kube-vip pod 会循环并连续重启。
验证
若要确认遇到的方案与本文中所述的相同问题,请运行以下命令检查 kube-vip 命名空间中的 kube-vip pod 是否重启次数较高:
kubectl get pods –n kube-system
原因
kube-vip Pod 可能会不断重启有几个不同的原因。 这些原因包括:
- 使用未通过 SSD 磁盘提供支持的 OS 磁盘,或者在使用 Azure VM 时使用高级 SSD 磁盘。 可 在此处查看硬件要求。
- 磁盘延迟过高。 如果磁盘延迟大于 10 毫秒,则可能会导致请求超时、领导者丢失和潜在的群集不稳定。 可 在此处查看 etcd 的硬件要求。
解决方法
若要缓解此问题,请查看底层存储基础结构,确保它满足 etcd 和 AKS Edge Essentials 的性能要求。 此外,请考虑使用高级 SSD 支持的存储或优化存储配置以提升性能。