查看 Azure Stack HCI 2402.3 版本中的已知问题

适用于:Azure Local 2311.2 及更高版本

本文介绍 Azure Stack HCI 2402.3 版本中的关键已知问题和解决方法。

发行说明会持续更新,并且在发现需要解决方案的关键问题时,会将它们添加进去。 在部署 Azure Stack HCI 之前,请仔细查看发行说明中包含的信息。

注意

若要了解此版本的受支持的更新路径,请参阅 Azure Stack HCI 版本 23H2 版本

有关此版本中的新功能的详细信息,请参阅 23H2中的新增功能。

版本 2402.3 的问题

此软件版本对应于软件版本号 2402.3.10

此版本的发行说明包括此版本中修复的问题、此版本中的已知问题以及从以前版本延续下来的发行说明问题。

修复了问题

Microsoft在此版本中不知道任何已修复的问题。

此版本中的已知问题

Microsoft在此版本中不知道任何已知问题。

早期版本中的已知问题

下面是以前版本中的已知问题:

功能 问题 解决方法
HCI 上的 AKS AKS 群集创建失败,出现 Error: Invalid AKS network resource id。 当关联的逻辑网络名称具有下划线时,可能会出现此问题。 逻辑网络名称不支持下划线。 请确保不要在 Azure Stack HCI 上部署的逻辑网络的名称中使用下划线。
修复服务器 在极少数情况下,Repair-Server 操作失败,并出现 HealthServiceWaitForDriveFW 错误。 在这些情况下,不会删除已修复节点中的旧驱动器,并且新磁盘停滞在维护模式下。 若要防止此问题,请确保在开始 Repair-Server之前,不要通过 Windows Admin Center 或使用 Suspend-ClusterNode -Drain PowerShell cmdlet 清空节点。
如果出现问题,请联系Microsoft支持部门获取后续步骤。
修复服务器 当单服务器 Azure Stack HCI 从 2311 更新到 2402,然后执行 Repair-Server 时,会出现此问题。 修复操作失败。 在修复单个节点之前,请执行以下步骤:
1. 运行版本 2402 的 ADPrepTool。 按照准备 Active Directory 中的步骤操作。 此操作很快,并且会将所需的权限添加到组织单位 (OU)。
2. 将计算机对象从计算机段移动到根 OU。 运行以下命令:
Get-ADComputer <HOSTNAME> | Move-ADObject -TargetPath "<OU path>"
部署 如果你自行准备 Active Directory(不使用Microsoft提供的脚本和过程),Active Directory 验证可能会因为缺少 Generic All 权限而失败。 这是因为验证检查时出现问题,导致无法查找 msFVE-RecoverInformationobjects – General – Permissions Full control 的专用权限条目,而这是 BitLocker 恢复所必需的。 使用准备 AD 脚本方法,或者如果使用自己的方法,请确保分配特定权限 msFVE-RecoverInformationobjects – General – Permissions Full control
部署 在此版本中,有一个罕见问题,即在 Azure Stack HCI 部署期间 DNS 记录被删除。 发生这种情况时,会出现以下异常:
Type 'PropagatePublicRootCertificate' of Role 'ASCA' raised an exception:<br>The operation on computer 'ASB88RQ22U09' failed: WinRM cannot process the request. The following error occurred while using Kerberos authentication: Cannot find the computer ASB88RQ22U09.local. Verify that the computer exists on the network and that the name provided is spelled correctly at PropagatePublicRootCertificate, C:\NugetStore\Microsoft.AzureStack, at Orchestration.Roles.CertificateAuthority.10.2402.0.14\content\Classes\ASCA\ASCA.psm1: line 38, at C:\CloudDeployment\ECEngine\InvokeInterfaceInternal.psm1: line 127,at Invoke-EceInterfaceInternal, C:\CloudDeployment\ECEngine\InvokeInterfaceInternal.psm1: line 123.
检查 DNS 服务器,查看群集节点的任何 DNS 记录是否缺失。 在缺少 DNS 记录的节点上应用以下缓解措施。

重启 DNS 客户端服务。 打开 PowerShell 会话并在受影响的节点上运行以下 cmdlet:
Taskkill /f /fi "SERVICES eq dnscache"
部署 在此版本中,多节点部署存在远程任务失败,导致以下异常:
ECE RemoteTask orchestration failure with ASRR1N42R01U31 (node pingable - True): A WebException occurred while sending a RestRequest. WebException.Status: ConnectFailure on [https://<URL>](https://<URL>).
缓解措施是在受影响的节点上重新启动 ECE 代理。 在服务器上,打开 PowerShell 会话并运行以下命令:
Restart-Service ECEAgent
添加/修复服务器 在此版本中,添加或修复服务器时,从现有节点复制软件负载均衡器或网络控制器 VM 证书时,会出现故障。 失败的原因是部署/更新期间未生成这些证书。 此版本中没有解决方法。 如果遇到此问题,请联系Microsoft支持部门确定后续步骤。
部署 在此版本中,存在一个暂时性问题,导致部署失败,但以下情况除外:
Type 'SyncDiagnosticLevel' of Role 'ObservabilityConfig' raised an exception:*<br>*Syncing Diagnostic Level failed with error: The Diagnostic Level does not match. Portal was not set to Enhanced, instead is Basic.
由于这是暂时性问题,因此重试部署应解决此问题。 有关详细信息,请参阅如何重新运行部署
部署 在此版本中,机密 URI/位置字段存在问题。 这是一个标记为“非强制”的必填字段,且这导致 Azure 资源管理器模板的部署失败。 使用 Azure 资源管理器模板 中的示例参数文件,以确保所有输入都采用所需格式,然后尝试通过 部署 Azure Stack HCI 版本 23H2。
如果部署失败,还必须在重新运行部署之前清理以下资源:
1. 删除 C:\EceStore
2. 删除 C:\CloudDeployment
3. 删除 C:\nugetstore
4. Remove-Item HKLM:\Software\Microsoft\LCMAzureStackStampInformation
安全性 对于新部署,具有安全核心功能的设备在默认情况下不会启用动态信任根 (DRTM)。 如果尝试使用 Enable-AzSSecurity cmdlet 启用 (DRTM),则会看到当前版本中不支持 DRTM 设置的错误。
Microsoft 建议进行深层防御,UEFI 安全启动仍然通过确保仅在签名和验证时加载静态信任根 (SRT) 引导链中的组件来保护这些组件。
此版本中不支持 DRTM。
网络连接 使用代理服务器时,环境检查会失败。 根据设计,winhttp 和 wininet 的绕过列表不同,这会导致验证检查失败。 遵循以下解决方法步骤:

1.在运行状况检查之前以及开始部署或更新之前,清除代理绕过列表。

2. 通过检查后,等待部署或更新失败。

3.再次设置代理绕过列表。
Arc VM 管理 当此操作期间自动生成的临时 SPN 机密以连字符开头时,Arc 资源桥的部署或更新可能会失败。 重试部署/更新。 重试应重新生成 SPN 机密,并且操作可能会成功。
Arc VM 管理 Arc VM 上的 Arc 扩展会无限期保持“创建”状态。 登录到 VM,打开命令提示符,然后键入以下内容:
Windows
notepad C:\ProgramData\AzureConnectedMachineAgent\Config\agentconfig.json
Linux
sudo vi /var/opt/azcmagent/agentconfig.json
接下来,找到 resourcename 属性。 删除追加到资源名称末尾的 GUID,以使该属性与 VM 的名称匹配。 然后重启 VM。
Arc VM 管理 将新服务器添加到 Azure Stack HCI 群集时,不会为新创建的卷自动创建存储路径。 可以为任何新卷手动创建存储路径。 有关详细信息,请参阅 创建存储路径
Arc VM 管理 大约 20 分钟后,Arc VM 操作的重启完成,尽管 VM 本身大约在一分钟内重启。 此版本中没有已知的解决方法。
Arc VM 管理 在某些情况下,逻辑网络的状态在 Azure 门户中显示为“失败”。 这是由于尝试删除逻辑网络时,没有先删除与该逻辑网络关联的网络接口等资源。
你仍然应该能够在这条逻辑网络上创建资源。 此实例中的状态具有误导性。
如果在预配此网络时,此逻辑网络的状态为成功,则可以继续在此网络上创建资源。
Arc VM 管理 在此版本中,在使用 Azure CLI 附加的数据磁盘更新 VM 时,操作会失败并显示以下错误消息:
找不到名为的虚拟硬盘。
使用 Azure 门户执行所有 VM 更新操作。 有关详细信息,请参阅 管理 Arc VM管理 Arc VM 资源
更新 在极少数情况下,更新 Azure Stack HCI 时可能会遇到以下错误:角色“MocArb”的类型“UpdateArbAndExtensions”引发异常:在步骤 [UpgradeArbAndExtensions:Get-ArcHciConfig] 中升级 ARB 和扩展时发生异常。UpgradeArb:无效的 applianceyaml = [C:\AksHci\hci-appliance.yaml]。 如果看到此问题,请联系Microsoft支持部门,以帮助你完成后续步骤。
网络连接 此版本中存在一个罕见的 DNS 客户端问题,导致在具有 DNS 解析错误的双节点群集上部署失败:发送 RestRequest. WebException.Status: NameResolutionFailure 时发生 WebException。由于该错误,第二个节点的 DNS 记录在创建后不久就会被删除,从而导致 DNS 错误。 重启服务器。 此操作会注册 DNS 记录,以防止其被删除。
Azure 门户 在某些情况下,Azure 门户可能需要一段时间才能更新,并且视图可能不是最新的。 可能需要等待 30 分钟或更多时间才能查看更新后的视图。
Arc VM 管理 从 Azure 门户删除 Arc VM 上的网络接口在此版本中不起作用。 使用 Azure CLI 先删除网络接口,然后将其删除。 有关详细信息,请参阅 删除网络接口,并参阅 删除网络接口
部署 在 Azure 门户中没有检测到以不正确的语法提供 OU 名称。 错误的语法包括不受支持的字符,如 &,",',<,>。 在群集验证过程中的后续步骤中检测到错误的语法。 确保 OU 路径语法正确且不包含不受支持的字符。
部署 通过 Azure 资源管理器进行的部署在 2 小时后超时。 尽管已成功创建群集,但超过 2 小时的部署在资源组中显示为失败。 若要在 Azure 门户中监视部署,请转到 Azure Stack HCI 群集资源,然后转到新的 部署 条目。
Azure 站点恢复服务 在此版本中,无法在 Azure Stack HCI 群集上安装 Azure Site Recovery。 此版本中没有已知的解决方法。
更新 通过 Azure 更新管理器更新 Azure Stack HCI 群集时,更新进度和结果在 Azure 门户中可能不可见。 若要解决此问题,请在每个群集节点上添加以下注册表项(无需值):

New-Item -Path "HKLM:\SYSTEM\CurrentControlSet\Services\HciCloudManagementSvc\Parameters" -force

然后在其中一个群集节点上重启云管理群集组。

Stop-ClusterGroup "Cloud Management"

Start-ClusterGroup "Cloud Management"

这不会完全修正问题,因为进度详细信息在更新过程期间可能仍未显示。 若要获取最新的更新详细信息,可以使用 PowerShell 检索更新进度
更新 在极少数情况下,如果失败的更新在 Azure 更新管理器中停留在正在进行状态,则会禁用 重试按钮。 若要恢复更新,请运行以下 PowerShell 命令:
Get-SolutionUpdate|Start-SolutionUpdate
更新 在某些情况下,如果 Send-DiagnosticData 命令后运行,SolutionUpdate 命令可能会失败。 请确保关闭用于 Send-DiagnosticData的 PowerShell 会话。 打开新的 PowerShell 会话并将其用于 SolutionUpdate 命令。
更新 在极少数情况下,当应用从 2311.0.24 到 2311.2.4 的更新时,群集状态显示正在进行,而不是预期的无法更新 重试更新。 如果问题仍然存在,请联系Microsoft支持部门。
更新 尝试安装解决方案更新可能会在 CAU 步骤结束时失败,原因如下:
There was a failure in a Common Information Model (CIM) operation, that is, an operation performed by software that Cluster-Aware Updating depends on.
如果节点重启后 Cluster NameCluster IP Address 资源无法启动,则会出现这种罕见的问题,这在小型群集中最为常见。
如果遇到此问题,请联系Microsoft支持部门获取后续步骤。 他们可以与你一起手动重启群集资源,并根据需要恢复更新。
更新 将群集更新应用到 10.2402.3.11 时,Get-SolutionUpdate cmdlet 可能无法响应,最终在大约 10 分钟后失败并出现 RequestTimeoutException。 在添加或修复服务器方案后,可能会发生这种情况。 使用 Start-ClusterGroupStop-ClusterGroup cmdlet 重启更新服务。

Get-ClusterGroup -Name "Azure Stack HCI Update Service Cluster Group" | Stop-ClusterGroup

Get-ClusterGroup -Name "Azure Stack HCI Update Service Cluster Group" | Start-ClusterGroup

成功运行这些 cmdlet 应该能够使更新服务上线。
群集感知更新 节点恢复操作失败,无法恢复节点。 这是暂时性问题,可以自行解决。 等待几分钟,然后重试该操作。 如果问题仍然存在,请联系Microsoft支持部门。
群集感知更新 挂起节点操作被卡住超过 90 分钟。 这是暂时性问题,可以自行解决。 等待几分钟,然后重试该操作。 如果问题仍然存在,请联系Microsoft支持部门。

后续步骤