验证 Azure Stack Hub 系统状态

Azure Stack Hub 操作员必须能够按需确定系统的运行状况和状态,这一点至关重要。 Azure Stack Hub 验证工具 (Test-AzureStack) 是一个 PowerShell cmdlet,可让你在系统上运行一系列测试来识别故障(如果有)。 在向 Microsoft 客户服务支持(Microsoft 支持部门)咨询问题时,通常会要求你通过特权终结点 (PEP) 来运行此工具。 使用现有的系统范围运行状况和状态信息,Microsoft 支持部门可以收集和分析详细的日志,专注于发生错误的区域,与你一起解决问题。

运行验证工具并访问结果

可以使用 PEP 运行验证工具。 该工具可能需要一段时间才能运行。 时间长度取决于系统中虚拟机的数量。 每项测试在 PowerShell 窗口中返回 PASS/FAIL(通过/失败)状态。

下面概述了端到端的验证测试过程:

  1. 建立信任。 在集成系统中,从权限提升的 Windows PowerShell 会话运行以下命令,将 PEP 添加为硬件生命周期主机或特权访问工作站上运行的强化 VM 的受信任主机。

    winrm s winrm/config/client '@{TrustedHosts="<IP Address of Privileged Endpoint>"}'
    

    如果运行的是 Azure Stack Hub 开发工具包 (ASDK),请登录到开发工具包主机。

  2. 访问 PEP。 运行以下命令建立 PEP 会话:

    Enter-PSSession -ComputerName "<ERCS VM-name/IP address>" -ConfigurationName PrivilegedEndpoint -Credential $localcred 
    

    提示

    若要访问 Azure Stack 开发工具包 (ASDK) 主机上的 PEP,请使用 AzS-ERCS01 作为 -ComputerName。

  3. 进入 PEP 后,运行:

    Test-AzureStack
    

    有关详细信息,请参阅参数注意事项用例

  4. 如果有任何测试报告了“失败”,请运行 Get-AzureStackLog。 有关集成系统的说明,请参阅在 Azure Stack Hub 集成系统上运行 Get-AzureStackLog

    该 cmdlet 收集 Test-AzureStack 生成的日志。 如果测试报告“警告”,建议不要收集日志并联系 Microsoft 支持部门

  5. 如果 Microsoft 支持部门已指示你运行验证工具,Microsoft 支持代表会请求你提供收集的日志,以便继续排查问题。

可用的测试

使用验证工具可以运行一系列的系统级测试和基本云方案,以洞察当前状态,并修复系统中的问题。

云基础结构测试

这些低影响性测试在基础结构级别进行,提供有关各个系统组件和功能的信息。 目前,这些测试划分为以下类别:

测试类别 -Include 和 -Ignore 的参数
Azure Stack Hub ACS 摘要 AzsAcsSummary
Azure Stack Hub 行动计划状态 AzsActionPlanStatus
Azure Stack Hub 代理运行状况 AzsAgentHealth
Azure Stack AKS Arc 预览版摘要 AzsAksArcPreviewSummary
Azure Stack Hub Active Directory 摘要 AzsAdSummary
Azure Stack Hub 警报摘要 AzsAlertSummary
Azure Stack Hub 应用程序崩溃摘要 AzsApplicationCrashSummary
Azure Stack Hub 备份共享可访问性摘要 AzsBackupShareAccessibility
Azure Stack Hub 控制平面摘要 AzsControlPlane
Azure Stack Hub DCB 验证 AzsDCBValidation
Azure Stack Hub Defender 摘要 AzsDefenderSummary
Azure Stack Hub ECE 预配状态 AzsEceProvisioningStatus
Azure Stack Hub 外部证书摘要 AzsExternalCertificates
Azure Stack Hub GPU 配置摘要 AzsGpuConfigurationSummary
Azure Stack Hub 硬件监视器启用 AzsGpuConfigurationSummary
Azure Stack Hub 托管基础结构固件摘要 AzsHostingInfraFWSummary
Azure Stack Hub 托管基础结构摘要 AzsHostingInfraSummary
Azure Stack Hub 托管基础结构利用率 AzsHostingInfraUtilization
Azure Stack Hub 标识提供者连接 AzsIdentityProviderConnectivity
Azure Stack Hub 标识提供者状态 AzsIdentityProviderStatus
Azure Stack Hub 基础结构容量 AzsInfraCapacity
Azure Stack Hub 基础结构文件验证 AzsInfraFileValidation
Azure Stack Hub 基础结构性能 AzsInfraPerformance
Azure Stack Hub 基础结构角色摘要 AzsInfraRoleSummary
Azure Stack Hub 基础结构更新内存 AzsInfraUpdateMemory
Azure Stack Hub 基础结构更新摘要 AzsInfraUpdateSummary
Azure Stack Hub NCImos 验证 AzsNCImosValidation
Azure Stack Hub 网络基础结构 AzsNetworkInfra
Azure Stack Hub OEM 硬件 AzsOemHardware
Azure Stack Hub OEM 更新先决条件 AzsOemUpdatePrereqs
Azure Stack Hub 门户和 API 摘要 AzsPortalAPISummary
Azure Stack Hub RDMA 操作状态 AzsRdmaOperationalStatus
Azure Stack Hub 资源提供程序身份验证状态 AzsResourceProviderAuthStatus
Azure Stack Hub 缩放单元 VM 事件 AzsScaleUnitEvents
Azure Stack Hub 缩放单元 VM 资源 AzsScaleUnitResources
Azure Stack Hub 方案 AzsScenarios
Azure Stack Hub Service Fabric 角色摘要 AzsSFRoleSummary
Azure Stack Hub SQL 诊断 AzsSQLDiagnostics
Azure Stack Hub SQL 摘要 AzsSQLSummary
Azure Stack Hub Stamp BMC 摘要 AzsStampBMCSummary
Azure Stack Hub 存储数据平面 AzsStorageDataPlane
Azure Stack Hub 存储服务摘要 AzsStorageSvcsSummary
Azure Stack Hub SQL 存储摘要 AzsStoreSummary
Azure Stack Hub 使用情况摘要 AzsUsage
Azure Stack Hub 使用情况网桥摘要 AzsUsageBridgeSummary
Azure Stack Hub VM 位置摘要 AzsVmPlacement

云方案测试

除了上一部分的基础结构测试以外,还可以运行云方案测试,以检查各基础结构组件的功能。 由于这些测试涉及到资源部署,因此需要云管理员凭据才能运行这些测试。

注意

目前不能使用 Active Directory 联合身份验证服务 (AD FS) 凭据运行云方案测试。

验证工具可测试以下云方案:

  • 资源组创建
  • 计划创建
  • 套餐创建
  • 存储帐户创建
  • 虚拟机 (VM) 创建
  • Blob 存储操作
  • 队列存储操作
  • 表存储操作

参数注意事项

  • List 参数可用于显示所有可用的测试类别。

  • IncludeIgnore 参数可用于包含或排除测试类别。 有关这些参数的详细信息,请参阅以下部分。

    Test-AzureStack -Include AzsSFRoleSummary, AzsInfraCapacity
    
    Test-AzureStack -Ignore AzsInfraPerformance
    
  • 在云方案测试期间,会部署一个租户 VM。 可以使用 DoNotDeployTenantVm 来禁用此 VM 部署。

  • 用例部分所述,需要提供 ServiceAdminCredential 参数才能运行云方案测试。

  • 用例部分所述,在测试基础结构备份设置时,需使用 BackupSharePathBackupShareCredential

  • DetailedResults 可用于获取每个测试以及整个运行的通过/失败/警告信息。 如果未指定此参数,未发生失败时,Test-AzureStack 将返回 $true,否则返回 $false

  • TimeoutSeconds 可用于设置每个组完成的特定时间。

  • 验证工具还支持常用的 PowerShell 参数:Verbose、Debug、ErrorAction、ErrorVariable、WarningAction、WarningVariable、OutBuffer、PipelineVariable 和 OutVariable。 有关详细信息,请参阅有关通用参数

用例

在不测试云方案的情况下运行验证

在不使用 ServiceAdminCredential 参数的情况下运行验证工具可以跳过云方案测试:

New-PSSession -ComputerName "<ERCS VM-name/IP address>" -ConfigurationName PrivilegedEndpoint -Credential $localcred -SessionOption (New-PSSessionOption -Culture en-US -UICulture en-US)
Test-AzureStack

在测试云方案的情况下运行验证

默认情况下,在验证工具中提供 ServiceAdminCredentials 参数会运行云方案测试:

Enter-PSSession -ComputerName "<ERCS VM-name/IP address>" -ConfigurationName PrivilegedEndpoint -Credential $localcred 
Test-AzureStack -ServiceAdminCredential "<Cloud administrator user name>" 

如果你只想运行云方案而不运行其余的测试,可以使用 Include 参数实现此目的:

Enter-PSSession -ComputerName "<ERCS VM-name/IP address>" -ConfigurationName PrivilegedEndpoint -Credential $localcred 
Test-AzureStack -ServiceAdminCredential "<Cloud administrator user name>" -Include AzsScenarios   

必须以 UPN 格式键入云管理员的用户名:serviceadmin@contoso.onmicrosoft.com (Microsoft Entra ID)。 出现提示时,键入云管理员帐户的密码。

为了改善操作员体验,已启用 Group 参数以同时运行多个测试类别。 目前定义了三个组:DefaultUpdateReadinessSecretRotationReadiness

  • 默认:被视为 Test-AzureStack 的标准运行。 如果未选择其他组,则默认会运行此组。

  • UpdateReadiness:检查是否可以更新 Azure Stack Hub 实例。 当 UpdateReadiness 组运行时,警告将作为错误显示在控制台输出中,应将其视为更新的阻碍。 以下类别属于 UpdateReadiness 组:

    • AzsInfraFileValidation
    • AzsActionPlanStatus
    • AzsStampBMCSummary
  • SecretRotationReadiness:检查 Azure Stack Hub 实例是否处于可以运行机密轮换的状态。 当 SecretRotationReadiness 组运行时,警告将作为错误显示在控制台输出中,应将其视为机密轮换的阻碍。 以下类别属于 SecretRotationReadiness 组:

    • AzsAcsSummary
    • AzsDefenderSummary
    • AzsHostingInfraSummary
    • AzsInfraCapacity
    • AzsInfraRoleSummary
    • AzsPortalAPISummary
    • AzsSFRoleSummary
    • AzsStorageSvcsSummary
    • AzsStoreSummary

Group 参数示例

在使用 Group 安装更新或修补程序之前,以下示例会运行 Test-AzureStack 来测试系统就绪状态。 在开始安装更新或修补程序之前,请运行 Test-AzureStack 来检查 Azure Stack Hub 的状态:

Test-AzureStack -Group UpdateReadiness

运行验证工具以测试基础结构备份设置

在配置基础结构备份之前,可以使用 AzsBackupShareAccessibility 测试来测试备份共享路径和凭据。

Enter-PSSession -ComputerName "<ERCS VM-name/IP address>" -ConfigurationName PrivilegedEndpoint -Credential $localcred 
Test-AzureStack -Include AzsBackupShareAccessibility -BackupSharePath "\\<fileserver>\<fileshare>" -BackupShareCredential $using:backupcred

配置备份之后,可以运行 AzsBackupShareAccessibility 来验证是否可以从 ERCS 访问共享:

Enter-PSSession -ComputerName "<ERCS VM-name/IP address>" -ConfigurationName PrivilegedEndpoint -Credential $localcred 
Test-AzureStack -Include AzsBackupShareAccessibility

若要使用已配置的备份共享测试新凭据,请运行:

Enter-PSSession -ComputerName "<ERCS VM-name/IP address>" -ConfigurationName PrivilegedEndpoint -Credential $localcred 
Test-AzureStack -Include AzsBackupShareAccessibility -BackupShareCredential "<PSCredential for backup share>"

运行验证工具以测试网络基础结构

此测试绕过 Azure Stack Hub 软件定义网络 (SDN) 检查网络基础结构的连接。 它演示如何从公共 VIP 连接到配置的 DNS 转发器、NTP 服务器和身份验证终结点。 这包括使用 Microsoft Entra ID 作为标识提供者时与 Azure 的连接,或者在使用 AD FS 作为标识提供者时与联合服务器的连接。

包括调试参数以获取命令的详细输出:

Test-AzureStack -Include AzsNetworkInfra -Debug

后续步骤

若要详细了解 Azure Stack Hub 诊断工具和问题日志记录,请参阅 Azure Stack Hub 诊断日志集合

若要了解有关故障排除的详细信息,请参阅 Azure Stack Hub 故障排除