你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure VMware 解决方案企业规模方案的管理和监视

正确管理和监视对于 Azure VMware 解决方案的成功至关重要。 此企业规模方案概述了环境设计的重要建议。 可在 Azure 企业级登陆区域的管理和监视中查看更多指导。

重要

平台监视是 Azure VMware 服务的一部分,监视工作负荷或应用程序、主机内存、计算或存储、vCenter、NSX-Manager NSX Edge VM 和 vSAN 或其他数据存储利用率等组件的利用率是客户响应的一部分。 虽然 Azure VMware 确实提供了下面提供的一些现式见解和示例,但强烈建议客户在本地利用现有的监视或日志记录平台,并尽可能扩展到此类产品的云版本,以确保关键工作负荷的不间断作。

规划 Azure VMware 解决方案的管理和监视环境时,了解 共同责任矩阵至关重要。 矩阵显示了哪些组件是Microsoft负责的,以及哪些组件是你负责管理和监视的。 Microsoft负责云资源的持续维护、安全性和管理,这样贵公司可以专注于最重要的事情,比如客户操作系统的配置、应用程序和虚拟机。

重要

若要支持 Azure VMware 解决方案,请务必遵循以下建议来配置服务运行状况警报。

平台管理和监控

查看以下有关 Azure VMware 解决方案的平台管理和监视的注意事项。 这些注意事项包含在 Azure Monitor 基线警报(AMBA)中。 Azure Monitor 基线警报(AMBA)是跨多个 Azure 资源和模式的结构化方法,用于创建警报来解决运行状况、性能和安全性的问题。

Azure 工具注意事项

  • 为对运营团队最重要的指标创建警报和仪表板。 请参阅 为 Azure VMware 解决方案 配置警报,了解可用的监视和警报指标。 GitHub 上提供了一个监控仪表板示例
  • vSAN 存储是一种有限的资源,需要对其进行管理才能保持可用性和性能。 熟悉 Azure VMware 解决方案存储概念。 仅对来宾虚拟机(VM)工作负荷使用 vSAN 存储。 查看以下设计注意事项,以减少 vSAN 上的不必要的存储使用。
  • 活动日志记录了在 Azure 中执行的操作。 这些操作包括创建、更新、删除和特殊操作,例如列出凭据或密钥。 例如,每当有人访问 Azure 门户中的 标识 选项卡或以编程方式请求 cloudadmin 凭据时,Azure VMware 解决方案都会发出 List PrivateClouds AdminCredentials。 警报规则可配置为在记录特定活动时发送通知。
  • Azure VMware 解决方案使用本地标识提供者。 部署后,对初始 Azure VMware 解决方案配置使用单个管理用户帐户。 将 Azure VMware 解决方案与 Active Directory 集成可以跟踪用户的操作。 查看来自登陆区域的标识部分的指南。

VMware 工具注意事项

  • 请考虑 VMware 解决方案(如 vRealize Operations Manager 和 vRealize Network Insights)来详细了解 Azure VMware 解决方案平台。 客户可以查看 NSX-T 数据中心分布式防火墙的监视数据,例如 vCenter Server 事件和流日志。
  • vRealize Operations 中可用的指标记录在 VMware 的 vRealize Operations 文档中。
  • Azure VMware 解决方案的 vRealize 日志见解目前支持拉取日志记录。 只能捕获事件、任务和警报。 当前不支持使用 Syslog 将非结构化数据从主机推送到 vRealize。 不支持 SNMP 陷阱。
  • 虽然Microsoft监视 vSAN 的运行状况,但可以利用 vCenter Server 查询和监视 vSAN 的性能。 可以从 VM 或后端的角度查看性能指标,通过 vCenter 显示平均延迟、IOPS、吞吐量和未完成的 IO。
  • 可以使用 Azure 私有云资源中的诊断设置将 vCenter Server 日志发送到存储帐户或事件中心。 日志设置不能直接在 vCenter Server 中配置,只能通过 Azure 中的私有云资源进行配置。 更多信息可在配置 VMware syslog 文档中找到。 输出是原始的系统日志,因此在启用之前请考虑数据保留和下游处理。
  • vRealize Operations 不支持使用 VMware 工具进行来宾内存收集。 正在使用和已使用的内存将继续工作。

来宾工作负荷管理注意事项

  • 默认情况下,Azure VMware 解决方案中的虚拟机与本地 VMware vSphere VM 相同。 可以通过现有代理继续使用 AVS 中的现有 VM 级监视。
  • 除非将 Azure Arc for Servers 部署到 Azure VMware 解决方案 VM,否则它们不会显示在 Azure 门户中。 Azure Arc for Servers 允许通过 Azure 控制平面进行基于代理的 VM 管理 & 监视。 可以应用 Azure Policy 计算机配置,使用 Microsoft Defender 保护服务器,并将 Azure Monitor 代理部署到来宾 VM。

设计建议

查看以下 建议,以便对 Azure VMware 解决方案进行平台管理和监视。

Azure 工具建议

  • 配置 Azure 服务运行状况以发送警报(针对服务问题、计划内维护以及可能影响 Azure VMware 解决方案和其他服务的其他事件)。 这些通知将发送到作组,可用于向所选地址发送电子邮件、短信、推送通知和语音呼叫。 操作还可以触发 Azure 和第三方系统,包括 Azure Functions、逻辑应用、自动化运行簿、事件中心和网页钩子。
  • 通过 Azure Monitor 指标监视 Azure VMware 解决方案基础结构的基线性能。 可以从 Azure 门户查询和筛选这些指标、通过 REST API 查询或定向到 Log Analytics、Azure 存储、事件中心或 合作伙伴集成
  • 使用以下 Azure Monitor 基线警报,以在群集接近磁盘、CPU 或 RAM 使用率的危险值时发出警告:
名字 阈值(严重性) 信号类型 频率 # 警报规则
CPU - CPU 百分比 (%) 80 (2) 有效CPU平均值 每 5 分钟一次 1
CPU - CPU 百分比 (%)(严重) 95 (0) EffectiveCpuAverage 每 5 分钟一次 1
内存 - 平均内存使用率(%) 80 (2) UsageAverage 每 5 分钟一次 1
内存 - 平均内存使用率(%) (严重) 95 (0) UsageAverage 每 5 分钟一次 1
磁盘 - 使用的数据存储磁盘百分比(%) 70 (2) 磁盘使用百分比 每 5 分钟一次 1
磁盘 - 数据存储磁盘使用百分比(%) (关键) 75 (0) 磁盘使用率 每 5 分钟一次 1
服务健康警报 N/A ServiceHealth N/A 1
  • 可以自动创建 Azure Monitor 警报Azure 服务运行状况警报
  • 对于服务级别协议(SLA)目的,Azure VMware 解决方案需要在 vSAN 上提供 25% 的松散空间。
  • 出于 SLA 目的,Azure VMware 解决方案要求具有 3 到 5 个主机的群集的故障数为 tolerate = 1,而具有 6 到 16 个主机的群集的故障数为 tolerate = 2。 以下 服务级别协议中记录了完整的 SLA。
  • 在混合环境中,可以使用 连接监视器 监视本地和 Azure 资源之间的通信。
  • Azure 网络观察程序 中配置两个连接监视器以监视连接。
    • 配置连接监视器 以查看 Azure VMware 解决方案(包括 ExpressRoute Direct 和 ExpressRoute Global Reach 连接)中的网络连接的可用性和性能。
  • 将日志发送到 Log Analytics。 有关详细信息,请参阅将日志发送到 Log Analytics

VMware 工具建议

来宾工作负荷管理建议

查看以下有关来宾管理以及监控 Azure VMware 解决方案中运行的工作负载的建议。

  • 在工作负荷迁移期间,使用“monitor-as-on-premises”模型最大程度地减少迁移期间的更改。 迁移后,请考虑使用 Azure Arc for Servers,通过 Azure 原生解决方案来管理和监视托管在 Azure VMware 解决方案上的工作负荷。

  • 默认存储策略使用复杂预配。 为有效使用 vSAN 容量,请使用 VM 精简预配进行评估。 每个 VM 的磁盘配置可能会有所不同。 VM 可以有厚磁盘或瘦磁盘,也可以有两者,具体取决于工作负荷的要求。

  • 按照适用于 Windows 和 Linux 的 混合指南为 VM 配置来宾监视。 以这种方式为 Windows 和 Linux 配置以下 Azure 集成:

    集成 描述
    Log Analytics 用于聚合、查询和以交互方式分析 Azure 资源生成的日志的主要工具。
    Microsoft Defender for Cloud 统一的基础结构安全管理系统,通过跨混合和 Azure 资源提供高级威胁防护来增强安全态势。
    Microsoft Sentinel 云原生安全信息和事件管理解决方案。 此 Azure 资源提供跨本地和云环境的安全分析、警报检测和自动威胁响应。
    Azure 更新管理 在本地和云环境中管理 Windows 和 Linux 计算机的作系统更新。
    Azure Monitor 用于从云和本地环境收集、分析和处理遥测数据的综合监视解决方案。

存储注意事项

若要根据 CPU 和内存要求帮助解决需要比 vSAN 更多的存储容量的存储密集型工作负荷,请考虑使用 Azure NetApp 文件 将存储占用空间扩展到 Azure 本机存储服务。

Azure VMware 解决方案支持将网络文件系统 (NFS) 数据存储附加为持久性存储选项。 可以使用 Azure NetApp 文件卷创建 NFS 数据存储,并将其附加到所选群集。 通过使用 Azure NetApp 文件支持的 NFS 数据存储,可以扩展存储,而不是缩放群集。 还可以使用 Azure NetApp 文件卷将数据从本地或主要 VMware 环境复制到辅助站点。

有关详细信息,请阅读适用于 Azure VMware 解决方案 的 Azure NetApp 文件数据存储

其他注意事项

  • 如果使用网络虚拟设备,请考虑在本地和 Azure 资源之间监视跟踪日志。 确保在 Azure 和 Azure VMware 解决方案之间设置监控。

后续步骤

了解企业规模方案中 Azure VMware 解决方案业务连续性和灾难恢复的设计注意事项。