你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

监视 Azure 平台登陆区域组件

监视 Azure 平台登陆区域组件,以确保可用性、可靠性、安全性和可伸缩性。 监视组件使组织能够:

  • 及时检测和解决问题,优化资源利用率,并主动解决安全威胁。
  • 持续监视性能和运行状况,这有助于组织最大程度地减少停机时间、优化成本并确保高效操作。
  • 促进容量规划,使组织能够预测资源需求并相应地缩放平台。

监视平台登陆区域服务,以保持稳定且安全的环境,最大程度地提高性能,并有效地满足不断变化的业务需求。

以下视频讨论了本文中所述的解决方案,并演示如何部署 Azure Monitor。

Azure 登陆区域监视指南

基线指标、活动日志和日志查询警报可用于登陆区域平台组件和其他选定的登陆区域组件。 这些警报可确保对 Azure 登陆区域进行一致的警报和监视。 它们基于 Microsoft 建议的主动监视做法,例如设置警报、阈值和通知,以便及时检测和响应问题。 使用以下指南实时了解平台登陆区域实现的性能、利用率和安全性。 主动解决问题,优化资源分配,并确保可靠且安全的环境。

显示 Azure Monitor 基线警报拓扑的关系图。

下载此体系结构的 Visio 文件

以下 Azure 组件的子集定义了一个或多个警报:

  • Azure ExpressRoute
  • Azure 防火墙
  • Azure 虚拟网络
  • Azure 虚拟 WAN
  • Azure Monitor Log Analytics 工作区
  • Azure 专用 DNS 区域
  • Azure Key Vault
  • Azure 虚拟机
  • Azure 存储帐户

有关详细信息,请参阅 警报详细信息

若要确保组织的资源受到适当的监视和保护,还需要正确配置警报并实施相应的流程来响应警报。 使用适当的通知通道配置操作组并测试警报,以确保它们按预期工作。 根据订阅民主化云采用框架原则,为每个订阅配置至少一个操作组,以便向相关人员通知警报。 作为最低形式的通知,操作组应包括电子邮件通知通道。 如果使用 Azure Monitor 警报处理规则将警报路由到一个或多个操作组,请注意,服务运行状况警报不支持警报处理规则。 使用操作组直接配置服务运行状况警报。

根据 策略驱动的治理的 Azure 登陆区域原则,提供了一个框架解决方案,提供一种简单的方法来使用 Azure Policy 缩放警报。 这些策略使用 DeployIfNotExists 效果在平台服务和登陆区域在 Azure 登陆区域环境中创建资源时部署相关的警报规则、警报处理规则和操作组。

Azure Policy 提供默认基线配置,但你可以配置策略以满足你的需求。 如果需要针对存储库提供的不同指标发出警报,该解决方案提供了一个框架,用于开发自己的策略来部署警报规则。 有关详细信息,请参阅 Azure Monitor 基线警报(AMBA)参与者指南Azure Monitor 部署简介。 该解决方案已集成到 Azure 登陆区域安装体验中,因此 Azure 登陆区域的新实现提供了在安装时设置基线警报的机会。

通过策略部署警报以提供灵活性和可伸缩性,并确保警报部署在 Azure 登陆区域范围内外。 仅当创建相应的资源时,才会部署警报,从而避免不必要的成本,并确保在部署时更新的警报配置。 此函数与策略驱动治理的 Azure 登陆区域原则相吻合。

布朗菲尔德指南

在棕色场景中,组织具有现有的 Azure 登陆区域实现,或者组织在 Azure 登陆区域体系结构可用之前实现了 Azure。

本部分介绍 Azure 登陆区域基线监视的高级步骤(无论是否与 Azure 登陆区域保持一致)。

与 Azure 登陆区域对齐

如果有现有的 Azure 登陆区域实现,并且想要使用策略驱动方法,请使用此过程。

  1. 从 AMBA 存储库导入相关策略和计划。
  2. 在环境中分配所需的策略。
  3. 修正不符合策略。

有关与环境相关的策略以及应用策略的步骤的详细信息,请参阅 “确定管理组层次结构”。

与 Azure 登陆区域不一致

如果实施非 Azure 登陆区域且想要使用策略驱动方法,请使用此过程。

  1. 将相关策略和计划从 AMBA 存储库导入到要从中分配策略的最顶级管理组。
  2. 在环境中分配所需的策略。
  3. 修正不符合策略。

有关与环境相关的策略以及应用策略的步骤的详细信息,请参阅 “确定管理组层次结构”。

测试框架

在部署到生产环境之前测试策略和警报,以便可以:

  • 确保组织的资源受到适当的监视和保护。
  • 尽早识别问题,确保适当的功能、降低风险并提高性能。
  • 在问题变大之前检测并解决问题。 避免误报或负数,并降低成本高昂的错误风险。
  • 优化配置以提高性能,避免生产中与性能相关的问题。

测试有助于确保警报和策略配置满足组织的要求,并符合法规和标准。 通过制定法规,可以避免安全漏洞、合规性违规和其他可能导致组织后果的风险。

测试是开发和部署警报和策略配置的重要步骤,可帮助确保组织资源的安全性、可靠性和性能。

有关详细信息,请参阅 Azure 登陆区域的测试方法。

注意

如果使用其他方法(例如基础结构即代码(IaC)实现警报,例如 Azure 资源管理器、Bicep 或 Terraform,或者通过门户实现警报,存储库中的警报、严重性和阈值指南仍适用于确定要配置和发送通知的警报规则。

后续步骤