分析警报以建立基线

已完成

当监视系统检测到重要问题时,警报会主动通知你。 有了警报,你就可以在系统的用户注意到问题之前确定并解决这些问题。

在这里,你将了解 Azure Monitor 中的警报体验,其中包括 Log Analytics 和 Application Insights。

分析警报以建立基线

有效的警报策略从建立基线开始。 下图显示了警报流:

显示警报如何从规则流向操作组或监视条件的关系图。

警报规则独立于警报,也独立于警报触发时采取的操作。

警报规则捕获警报的目标和条件。 警报规则可以是“已启用”或“已禁用”状态。 警报只有在启用后才会触发。

警报规则的关键属性包括:

  • 目标资源:目标资源定义适用于警报的范围和信号。 目标可以是任何 Azure 资源。 示例目标包括虚拟机、存储帐户、虚拟机规模集、Log Analytics 工作区或 Application Insights 资源。 对于某些资源(例如虚拟机)来说,可以将多个资源指定为警报规则的目标。

  • 信号:信号由目标资源发出,可以有几种类型:指标、活动日志,Application Insights 和日志

  • 条件/逻辑测试:条件是应用于目标资源的信号和逻辑的组合。 示例包括:

    • CPU 利用率超过 70%。
    • 服务器响应时间大于 4 毫秒。
    • 产生 100 多个结果的日志查询。
  • 操作组:操作组是在触发警报时执行的特定操作。 有关详细信息,请参阅在 Azure 门户中创建和管理操作组

可以报警的内容

可以按照 Azure Monitor 的监视数据源中所述对指标和日志发出警报。 这些警报包括但不限于:

  • 指标值。
  • 日志搜索查询。
  • 活动日志事件。
  • 基础 Azure 平台的运行状况。
  • 网址可用性测试。

管理警报

可以设置警报状态来指定它在解决过程中所处的阶段。 符合警报规则中指定的条件以后,就会创建或触发警报,其状态为“新”。 可以在确认警报和关闭警报时更改状态。 所有状态更改都存储在警报的历史记录中。

支持以下警报状态:

州省/自治区/直辖市 说明
新建 只是检测到了问题,但尚未审查问题。
已确认 管理员已审查警报,并已开始进行处理。
已关闭 问题已解决。 关闭某个警报后,可通过将其更改为另一种状态来重新打开它。

警报状态不同于且独立于监视条件。 警报状态是由用户设置的。 监视条件是由系统设置的。 当警报触发后,警报的监视条件设置为“已触发”。 当导致警报触发的基础条件解除后,监视条件会设置为“已解决”。 在用户更改警报状态之前,警报状态不会改变。 了解如何管理警报实例

警报体验

默认的“警报”页提供特定时间范围内创建的警报的摘要。 该页显示每种严重性的警报总数,列中会标识处于每种状态的、具有每种严重性的警报总数。 选择任一严重性可打开按该严重性筛选的“所有警报”页。

下面是一个示例:

显示“所有警报”页面的屏幕截图。

可以通过选择页面顶部的下拉菜单中的值,来对此视图进行筛选。

说明
订阅 最多可选择五个 Azure 订阅。 只有选定订阅中的警报才会包含在视图中。
资源组 选择单个资源组。 只有包含选定资源组中的目标的警报才会包含在视图中。
时间范围 只有在选定时间范围内触发的警报才会包含在该视图中。 支持的值为过去 1 小时、过去 24 小时、过去 7 天和过去 30 天。

选择“警报”页面顶部的以下值打开另一个页面。

说明
警报总数 符合选定条件的警报总数。 选择此值会打开未经筛选的“所有警报”视图。
警报规则总数 选定订阅和资源组中的警报规则总数。 选择此值会打开根据选定订阅和资源组筛选的“规则”视图。

管理警报规则

选择“管理警报规则”以显示“规则”页。 “规则”页是用于跨 Azure 订阅管理所有警报规则的一个地方。 此页列出所有警报规则,这些规则可以根据目标资源、资源组、规则名称或状态排序。 还可以在此页中编辑、启用或禁用警报规则。

下面是一个示例:

显示“规则”页面的屏幕截图。

创建警报规则

可以通过一致的方式创作警报,而不考虑监视服务或信号类型。 单个页面中提供了所有触发的警报和相关详细信息。

使用以下三个步骤创作新警报规则:

  1. 选取警报的目标。
  2. 从目标的可用信号中选择信号。
  3. 指定要应用到信号中数据的逻辑。

这个创作过程经过了简化,用户在选择 Azure 资源之前,不再需要知道受支持的监视源或信号。 可用信号列表会根据你选择的目标资源自动筛选。 另外,还将根据该目标引导你自动定义警报规则的逻辑。

若要详细了解如何创建警报规则,请参阅创建新的警报规则

警报可在多个 Azure 监视服务中使用。 有关如何以及何时使用其中每种服务的信息,请参阅监视和可观测性

“所有警报”页

选择“总警报数”以查看“所有警报”页。 在这里,可以查看在选定时间范围内创建的警报列表。

显示包含警报列表的“所有警报”页面的屏幕截图。

可以通过选择页面顶部的下拉菜单中的以下值,可以对该视图进行筛选。

说明
订阅 最多可选择五个 Azure 订阅。 只有选定订阅中的警报才会包含在视图中。
资源组 选择单个资源组。 只有包含选定资源组中的目标的警报才会包含在视图中。
资源类型 选择一个或多个资源类型。 只有包含选定类型中的目标的警报才会包含在视图中。 仅在指定资源组后,才显示此列。
资源 选择资源。 只有包含该资源(作为目标)的警报才会包含在视图中。 仅在指定资源类型后,才显示此列。
严重性 选择警报严重性,或选择“所有”以包含所有严重性的警报。
监视条件 选择监视条件,或选择“所有”以包括所有条件的警报
警报状态 选择警报状态,或选择“所有”以包含所有状态的警报
监视服务 选择一个服务,或选择“所有”以包含所有服务。 只会包含使用该服务(作为目标)的规则创建的警报。
时间范围 只有在选定时间范围内触发的警报才会包含在该视图中。 支持的值为过去 1 小时、过去 24 小时、过去 7 天和过去 30 天。

选择页面顶部的“列”可以选择要显示的列