分析警报以建立基线
当监视系统检测到重要问题时,警报会主动通知你。 有了警报,你就可以在系统的用户注意到问题之前确定并解决这些问题。
在这里,你将了解 Azure Monitor 中的警报体验,其中包括 Log Analytics 和 Application Insights。
分析警报以建立基线
有效的警报策略从建立基线开始。 下图显示了警报流:
警报规则独立于警报,也独立于警报触发时采取的操作。
警报规则捕获警报的目标和条件。 警报规则可以是“已启用”或“已禁用”状态。 警报只有在启用后才会触发。
警报规则的关键属性包括:
目标资源:目标资源定义适用于警报的范围和信号。 目标可以是任何 Azure 资源。 示例目标包括虚拟机、存储帐户、虚拟机规模集、Log Analytics 工作区或 Application Insights 资源。 对于某些资源(例如虚拟机)来说,可以将多个资源指定为警报规则的目标。
信号:信号由目标资源发出,可以有几种类型:指标、活动日志,Application Insights 和日志。
条件/逻辑测试:条件是应用于目标资源的信号和逻辑的组合。 示例包括:
- CPU 利用率超过 70%。
- 服务器响应时间大于 4 毫秒。
- 产生 100 多个结果的日志查询。
操作组:操作组是在触发警报时执行的特定操作。 有关详细信息,请参阅在 Azure 门户中创建和管理操作组。
可以报警的内容
可以按照 Azure Monitor 的监视数据源中所述对指标和日志发出警报。 这些警报包括但不限于:
- 指标值。
- 日志搜索查询。
- 活动日志事件。
- 基础 Azure 平台的运行状况。
- 网址可用性测试。
管理警报
可以设置警报状态来指定它在解决过程中所处的阶段。 符合警报规则中指定的条件以后,就会创建或触发警报,其状态为“新”。 可以在确认警报和关闭警报时更改状态。 所有状态更改都存储在警报的历史记录中。
支持以下警报状态:
州省/自治区/直辖市 | 说明 |
---|---|
新建 | 只是检测到了问题,但尚未审查问题。 |
已确认 | 管理员已审查警报,并已开始进行处理。 |
已关闭 | 问题已解决。 关闭某个警报后,可通过将其更改为另一种状态来重新打开它。 |
警报状态不同于且独立于监视条件。 警报状态是由用户设置的。 监视条件是由系统设置的。 当警报触发后,警报的监视条件设置为“已触发”。 当导致警报触发的基础条件解除后,监视条件会设置为“已解决”。 在用户更改警报状态之前,警报状态不会改变。 了解如何管理警报实例。
警报体验
默认的“警报”页提供特定时间范围内创建的警报的摘要。 该页显示每种严重性的警报总数,列中会标识处于每种状态的、具有每种严重性的警报总数。 选择任一严重性可打开按该严重性筛选的“所有警报”页。
下面是一个示例:
可以通过选择页面顶部的下拉菜单中的值,来对此视图进行筛选。
列 | 说明 |
---|---|
订阅 | 最多可选择五个 Azure 订阅。 只有选定订阅中的警报才会包含在视图中。 |
资源组 | 选择单个资源组。 只有包含选定资源组中的目标的警报才会包含在视图中。 |
时间范围 | 只有在选定时间范围内触发的警报才会包含在该视图中。 支持的值为过去 1 小时、过去 24 小时、过去 7 天和过去 30 天。 |
选择“警报”页面顶部的以下值打开另一个页面。
值 | 说明 |
---|---|
警报总数 | 符合选定条件的警报总数。 选择此值会打开未经筛选的“所有警报”视图。 |
警报规则总数 | 选定订阅和资源组中的警报规则总数。 选择此值会打开根据选定订阅和资源组筛选的“规则”视图。 |
管理警报规则
选择“管理警报规则”以显示“规则”页。 “规则”页是用于跨 Azure 订阅管理所有警报规则的一个地方。 此页列出所有警报规则,这些规则可以根据目标资源、资源组、规则名称或状态排序。 还可以在此页中编辑、启用或禁用警报规则。
下面是一个示例:
创建警报规则
可以通过一致的方式创作警报,而不考虑监视服务或信号类型。 单个页面中提供了所有触发的警报和相关详细信息。
使用以下三个步骤创作新警报规则:
- 选取警报的目标。
- 从目标的可用信号中选择信号。
- 指定要应用到信号中数据的逻辑。
这个创作过程经过了简化,用户在选择 Azure 资源之前,不再需要知道受支持的监视源或信号。 可用信号列表会根据你选择的目标资源自动筛选。 另外,还将根据该目标引导你自动定义警报规则的逻辑。
若要详细了解如何创建警报规则,请参阅创建新的警报规则。
警报可在多个 Azure 监视服务中使用。 有关如何以及何时使用其中每种服务的信息,请参阅监视和可观测性。
“所有警报”页
选择“总警报数”以查看“所有警报”页。 在这里,可以查看在选定时间范围内创建的警报列表。
可以通过选择页面顶部的下拉菜单中的以下值,可以对该视图进行筛选。
列 | 说明 | |
---|---|---|
订阅 | 最多可选择五个 Azure 订阅。 只有选定订阅中的警报才会包含在视图中。 | |
资源组 | 选择单个资源组。 只有包含选定资源组中的目标的警报才会包含在视图中。 | |
资源类型 | 选择一个或多个资源类型。 只有包含选定类型中的目标的警报才会包含在视图中。 仅在指定资源组后,才显示此列。 | |
资源 | 选择资源。 只有包含该资源(作为目标)的警报才会包含在视图中。 仅在指定资源类型后,才显示此列。 | |
严重性 | 选择警报严重性,或选择“所有”以包含所有严重性的警报。 | |
监视条件 | 选择监视条件,或选择“所有”以包括所有条件的警报。 | |
警报状态 | 选择警报状态,或选择“所有”以包含所有状态的警报。 | |
监视服务 | 选择一个服务,或选择“所有”以包含所有服务。 只会包含使用该服务(作为目标)的规则创建的警报。 | |
时间范围 | 只有在选定时间范围内触发的警报才会包含在该视图中。 | 支持的值为过去 1 小时、过去 24 小时、过去 7 天和过去 30 天。 |
选择页面顶部的“列”可以选择要显示的列。