什么是 Azure 本地监视?

适用于:Azure Local 2311.2 及更高版本

重要

Azure Stack HCI 现在是 Azure 本地的一部分。 了解详细信息

本文概述了 Azure 本地监视。

监视 Azure Local 涉及从系统的所有组件定期收集和分析数据,以及时识别和解决任何潜在问题。 例行监视对于维护 Azure 本地系统的运行状况和功能至关重要。

若要了解当前的性能模式、识别性能异常并开发解决问题的方法,请务必在不同时间和负载条件下为系统设置基线性能指标。

Azure 本地利用 Azure Monitor 工具,例如见解、指标、日志、工作簿和警报。 这些工具有助于收集数据、分析和主动响应已建立的基线中的一致或趋势差异。

Azure 本地中的监视功能

Azure Local 提供与 Azure Monitor 完全集成的监视功能。 这些功能提供见解,有助于可视化和分析数据,并使你能够对传入的监视数据做出响应。 以下部分概述了可用的功能及其提供的好处。

Insights

Azure Local Insights 收集关键性能和运行状况日志,并在预定义的仪表板中可视化这些收集到的数据。 这些仪表板提供了 Azure Local 系统的整体运行状况的综合可视化表示形式,包括节点、虚拟机 (VM) 和存储。 它通过 CPU 和内存使用情况、网络使用情况和存储性能(例如 IOPS、吞吐量和延迟)提供对 Azure Local 系统的性能和使用情况可见性。 借助 Insights for Azure Local,还可以访问专门为监视 Azure Local 的关键功能而创建的工作簿,例如复原文件系统 (ReFS) 重复数据删除和压缩,以及 Dell 的硬件监视。 还可以自定义现有工作簿以创建新工作簿。 若要了解有关这些功能工作簿的详细信息,请参阅 使用 Insights 监视 Azure 本地功能。

可以使用 Insights 同时监视单个 Azure 本地系统或多个系统。 见解使用 Azure Monitor 代理收集数据,然后将数据存储在 Log Analytics 工作区中。 它使用 Kusto 查询语言 (KQL) 查询 Log Analytics 工作区,并使用 Azure 工作簿可视化结果。 若要了解如何使用 Insights 监视一个或多个 Azure 本地系统,请参阅 使用 Insights 监视单个 Azure 本地系统,或使用 Insights 监视多个 Azure 本地系统。

指标

Azure Local Metrics 收集了 60 多个关键指标,用于监视基础设施,这些指标开箱即用,无需额外付费。 这些指标包括 CPU 和内存使用情况、存储性能指标,例如 IOPS、延迟和吞吐量、网络吞吐量和 VM 性能指标。 可以通过预定义的图表在 Azure Monitor 中查看这些指标。 还可以根据自己的偏好创建自定义图表来可视化这些指标。

使用指标可将群集中的数值数据存储在专用时序数据库中。 此数据是使用遥测和诊断 Arc 扩展收集的,然后使用指标资源管理器进行分析。 若要了解有关指标的详细信息,请参阅 使用 Azure Monitor 指标监视 Azure 本地。

警报

Azure Local 通过 Azure Monitor 警报提供警报功能。 在监视数据中发现重要情况时,警报会以主动的方式通知你。 可以根据 OS 运行状况服务的预定义运行状况错误发出警报,也可以根据收集的指标或日志创建自定义警报。 为了简化自定义警报的创建,可以使用一组建议的警报作为模板。

警报可用于在系统的用户注意到问题之前确定和解决这些问题。 响应可以是发送给管理员的文本或电子邮件,也可以是尝试更正错误状态的自动化过程。

有关警报的详细信息,请参阅 什么是 Azure Monitor 警报?

警报类型

下表提供了 Azure Local 中每种警报类型的简要说明和设置说明:

警报类型 说明 配置方式
运行状况警报 OS 运行状况服务监视 80 多个运行状况问题,包括存储容量、存储 QoS、物理磁盘和网络适配器硬件问题、服务器 CPU 和内存使用情况以及群集配置。
这些警报是系统生成的警报,无需额外付费。 无需设置 Log Analytics 或手动创建任何警报规则。
请参阅 为 Azure 本地配置运行状况警报。
基于日志的警报 这些是客户定义的警报,用于对日志数据执行高级逻辑操作。 通过这些警报,可以使用 Log Analytics 查询以预定义的频率评估资源日志。
预定义模板可用于帮助开始使用日志警报。
请参阅 为 Azure 本地设置日志警报。
基于指标的警报 这些是客户定义的警报,用于定期评估 Azure 本地系统的指标。 如果希望收到有关需要很少或不需要操作的数据的警报,指标警报很有用。 请参阅 为 Azure 本地设置指标警报。
建议的警报 这些是 Azure 本地系统资源的基于指标的预定义警报。 这些警报提供对一组常见指标的初始监视,包括 CPU 百分比和可用内存。 请参阅 “为 Azure 本地启用建议的警报规则”。

高级体系结构

Azure 本地监视的体系结构大致包括以下关键组件:

  • 部署扩展以收集日志、指标、遥测和警报。
  • 使用 Azure Monitor 工具(例如见解、指标、日志、工作簿和警报)来有效分析、可视化和响应数据。

下图是 Azure 本地监视实现的体系结构表示形式。

Azure 本地监视的高级体系结构关系图。此图显示了包含三个节点的 Azure 本地系统。每个节点都安装了用于监视的扩展。

后续步骤