你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Monitor 中的代理运行状况解决方案

Azure 中的代理运行状况解决方案可帮助你了解哪些代理无响应且正在提交操作数据。 这包括所有直接向 Azure Monitor 中的 Log Analytics 工作区报告或者向连接到 Azure Monitor 的 System Center Operations Manager 管理组报告的代理。

使用代理运行状况解决方案还可以:

  • 跟踪所部署代理的数目及其地理分布。
  • 执行其他查询,以便持续了解部署在 Azure、其他云环境或本地的代理的分布。

重要

代理运行状况解决方案仅监视 Log Analytics 代理的运行状况,而该代理于 2024 年 8 月 31 日起已弃用。 该解决方案不监视 Azure Monitor 代理的运行状况。

先决条件

在部署此解决方案之前,请确认已安装受支持的 Windows 代理,此类代理向 Log Analytics 工作区报告或向与工作区集成的 Operations Manager 管理组报告。

管理包

如果 Operations Manager 管理组已连接到 Log Analytics 工作区,则会在 Operations Manager 中安装以下管理包。 在添加此解决方案后,还会在直接连接的 Windows 计算机上安装这些管理包:

  • Microsoft System Center Advisor HealthAssessment Direct Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

这些管理包不需进行配置或管理。 有关如何更新解决方案管理包的详细信息,请参阅将 Operations Manager 连接到 Log Analytics

配置

执行添加解决方案中所述的过程,将代理运行状况解决方案添加到 Log Analytics 工作区。 无需进一步配置。

支持的代理

下表介绍了此解决方案支持的连接的源。

连接的源 支持 说明
Windows 代理 检测信号事件从直接的 Windows 代理收集。
System Center Operations Manager 管理组 每 60 秒从向管理组报告的代理中收集一次检测信号事件,然后将其转发到 Azure Monitor。 不需要从 Operations Manager 代理直接连接到 Azure Monitor。 检测信号事件数据从管理组转发到 Log Analytics 工作区。

使用解决方案

向 Log Analytics 工作区添加解决方案时,“代理运行状况”磁贴将添加到仪表板。 此磁贴显示过去 24 小时内的总代理数以及不响应的代理数。

显示仪表板上的“代理运行状况”磁贴的屏幕截图。

选择“代理运行状况”磁贴打开“代理运行状况”仪表板 。 仪表板包含下表中的列。 每个列按照指定时间范围内符合该列条件的计数列出了前 10 个事件。 可以运行提供整个列表的日志搜索。 选择每列下方的“全部查看”或选择列标题。

说明
某个时段的代理计数 在七天时段内 Linux 和 Windows 代理的代理计数趋势
无响应代理的计数 在过去 24 小时内未发送检测信号的代理的列表
按 OS 类型列出的分布情况 对环境中存在的 Windows 代理和 Linux 代理进行数目上的细分
按代理版本列出的分布情况 对安装在环境中的代理版本进行细分,并对每个版本计数
按代理类别列出的分布情况 对发送检测信号事件的类别的代理进行细分:直接代理、Operations Manager 代理或 Operations Manager 管理服务器
按管理组列出的分布情况 对环境中的 Operations Manager 管理组进行细分
代理的地理位置 对代理所在的国家/地区进行细分,并对安装在每个国家/地区的代理进行总计
已安装的网关计数 已安装 Log Analytics 网关的服务器数,以及这些服务器的列表

显示代理运行状况解决方案仪表板示例的屏幕截图。

Azure Monitor 日志记录

该解决方案在 Log Analytics 工作区中创建一种类型的记录:检测信号。 检测信号记录具有下表中列出的属性。

属性 说明
Type Heartbeat
Category Direct AgentSCOM AgentSCOM Management Server
Computer 计算机名称
OSType Windows 或 Linux 操作系统
OSMajorVersion 操作系统主版本
OSMinorVersion 操作系统次版本
Version Log Analytics 代理或 Operations Manager 代理版本
SCAgentChannel Direct 和/或 SCManagementServer
IsGatewayInstalled 如果 Log Analytics 网关已安装,则为 true,否则为 false
ComputerIP Azure 虚拟机的公共 IP 地址(如果有);使用专用 IP 的虚拟机的 Azure SNAT 地址(而不是专用 IP 地址)
ComputerPrivateIPs 计算机的专用 IP 列表
RemoteIPCountry 计算机部署到的地理位置
ManagementGroupName Operations Manager 管理组的名称
SourceComputerId 计算机的唯一 ID
RemoteIPLongitude 计算机所在地理位置的经度
RemoteIPLatitude 计算机所在地理位置的纬度

向 Operations Manager 管理服务器报告的每个代理将发送两个检测信号。 SCAgentChannel 属性的值将包含 DirectSCManagementServer,具体取决于你在订阅中启用了哪些数据源和监视解决方案。

如前所述,来自解决方案的数据将按以下方式之一发送:

  • 直接从 Operations Manager 管理服务器发送到 Azure Monitor。
  • 直接从代理发送到 Azure Monitor,原因与代理上收集的数据量有关。

对于具有 SCManagementServer 值的检测信号事件,ComputerIP 值为管理服务器的 IP 地址,因为数据实际上是由管理服务器上传的。 对于 SCAgentChannel 设置为 Direct 的检测信号,该值为代理的公共 IP 地址。

示例日志搜索

下表提供了解决方案收集的记录的示例日志搜索。

查询 说明
Heartbeat | distinct Computer 代理总数
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(24h) 过去 24 小时内无响应代理的计数
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(15m) 过去 15 分钟内无响应代理的计数
Heartbeat | where TimeGenerated > ago(24h) and Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer 过去 24 小时内处于联机状态的计算机数
Heartbeat | where TimeGenerated > ago(24h) and Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer 在过去 24 小时内的最近 30 分钟处于脱机状态的代理总数
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType 在某个时段内按 OS 类型显示的代理数趋势
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType 按 OS 类型列出的分布情况
Heartbeat | summarize AggregatedValue = dcount(Computer) by Version 按代理版本列出的分布情况
Heartbeat | summarize AggregatedValue = count() by Category 按代理类别列出的分布情况
Heartbeat | summarize AggregatedValue = dcount(Computer) by ManagementGroupName 按管理组列出的分布情况
Heartbeat | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry 代理的地理位置
Heartbeat | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer 已安装的 Log Analytics 网关数

后续步骤

了解如何从 Azure Monitor 中的日志查询生成警报