你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

监视云环境

你需要云环境的可观测性,以帮助确保工作负荷顺利运行,无论是业务所有者、平台所有者还是应用程序所有者。 需要了解以下条件:

  • 你的应用程序可用,并且它们是否符合客户的期望。
  • 存在任何需要调查的安全威胁。
  • 消耗成本在预期范围内。

监视 是收集、分析和处理遥测的过程,用于指示平台、资源和应用程序的运行状况。 有效的监视环境包括整个云资产,其中可能包括跨多个云和本地环境的资源。

可观测性 是一个系统的属性,用于测量其内部状态如何从其外部输出推断。 需要部署服务和进程来监视云环境。 你需要能够观察和了解在云中运行的服务的行为。

监视的好处

投资监视环境,在云的多个方面获得以下优势:

  • 可用性和性能: 监视资源,以帮助确保云服务和应用程序可用并按预期执行。 若要在影响用户之前识别和响应问题,请跟踪关键指标并配置警报规则。

  • 成本优化: 使用监视来跟踪资源使用情况,并根据需求缩放资源。 此方法有助于防止过度预配和未充分利用的资源,从而优化成本。 监视还可以识别并提醒你任何成本溢出或使用量意外高峰。

  • 合规性: 使用监视来维护活动的日志和记录,这有助于确保云服务遵守策略和法规。 使用此数据的报表可以帮助进行定期审核和合规性检查。

  • 安全性: 实施持续监视以帮助检测安全威胁和漏洞,以便可以立即采取行动来保护数据和资源。 还可以分析收集的数据以进行威胁检测和响应。

监视平台

有效的监视策略包括计算环境中的所有平台。 除了 Azure,可能还有本地、多云和边缘资源。 每个资源都需要相同的监视级别。 按照 Azure 指南云采用框架操作,并在统一操作策略中包含监视。 在此策略中,主云托管监视工具和其他管理工具。 监视工具监视所有平台中的所有资源。

显示统一操作策略的概念图。

监视类型

监视是一个多方面的规则,需要工具、流程和做法的组合。 下表分解了各种类型的监视。 不同的服务和功能可能会提供这些监视类型的不同组合。 但是,全面的监视环境包括计算环境中每个平台的所有这些监视类型。

类型 描述
基础结构 基础结构监视包括云资源的性能和可用性,例如虚拟机、存储资源和网络。 这种类型的监视有助于确保底层基础结构以最佳方式运行,这有助于维护依赖基础结构的应用程序的可用性和性能。
应用程序性能监视 (APM) APM 监视在云中运行的应用程序的性能和可用性。 它跟踪指标,例如响应时间、错误率和事务日志。 APM 可识别性能瓶颈,并帮助确保应用程序满足用户期望。
数据库 数据库监视跟踪云数据库的性能、可用性和资源消耗。 关键指标包括查询性能、索引使用情况和锁定状态。
网络 网络监视跟踪云环境中网络组件的性能和可用性。 指标包括带宽使用情况、延迟和数据包丢失。
安全性 安全监视跟踪和分析云环境中的安全事件和漏洞,包括未经授权的访问、恶意软件和合规性冲突。 有效的安全监视有助于保护敏感数据,确保符合法规要求,并防止成本高昂的安全漏洞。
合规性 合规性监视有助于确保云环境遵守法规和行业标准。 它跟踪配置、访问控制和数据处理做法,以帮助确保符合相关法规。
成本 成本监视跟踪云支出和资源使用情况,以确定节省成本的机会并防止预算溢出。 它监视资源使用情况、识别未充分利用的资源,并优化资源配置,以帮助降低成本。

共担责任

在本地环境中,你负责监视的所有方面,因为你拥有和管理所有计算资源。 在云中,你将此责任与云提供商共享。 根据所选的部署模型类型,监视云堆栈的各个层的责任可能会从你转移到云提供商。

在基础结构即服务(IaaS)部署中,云提供商监视基础云平台,例如物理基础结构和虚拟化层。 监视部署到云平台的虚拟机上运行的操作系统、应用程序和数据。 当部署模型上移堆栈时,云提供商将承担更多责任来监视环境。 这种责任最终导致软件即服务(SaaS)部署,因为你将监视责任转移到整个堆栈的云提供商,包括应用程序和数据。

显示云中监视的共同责任的关系图。

可以使用云提供商的监视工具监视堆栈的层,但你负责配置这些工具和分析它们收集的数据。 你需要向组织的各个成员授予访问权限,并创建仪表板和警报,帮助他们区分关键信息。 你可能还需要将这些组件与组织使用的其他工具和票证系统集成。

云提供商必须为提供给内部客户的堆栈层执行相同类型的服务。 他们必须持续监视他们与你签订的平台的运行状况和性能。 它们为你提供仪表板和警报,以主动通知你任何服务问题。 与内部客户一样,你不需要了解云提供商如何监视其平台的复杂性,只有它们符合你与他们签订的服务级别协议。

角色和职责

大多数企业组织都有一个集中运营团队,用于监视云环境的整体运行状况和性能。

此团队通常:

  • 设置整个公司的策略。
  • 执行监视环境的集中配置。
  • 向组织中的利益干系人委派权限,这些利益干系人需要访问与其应用程序和服务相关的监视数据。

组织具有多个角色来维护监视环境,并且需要访问监视数据来执行其作业功能。 每个角色都有不同的要求,可根据其特定职责监视数据。 根据组织的规模,你可能有多个个人来填补每个角色,或者你可能有一个填充多个角色的个人。

各个组织可能会以不同的方式分配职责。 下表显示了典型组织的角色和职责示例。

角色 描述
云架构师 云架构师设计和监督云基础结构,以帮助确保它满足组织的业务目标。 云架构师侧重于云体系结构的可靠性、安全性和可伸缩性。 他们需要高级遥测来全面了解数字资产。 此遥测包括资源使用情况指标、APM 指标、成本和计费见解以及合规性报告。
平台工程师 平台工程师构建和管理开发人员用于部署其应用程序的平台。 平台工程师可以创建持续集成和持续交付(CI/CD)管道,管理云基础结构即代码(IaC),并确保平台的可伸缩性和可靠性。 平台工程师需要有关平台操作状态的遥测数据。 此遥测包括容器性能指标、业务流程日志、IaC 验证和服务可用性。
系统管理员 系统管理员管理和维护云中的服务器、操作系统和其他基础结构组件。 它们执行备份、排查问题并确保系统处于最新状态。 系统管理员需要服务器和 OS 级别的遥测数据,包括 CPU、内存和磁盘使用情况、网络性能和系统日志。
安全工程师 安全工程师实施和管理安全措施,以帮助保护数据和应用程序免受威胁。 安全工程师处理从标识管理到威胁检测和响应的所有内容。 他们使用有关安全事件的遥测数据,包括访问日志、威胁检测警报、漏洞评估和合规性指标。
网络管理员 网络管理员管理和维护云网络,以帮助确保数据在服务器、应用程序和用户之间安全高效地流动。 网络管理员处理网络配置、监视性能并实施安全措施。 它们需要以网络为中心的遥测数据,包括网络流量分析、延迟度量、数据包丢失和防火墙日志。
数据库管理员(DBA) DBA 管理和维护数据库,以帮助确保数据完整性、性能和可用性。 DBA 处理数据库备份和恢复,并优化查询以提高效率。 它们使用有关数据库性能和完整性的遥测数据,包括查询性能指标、数据库响应时间、事务日志和备份或恢复状态。
开发人员 开发人员设计、编写、测试和维护在云平台上运行的软件。 开发人员创建功能和修复 bug,以帮助确保应用程序保持安全且性能良好。 它们需要特定于应用程序的遥测数据,包括错误率、延迟、响应时间、用户行为分析和功能使用情况指标。

Azure 便利化

Azure 有许多服务支持云环境中所需的不同类型的 监视 。 每个服务面向一个或多个 角色。 合并服务以提供全面监视环境所需的功能。

服务 描述 类型 角色
Azure Monitor Azure Monitor 位于 Azure 监视生态系统的中心。 它是一种全面的监视解决方案,可用于从云和本地环境收集、分析和响应监视数据。 Azure Monitor 提供对基础结构、网络和应用程序的完整监视。 它还提供数据平台和核心功能,例如数据分析、可视化和其他服务的警报。 基础设施
数据库
compliance
云架构师,
平台工程师,
系統管理員
DBA
Application Insights Application Insights 是 Azure Monitor 的一项功能,它为云应用程序提供 APM 监视。 APM 开发人员
Azure 网络观察程序 网络观察程序为 Azure 中的网络资源提供监视和可视化功能。 使用此服务监视、诊断和查看指标。 还可以启用或禁用 Azure 虚拟网络中资源的日志。 网络 网络管理员
Microsoft Sentinel Microsoft Sentinel 是云原生安全信息事件管理(SIEM)和安全业务流程自动响应(SOAR)解决方案。 它从 Azure 资源和其他组件引入安全遥测数据,以提供网络威胁检测、调查、响应和主动搜寻。 安全性 安全工程师
Microsoft Defender XDR Defender XDR 包括Microsoft安全解决方案,这些解决方案原生于 Azure 平台、客户端和服务器Microsoft操作系统,以及 Microsoft 365 中的 Office 365、Exchange Online 和 SharePoint 等应用程序。 每个安全解决方案都使用 AI 和机器学习来关联遥测数据,并确定是否需要调查。 当他们检测到不可接受的行为时,会采取措施防止中断。 安全性 安全工程师
Microsoft 成本管理 成本管理是一套工具,可用于分析、监视和优化Microsoft云成本。 成本管理可供有权访问计费帐户、订阅、资源组或管理组的任何人使用。 成本 云架构师
Azure 服务运行状况 服务运行状况提供 Azure 资源所依赖的服务的运行状况。 它可以通知你任何服务中断,并提供 Azure 服务和区域的运行状况的个性化视图。 基础结构 云提供商

监视 Azure 服务的参考

该表按字母顺序列出 Azure 服务,并包含指向其几乎每个服务的监视指南的链接。

Azure 服务 监视指南 部署监控
(选择服务)
Azure AI 代理服务 管理中心概述 如何在 Azure AI 代理 中启用跟踪
Azure AI Foundry 管理中心概述 监视生成式 AI 应用程序

生成式 AI 的评估和监视指标

使用风险和安全监视

监视提示流部署

联机运行评估

在 Azure AI Foundry 门户中查看评估结果

可视化跟踪
Azure AI 搜索 监视 Azure AI 搜索 监视查询

在 Azure AI 搜索中分析性能

收集遥测数据用于搜索流量分析

通过 Power BI 直观显示 Azure AI 搜索日志和指标
Azure AI 服务 启用诊断日志记录 Azure AI 服务
Azure AI 视频索引器 监视 Azure AI 视频索引器

监视 Azure AI 视频索引器数据参考
Azure Analysis Services 监视 Azure Analysis Services

Azure Analysis Services 的监视数据参考
Azure API for FHIR 在 Azure API for FHIR 中启用诊断日志记录
Azure API 管理 监视 Azure API 管理

Azure API 管理的监视数据参考
Azure API 管理中的可观测性

在 Azure API 管理中监视已发布的 API

将 Azure API 管理与 Application Insights 集成

监视 API
Azure 应用程序配置 监视 Azure 应用程序配置

监视 Azure 应用程序配置数据参考
Azure 应用服务 监视 Azure 应用服务

Azure 应用服务监视数据参考
启用应用程序监控

使用运行状况检查监视应用服务实例

Azure 应用服务诊断概述
Azure 应用程序网关 监视 Azure 应用程序网关

Azure 应用程序网关的监视数据参考
应用程序网关运行状况探测概述

后端运行状况

应用程序网关的 Azure Monitor 指标
Azure Arc 资源网桥 Azure Arc 资源网桥维护操作
Azure Arc 站点管理器 如何为站点 配置 Azure Monitor 警报
已启用 Azure Arc 的数据服务 适用于 Azure Arc 的 Azure Data Studio 仪表板
已启用 Azure Arc 的 Kubernetes 启用对 Azure Kubernetes 服务 (AKS) 群集的监视
已启用 Azure Arc 的服务器 使用 Azure Monitor VM 见解监视混合计算机
Azure 存档存储 监视 Azure Blob 存储

Azure Blob 存储的监视数据参考
Azure 自动化 将 Azure 自动化作业数据转发到 Azure Monitor 日志
Azure 备份 Azure 备份的监视和报告解决方案
Azure Batch 监视 Azure Batch

Azure Batch 的监视数据参考
Azure Blob 存储 监视 Azure Blob 存储

Azure Blob 存储的监视数据参考
有关监视 Azure Blob 存储的最佳做法

使用 Azure Monitor 存储见解监视存储服务
Azure Cache for Redis 监视 Azure Cache for Redis

Azure Cache for Redis 的监视数据参考
适用于 Azure Cache for Redis 的 Azure Monitor 见解
Azure Chaos Studio 为 Chaos Studio 试验设置 Azure 监视器
Azure 通信服务 监视短信
监视语音和视频
监视聊天
监视电话呼叫
监视电子邮件
Azure 机密账本 验证 Azure 机密账本写入事务收据
Azure 容器应用 监视 Azure 容器应用

监视 Azure 容器应用指标
Azure 容器应用中的应用程序日志记录

Azure 容器应用中的运行状况探测
Azure 容器实例 监视 Azure 容器实例

容器实例的监视数据参考
配置运行情况探测
Azure 容器注册表 监视 Azure 容器注册表

Azure 容器注册表的监视数据参考
Azure 容器存储 启用对 Azure 容器存储 的监视
Azure Cosmos DB (微软云数据库服务) 监视 Azure Cosmos DB

Azure Cosmos DB 的监视数据参考
Azure Cosmos DB 见解

使用 Azure Cosmos DB 中的见解进行监视和调试

监视 Azure Cosmos DB 中某一操作的吞吐量或请求单位使用情况

查询执行指标

索引指标

探索基于 vCore 的 Azure Cosmos DB for MongoDB (vCore) 中的 Azure Monitor
Azure CycleCloud 监视 Azure CycleCloud
Azure Data Box 跟踪并记录导入订单的 Azure Data Box、Azure Data Box Heavy 事件
Azure 数据资源管理器 监视 Azure 数据资源管理器

Azure 数据资源管理器的监视数据参考
Azure Data Lake Storage 监视 Azure Blob 存储

Azure Blob 存储的监视数据参考
Azure MySQL 数据库 监视 - Azure Database for MySQL 监视的最佳做法
用于 PostgreSQL 的 Azure 数据库 监视和指标 - Azure Database for PostgreSQL 智能优化使用查询存储来监视性能
Azure Databricks 为 Azure Databricks 配置诊断日志传递
Azure DDoS 防护 监视 Azure DDoS 防护

监视 Azure DDoS 防护监视数据参考
Azure 专用主机 监视 Azure 虚拟机

Azure 虚拟机的监视数据参考
Azure 专用 HSM 监视选项 - Azure 专用 HSM
Azure 开发测试实验室 活动日志 - Azure 开发测试实验室
Azure 数字孪生 在 Azure 数字孪生中监视实例
Azure 磁盘存储 监视 Azure 虚拟机

Azure 虚拟机的监视数据参考
Azure DNS 指标和警报
Azure 弹性 SAN Azure 弹性 SAN 的指标
Azure 事件网格 为事件网格资源启用诊断日志

监视数据参考(推送传递)
Azure 事件中心 监视 Azure 事件中心

Azure 事件中心的监视数据参考
Azure ExpressRoute 监视 Azure ExpressRoute

Azure ExpressRoute 的监视数据参考
Azure 文件存储 使用 Azure Monitor 监视 Azure 文件存储

Azure 文件存储的监视数据参考
Azure 防火墙 监视 Azure 防火墙

Azure 防火墙的监视数据参考
Azure Front Door(微软云前门服务) 监视 Azure Front Door

Azure Front Door 的监视数据参考
Azure Front Door 报告

运行状况探测
Azure 函数 监视 Azure Functions

Azure Functions 的监视数据参考
使用 Azure Monitor Application Insights 监视 Azure Functions

监视 Azure Functions 中的执行情况
Azure FXT Edge Filer (边缘文件管理器) 监视 Azure FXT Edge Filer
Azure HDInsight 监视 Azure HDInsight

Azure HDInsight 的监视数据参考
Azure Health Data Services Azure Health Data Services 的日志记录
Azure HPC 缓存 Azure HPC 缓存度量和监控
Azure IoT 管理 IoT 解决方案
Azure IoT Central 管理和监视 IoT Central
Azure IoT Edge 教程 - 适用于 IoT Edge 的 Azure Monitor 工作簿
Azure IoT 中心 监视 Azure IoT 中心

Azure IoT 中心的监视数据参考
Azure IoT 操作 部署可观测性资源
Azure Key Vault 监视 Azure Key Vault

Azure Key Vault 的监控数据参考
使用 Key Vault 见解监视密钥保管库服务

配置 Azure Key Vault 警报

Azure Key Vault 监视数据参考

Azure Key Vault 日志记录

启用 Key Vault 日志记录

通过 Azure 事件网格监视 Key Vault
Azure Kubernetes 服务 (AKS) 监视 Azure Kubernetes 服务 (AKS)

Azure Kubernetes 服务的监视数据参考
Kubernetes 的零检测应用程序监视

全栈监控

使用 Azure Monitor 监视 Kubernetes 的最佳做法
Azure 实验室服务 跟踪 Azure 实验室服务中实验室的使用情况
Azure Lighthouse (Azure 灯塔) 大规模监视委托资源
Azure 负载均衡器 监视 Azure 负载均衡器

Azure 负载均衡器的监视数据参考
Azure 负载测试 监视 Azure 负载测试

监视 Azure 负载测试数据参考
Azure Local Azure 本地监控概述
Azure 逻辑应用 监视 Azure 逻辑应用

Azure 逻辑应用的监视数据参考
Azure 机器学习 监视 Azure 机器学习

Azure 机器学习监视数据引入
Azure 机器学习模型监控

监视部署到生产环境的模型的性能

监视联机终结点
Microsoft 托管 Grafana 使用日志监视 Azure 托管 Grafana 实例
Azure Managed Instance for Apache Cassandra 监视 Azure Managed Instance for Apache Cassandra
Azure Managed Lustre 监视 Azure Managed Lustre

Azure Managed Lustre 的监视数据参考
Azure NAT 网关 监视 Azure NAT 网关

Azure NAT 网关的监视数据参考
Azure NetApp 文件 监视 Azure NetApp 文件 的方法

Azure NetApp 文件的指标
Azure 通知中心 监视 Azure 通知中心

Azure 通知中心的监视数据参考
Azure OpenAI 服务 监视 Azure OpenAI 服务 使用风险和安全监视
Azure 运营商关系 Azure 运营商关系:使用 Azure Monitor 实现可观测性
Azure 专用 5G 核心 使用 Azure Monitor 平台指标监视 Azure 专用 5G 核心

在 Azure 门户中使用关联指标进行监视
Azure 专用链接 监视 Azure 专用链接

Azure 专用链接的监视数据参考
Azure Power BI Embedded 监视 Power BI Embedded

Power BI Embedded 的监视数据参考
Azure 队列存储 监视 Azure 队列存储

Azure 队列存储的数据监视参考
Azure Red Hat OpenShift 监视 Azure Red Hat OpenShift
Azure 服务总线 监视 Azure 服务总线

Azure 服务总线的监视数据参考
Azure Monitor - 服务总线见解
Azure Service Fabric 监视 Azure Service Fabric

Azure Service Fabric 的监视数据参考
Azure SignalR 服务 监视 Azure SignalR 服务

Azure SignalR 服务的监视数据参考
Azure Site Recovery(Azure 站点恢复) 监视 Azure Site Recovery

Azure Site Recovery 的监视数据参考
Azure Sphere 监视 Azure Sphere 资源概述

监视 Azure Sphere 数据参考
Azure 现成虚拟机 监视 Azure 虚拟机

Azure 虚拟机的监视数据参考
Azure SQL 数据库 监视 Azure SQL 数据库

Azure SQL 数据库的监视数据参考
使用数据库观察程序监视 Azure SQL 工作负载

在 Azure SQL 数据库中优化应用程序和数据库以提高性能
Azure SQL Edge 排查和解决 Azure SQL Edge 部署问题
Azure SQL 托管实例 监视 Azure SQL 托管实例 优化应用程序和数据库,提高 Azure SQL 托管实例的性能
Azure Stack Edge 在 Azure Stack Edge Pro GPU 设备上启用 Azure Monitor
Azure Stack Hub 在 Azure Stack Hub 中监视运行状况和警报
Azure Static Web Apps 监视 Azure Static Web Apps

Azure Static Web Apps 中托管 Functions 支持的指标
Azure Synapse Analytics 监视 Azure Synapse Analytics

Azure Synapse Analytics 的监视数据参考
Azure 表格存储 监视 Azure 表存储

Azure 表存储的监视数据参考
Azure 更新管理器 在 Azure 更新管理器 中创建警报
Azure 虚拟机规模集 监视 Azure 虚拟机 适用于 Azure VM 和虚拟机规模集的 Application Insights
Azure 虚拟网络 监视 Azure 虚拟网络

Azure 虚拟网络的监视数据参考
Azure 虚拟 WAN 监视 Azure 虚拟 WAN

Azure 虚拟 WAN 的监视数据参考
Azure VMware 解决方案 使用 Azure 本机服务监视和保护 VM
Azure 虚拟桌面 监视 Azure 虚拟桌面
Azure 虚拟机 监视 Azure 虚拟机

Azure 虚拟机的监视数据参考
适用于 Azure VM 和虚拟机规模集的 Application Insights

VM 监视

可用性监控
Azure VPN 网关 监视 Azure VPN 网关

Azure VPN 网关的监控数据参考
Azure Web 应用程序防火墙 Web 应用程序防火墙 + Azure Front Door

Web 应用程序防火墙 + 应用程序网关

Azure Web 应用程序防火墙的资源日志
Azure Web PubSub 监视 Azure Web PubSub

监视 Azure Web PubSub 数据参考
Microsoft Fabric 中的数据工厂 监视数据工厂
Microsoft Dev Box 监视 Microsoft Dev Box 数据参考
Microsoft Entra 域服务 检查 Microsoft Entra 域服务 的运行状况
Microsoft Entra 外部 ID 外部租户中的 Azure Monitor
Microsoft Entra ID 什么是 Microsoft Entra 监视和运行状况?
Microsoft Sentinel Microsoft Sentinel 中的审核和运行状况监视
Microsoft Dev Box 监视 Microsoft Dev Box 数据参考
Microsoft Entra 域服务 检查 Microsoft Entra 域服务 的运行状况
Microsoft Entra 外部 ID 外部租户中的 Azure Monitor
Microsoft Entra ID 什么是 Microsoft Entra 监视和运行状况?
Microsoft Dev Box 监视 Microsoft Dev Box 数据参考
Azure Arc 启用的多云连接器 使用 Azure Arc 启用的多云连接器查看多云清单