你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Microsoft.CognitiveServices/accounts 支持的指标

下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。

表标题

指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度
时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。

要了解如何导出指标的信息,请参阅在 Azure Monitor 中创建诊断设置

有关指标保留的信息,请参阅 Azure Monitor 指标概述

有关支持的日志列表,请参阅 支持的日志类别 - Microsoft.CognitiveServices/accounts

类别 指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
功能发生 操作功能出现次数

每个操作特征的出现次数。
ActionFeatureIdOccurrences 计数 总计(总和) FeatureIdMode、、 RunId PT1M
每个事件的功能 每个事件的操作功能

每个事件的平均操作特征数量。
ActionFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
操作 操作发生

每个操作的出现次数。
ActionIdOccurrences 计数 总计(总和) ActionIdMode、、 RunId PT1M
每个事件的命名空间 每个事件的操作命名空间

每个事件的平均操作命名空间数量。
ActionNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
操作 每个事件的操作数

每个事件的操作数量。
ActionsPerEvent 计数 平均值 Mode, RunId PT1M
Azure OpenAI - 使用情况 活动令牌

令牌总数减去一段时间内缓存的令牌。 适用于 PTU 和 PTU 托管的部署。 使用此指标可了解 PTU 的基于 TPS 或 TPM 的利用率,并将其与方案的目标 TPS 或 TPM 基准进行比较。 若要细分 API 请求,可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。
ActiveTokens 计数 最小值、最大值、平均值、总计(总和) Region、、ModelDeploymentNameModelName、、ModelVersion PT1M
SpeechServices - 用法 音频秒转录

转录的秒数
AudioSecondsTranscribed 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
SpeechServices - 用法 翻译的音频秒数

转换的秒数
AudioSecondsTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
SpeechServices - 用法 虚拟形象模型托管秒数

秒数。
AvatarModelHostingSeconds 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
Azure OpenAI - HTTP 请求 提示令牌缓存匹配率

提示令牌的百分比命中缓存,适用于 PTU 管理的令牌。
AzureOpenAIContextTokensCacheMatchRate 百分比 最小值、最大值、平均值 Region、、ModelDeploymentNameModelName、、ModelVersion PT1M
Azure OpenAI - 使用情况 预配管理的利用率

受代理管理的部署的利用率百分比,计算为(已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,将限制调用并返回错误代码 429。 若要细分此指标,可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求)
AzureOpenAIProvisionedManagedUtilization 百分比 最小值、最大值、平均值 Region、、StreamTypeModelDeploymentNameModelNameModelVersion PT1M
Azure OpenAI - 使用情况 预配管理的利用率 V2

受代理管理的部署的利用率百分比,计算为(已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,将限制调用并返回错误代码 429。 若要细分此指标,可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求)
AzureOpenAIProvisionedManagedUtilizationV2 百分比 最小值、最大值、平均值 Region、、StreamTypeModelDeploymentNameModelNameModelVersion PT1M
Azure OpenAI - HTTP 请求 Azure OpenAI 请求

在一段时间内对 Azure OpenAI API 进行的调用数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分 API 请求,可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName、ModelVersion、StatusCode(成功、客户端程序、服务器错误)、StreamType(流式处理请求和非流式处理请求)和操作。
AzureOpenAIRequests 计数 总计(总和) ApiName、、OperationNameRegionStreamTypeModelDeploymentNameModelName、、 ModelVersionStatusCode PT1M
Azure OpenAI - HTTP 请求 响应时间

对于流式处理请求,建议使用延迟(响应能力)度量值。 适用于 PTU 和 PTU 托管的部署。 按用户发送提示后出现第一个响应所需的时间计算,由 API 网关测量。 随着提示大小增加和/或缓存命中大小减小,此数字将增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。

注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和总体工作负载模式。 此外,它不考虑客户端和 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。
AzureOpenAITimeToResponse 毫秒 最小值、最大值、平均值 ApiName、、OperationNameRegionStreamTypeModelDeploymentNameModelName、、 ModelVersionStatusCode PT1M
基线估算器总体奖励

基线估算器总奖励。
BaselineEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
基线估算器槽奖励

按槽列出的基线估算器奖励。
BaselineEstimatorSlotReward 计数 平均值 SlotId、、SlotIndexMode、、RunId PT1M
基线随机估算器总体奖励

基线随机估算器总奖励。
BaselineRandomEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
基线随机估算器槽奖励

按槽列出的基线随机估算器奖励。
BaselineRandomEstimatorSlotReward 计数 平均值 SlotId、、SlotIndexMode、、RunId PT1M
估计 基线随机事件计数

基线随机事件计数的估算值。
BaselineRandomEventCount 计数 总计(总和) Mode, RunId PT1M
估计 基线随机奖励

基线随机奖励的估算值。
BaselineRandomReward 计数 总计(总和) Mode, RunId PT1M
认知服务 - HTTP 请求 被阻止的调用

超过速率或配额限制的调用数。 请勿用于 Azure OpenAI 服务。
BlockedCalls 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
使用情况 推理计数

Carnegie Frontdoor 服务的推理计数
CarnegieInferenceCount 计数 总计(总和) Region、、ModalityCategoryLanguageSeverityLevelUseCustomList PT1M
使用情况 训练的字符(已弃用)

训练的字符总数。
CharactersTrained 计数 总计(总和) ApiNameOperationName、、 Region PT1M
使用情况 已翻译字符(已弃用)

传入的文本请求中的字符总数。
CharactersTranslated 计数 总计(总和) ApiNameOperationName、、 Region PT1M
认知服务 - HTTP 请求 客户端错误

引发客户端错误(HTTP 响应代码 4xx)的调用数。 请勿用于 Azure OpenAI 服务。
ClientErrors 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
使用情况 计算机视觉事务

计算机视觉事务数
ComputerVisionTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
ContentSafety - 用法 图像审查的调用计数

用于图像审查的调用数。
ContentSafetyImageAnalyzeRequestCount 计数 总计(总和) ApiVersion PT1M
ContentSafety - 用法 文本审查的呼叫计数

用于文本审查的调用数。
ContentSafetyTextAnalyzeRequestCount 计数 总计(总和) ApiVersion PT1M
功能发生 上下文功能出现次数

每个上下文特征的出现次数。
ContextFeatureIdOccurrences 计数 总计(总和) FeatureIdMode、、 RunId PT1M
每个事件的功能 每个事件的上下文功能

每个事件的上下文特征数量。
ContextFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
每个事件的命名空间 每个事件的上下文命名空间

每个事件的上下文命名空间数量。
ContextNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
使用情况 自定义视觉训练时间

自定义视觉训练时间
CustomVisionTrainingTime 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 自定义视觉事务

自定义视觉预测事务数
CustomVisionTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
认知服务 - HTTP 请求 数据输入

传入数据的大小(字节)。 请勿用于 Azure OpenAI 服务。
DataIn 字节 总计(总和) ApiNameOperationName、、 Region PT1M
认知服务 - HTTP 请求 数据输出

传出数据的大小(字节)。 请勿用于 Azure OpenAI 服务。
DataOut 字节 总计(总和) ApiNameOperationName、、 Region PT1M
使用情况 已翻译的文档字符

文档翻译请求中的字符数。
DocumentCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 已翻译的文档自定义字符

自定义文档翻译请求中的字符数。
DocumentCustomCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 已训练的人脸图像

训练的图像数。 每个事务训练 1,000 个图像。
FaceImagesTrained 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 存储的人脸

存储的人脸数,每日按比例计算。 每日报告存储的人脸数。
FacesStored 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 人脸事务

对人脸服务进行 API 调用的数量
FaceTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
FeatureCardinality 按操作特征基数

基于操作的特征基数。
FeatureCardinality_Action 计数 平均值 FeatureIdMode、、 RunId PT1M
FeatureCardinality 按上下文进行特征基数

基于上下文的特征基数。
FeatureCardinality_Context 计数 平均值 FeatureIdMode、、 RunId PT1M
FeatureCardinality 功能基数(按槽)

基于槽的特征基数。
FeatureCardinality_Slot 计数 平均值 FeatureIdMode、、 RunId PT1M
Azure OpenAI - 使用情况 处理了 FineTuned 训练小时数

在 OpenAI FineTuned 模型中处理的训练小时数
FineTunedTrainingHours 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegion PT1M
Azure OpenAI - 使用情况 生成的完成令牌

从 OpenAI 模型生成的令牌数(输出)。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
GeneratedTokens 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M
使用情况 存储的图像

存储的自定义视觉图像数。
ImagesStored 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
认知服务 - HTTP 请求 延迟

延迟(毫秒)。 请勿用于 Azure OpenAI 服务。
Latency 毫秒 平均值 ApiName、、OperationNameRegion、、RatelimitKey PT1M
使用情况 已学习的事件

已了解的事件数。
LearnedEvents 计数 总计(总和) IsMatchBaselineMode、、 RunId PT1M
使用情况 LUIS 语音请求

LUIS 语音转意向理解请求数
LUISSpeechRequests 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 LUIS 文本请求

LUIS 文本请求数
LUISTextRequests 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 匹配的奖励

匹配的奖励数。
MatchedRewards 计数 总计(总和) Mode, RunId PT1M
使用情况 未激活的事件

跳过的事件数量。
NonActivatedEvents 计数 总计(总和) Mode, RunId PT1M


每个事件的槽数。
NumberOfSlots 计数 平均值 Mode, RunId PT1M
SpeechServices - 用法 演讲者配置文件数

注册的说话人配置文件数。 每小时按比例计算。
NumberofSpeakerProfiles 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 观察到的奖励

观察到的奖励数。
ObservedRewards 计数 总计(总和) Mode, RunId PT1M
使用情况 已翻译的文档同步字符

文档翻译(同步)请求中的字符数。
OneDocumentCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
联机估算器总体奖励

联机估算器总奖励。
OnlineEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
联机估算器槽奖励

按槽列出的联机估算器奖励。
OnlineEstimatorSlotReward 计数 平均值 SlotId、、SlotIndexMode、、RunId PT1M
估计 联机事件计数

联机事件计数的估算值。
OnlineEventCount 计数 总计(总和) Mode, RunId PT1M
估计 Online Reward

联机奖励的估算值。
OnlineReward 计数 总计(总和) Mode, RunId PT1M
使用情况 处理的字符

沉浸式阅读器处理的字符数。
ProcessedCharacters 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 处理的运行状况文本记录

处理的运行状况文本记录数
ProcessedHealthTextRecords 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 处理的图像

处理的图像数
ProcessedImages 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 已处理的页面

处理的页面数
ProcessedPages 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
Azure OpenAI - 使用情况 处理的提示令牌

OpenAI 模型上处理的提示令牌数(输入)。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
ProcessedPromptTokens 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M
使用情况 处理的文本记录

文本记录的计数。
ProcessedTextRecords 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 QA 文本记录

处理的文本记录数
QuestionAnsweringTextRecords 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
ContentSafety - 风险&安全 潜在的滥用用户计数

在一段时间内检测到的潜在虐待用户数。 可以通过以下维度添加筛选器或应用拆分:ModelDeploymentName。
RAIAbusiveUsersCount 计数 总计(总和) Region, ModelDeploymentName PT1M
ContentSafety - 风险&安全 检测到有害卷

对 Azure OpenAI API 进行的调用数,并通过一段时间内应用的内容筛选器检测为有害(块模型和批注模式)。 可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName 和 TextType。
RAIHarmfulRequests 计数 总计(总和) Region、、ModelDeploymentNameModelNameModelVersionApiNameTextType、、 CategorySeverity PT1M
ContentSafety - 风险&安全 阻止的卷

对 Azure OpenAI API 进行的调用数,并被一段时间内应用的内容筛选器拒绝。 可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName 和 TextType。
RAIRejectedRequests 计数 总计(总和) Region、、ModelDeploymentNameModelNameModelVersionApiName、、 TextTypeCategory PT1M
ContentSafety - 风险&安全 安全系统事件

用于风险和安全监视的系统事件。 可以按以下维度添加筛选器或应用拆分:EventType。
RAISystemEvent 计数 平均值 Region, EventType PT1M
ContentSafety - 风险&安全 为安全检查发送的总卷

对 Azure OpenAI API 进行的调用数,并由一段时间内应用的内容筛选器检测到。 可以按以下维度添加筛选器或应用拆分:ModelDeploymentName、ModelName。
RAITotalRequests 计数 总计(总和) Region、、ModelDeploymentNameModelNameModelVersionApiName PT1M
认知服务 - HTTP 请求 Ratelimit

ratelimit 键的当前速率限制。 请勿用于 Azure OpenAI 服务。
Ratelimit 计数 总计(总和) Region, RatelimitKey PT1M
奖励 每个事件的平均奖励数

每个事件的平均奖励。
Reward 计数 平均值 BaselineAction、、ChosenActionIdMatchesBaselineNonDefaultRewardModeRunId PT1M
认知服务 - HTTP 请求 服务器错误数

引发服务内部错误(HTTP 响应代码 5xx)的调用数。 请勿用于 Azure OpenAI 服务。
ServerErrors 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
功能发生 槽功能出现次数

每个槽特征的出现次数。
SlotFeatureIdOccurrences 计数 总计(总和) FeatureIdMode、、 RunId PT1M
每个事件的功能 每个事件的槽功能

每个事件的平均槽特征数量。
SlotFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
槽出现次数

每个槽的出现次数。
SlotIdOccurrences 计数 总计(总和) SlotId、、SlotIndexMode、、RunId PT1M
每个事件的命名空间 每个事件的槽命名空间

每个事件的平均槽命名空间数量。
SlotNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
奖励 Slot Reward

每个槽的奖励。
SlotReward 计数 平均值 BaselineActionId、、ChosenActionIdMatchesBaselineNonDefaultRewardSlotIdSlotIndex、、 ModeRunId PT1M
SpeechServices - 用法 说话人识别事务

说话人辨识事务数
SpeakerRecognitionTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
SpeechServices - 用法 语音模型托管小时数

语音模型托管时间数
SpeechModelHostingHours 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 语音会话持续时间(已弃用)

语音会话的总持续时间(以秒计)。
SpeechSessionDuration 总计(总和) ApiNameOperationName、、 Region PT1M
认知服务 - HTTP 请求 成功调用

成功调用数。 请勿用于 Azure OpenAI 服务。
SuccessfulCalls 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
认知服务 - SLI AvailabilityRate

使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 请勿用于 Azure OpenAI 服务。
SuccessRate 百分比 最小值、最大值、平均值 ApiName、、OperationNameRegion、、RatelimitKey PT1M
SpeechServices - 用法 合成字符数

字符数。
SynthesizedCharacters 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 翻译的文本字符

传入的文本翻译请求中的字符数。
TextCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 翻译的文本自定义字符

传入的自定义文本翻译请求中的字符数。
TextCustomCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
使用情况 文本训练字符

使用文本翻译训练的字符数。
TextTrainedCharacters 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
Azure OpenAI - 使用情况 处理的推理令牌

在 OpenAI 模型上处理的推理令牌数。 计算为提示令牌(输入)加上生成的令牌(输出)。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
TokenTransaction 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M
认知服务 - HTTP 请求 总呼叫数

调用总数。 请勿用于 Azure OpenAI 服务。
TotalCalls 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
认知服务 - HTTP 请求 错误总数

引发错误响应(HTTP 响应代码 4xx 或 5xx)的调用总数。 请勿用于 Azure OpenAI 服务。
TotalErrors 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
使用情况 Total Events

事件数量。
TotalEvents 计数 总计(总和) Mode, RunId PT1M
认知服务 - HTTP 请求 令牌调用总数

令牌调用的总数。
TotalTokenCalls 计数 总计(总和) ApiNameOperationName、、 Region PT1M
使用情况 事务总数(已弃用)

事务总数。
TotalTransactions 计数 总计(总和) <无> PT1M
估计 用户基线事件计数

用户定义的基线事件计数的估算值。
UserBaselineEventCount 计数 总计(总和) Mode, RunId PT1M
估计 用户基线奖励

用户定义的基线奖励的估算值。
UserBaselineReward 计数 总计(总和) Mode, RunId PT1M
SpeechServices - 用法 合成视频秒数

合成的秒数
VideoSecondsSynthesized 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
SpeechServices - 用法 语音模型托管小时数

小时数。
VoiceModelHostingHours 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
SpeechServices - 用法 语音模型训练分钟数

分钟数。
VoiceModelTrainingMinutes 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M