你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Microsoft.CognitiveServices/accounts 支持的指标

下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。

表标题

指标 - 在 Azure 门户中显示的指标显示名称。
Rest API 中的名称 - 在 REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认的聚合类型。 有效值:平均值、最小值、最大值、总计、计数。
维度 - 适用于指标的维度
时间粒度 - 对指标采样的间隔。 例如,PT1M 表示该指标每分钟采样一次,PT30M 表示每 30 分钟一次,PT1H 表示每小时一次,以此类推。
DS 导出 - 是否可通过诊断设置将指标导出到 Azure Monitor 日志。

有关导出指标的信息,请参阅 - 使用数据收集规则 导出指标并在 Azure Monitor 中创建诊断设置。

有关指标保留的信息,请参阅 Azure Monitor 指标概述

有关支持的日志列表,请参阅支持的日志类别 - Microsoft.CognitiveServices/accounts

类别:操作

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
操作出现次数

每个操作的出现次数。
ActionIdOccurrences 计数 总计(总和) ActionIdMode、、 RunId PT1M
每个事件的操作数量

每个事件的操作数量。
ActionsPerEvent 计数 平均值 Mode, RunId PT1M

类别:Azure OpenAI - HTTP 请求

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
提示令牌缓存匹配率

提示令牌命中缓存的百分比,适用于 PTU 管理的令牌。
AzureOpenAIContextTokensCacheMatchRate 百分比 最小值、最大值、平均值 Region、、ModelDeploymentNameModelName、、ModelVersion PT1M
Azure OpenAI 请求

一段时间内对 Azure OpenAI API 的调用次数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion、StatusCode(成功、客户端程序、服务器错误)、StreamType(流式处理请求和非流式处理请求)和操作。
AzureOpenAIRequests 计数 总计(总和) ApiName、、OperationNameRegionStreamTypeModelDeploymentNameModelName、、 ModelVersionStatusCode PT1M
响应时间

对于流式处理请求,建议使用延迟(响应能力)度量值。 适用于 PTU 和 PTU 托管的部署。 按用户发送提示后出现第一个响应所需的时间计算,由 API 网关测量。 随着提示大小增加和/或缓存命中大小减小,此数字将增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。

注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和总体工作负载模式。 此外,它不考虑客户端与 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。
AzureOpenAITimeToResponse 毫秒 最小值、最大值、平均值 ApiName、、OperationNameRegionStreamTypeModelDeploymentNameModelName、、 ModelVersionStatusCode PT1M

类别:Azure OpenAI - 使用情况

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
有效令牌

令牌总数减去一段时间内缓存的令牌。 适用于 PTU 和 PTU 托管的部署。 使用此指标可了解 PTU 的基于 TPS 或 TPM 的利用率,并将其与方案的目标 TPS 或 TPM 基准进行比较。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。
ActiveTokens 计数 最小值、最大值、平均值、总计(求和) Region、、ModelDeploymentNameModelName、、ModelVersion PT1M
预配管理的利用率

预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求)
AzureOpenAIProvisionedManagedUtilization 百分比 最小值、最大值、平均值 Region、、StreamTypeModelDeploymentNameModelNameModelVersion PT1M
预配管理的利用率 V2

预配管理的部署的利用率百分比,计算公式为 (已使用的 PTU/已部署的 PTU) x 100。 当利用率大于或等于 100% 时,调用将受到限制,并返回错误代码 429。 若要细分此指标,可以添加一个筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType(流式处理请求和非流式处理请求)
AzureOpenAIProvisionedManagedUtilizationV2 百分比 最小值、最大值、平均值 Region、、StreamTypeModelDeploymentNameModelNameModelVersion PT1M
已处理的 FineTuned 训练小时数

在 OpenAI FineTuned 模型中处理的训练小时数
FineTunedTrainingHours 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegion PT1M
生成的完成令牌

从 OpenAI 模型生成(输出)的令牌数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
GeneratedTokens 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M
已处理的提示令牌

OpenAI 模型上处理(输入)的提示令牌数。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
ProcessedPromptTokens 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M
已处理的推理令牌

在 OpenAI 模型上处理的推理令牌数量。 计算公式为提示令牌(输入)加上生成的令牌(输出)。 适用于 PTU、PTU 托管和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
TokenTransaction 计数 总计(总和) ApiName、、ModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M

类别:认知服务 - HTTP 请求

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
阻止的调用数

超过速率或配额限制的调用数。 请勿用于 Azure OpenAI 服务。
BlockedCalls 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
客户端错误数

引发客户端错误(HTTP 响应代码 4xx)的调用数。 请勿用于 Azure OpenAI 服务。
ClientErrors 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
数据输入

传入数据的大小(字节)。 请勿用于 Azure OpenAI 服务。
DataIn 字节 总计(总和) ApiNameOperationName、、 Region PT1M
数据输出

传出数据的大小(字节)。 请勿用于 Azure OpenAI 服务。
DataOut 字节 总计(总和) ApiNameOperationName、、 Region PT1M
延迟

延迟(毫秒)。 请勿用于 Azure OpenAI 服务。
Latency 毫秒 平均值 ApiName、、OperationNameRegion、、RatelimitKey PT1M
Ratelimit

ratelimit 键的当前速率限制。 请勿用于 Azure OpenAI 服务。
Ratelimit 计数 总计(总和) Region, RatelimitKey PT1M
服务器错误数

引发服务内部错误(HTTP 响应代码 5xx)的调用数。 请勿用于 Azure OpenAI 服务。
ServerErrors 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
成功调用数

成功调用数。 请勿用于 Azure OpenAI 服务。
SuccessfulCalls 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
呼叫总数

调用总数。 请勿用于 Azure OpenAI 服务。
TotalCalls 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
错误总数

引发错误响应(HTTP 响应代码 4xx 或 5xx)的调用总数。 请勿用于 Azure OpenAI 服务。
TotalErrors 计数 总计(总和) ApiName、、OperationNameRegion、、RatelimitKey PT1M
令牌调用总数

令牌调用的总数。
TotalTokenCalls 计数 总计(总和) ApiNameOperationName、、 Region PT1M

类别:认知服务 - SLI

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
AvailabilityRate

使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 请勿用于 Azure OpenAI 服务。
SuccessRate 百分比 最小值、最大值、平均值 ApiName、、OperationNameRegion、、RatelimitKey PT1M

类别:ContentSafety - 风险&安全

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
潜在的滥用用户计数

在一段时间内检测到的潜在滥用用户数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName。
RAIAbusiveUsersCount 计数 总计(总和) Region, ModelDeploymentName PT1M
检测到有害卷

一段时间内应用的内容筛选器对 Azure OpenAI API 进行的并检测为有害(块模型和注释模式)的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。
RAIHarmfulRequests 计数 总计(总和) Region、、ModelDeploymentNameModelNameModelVersionApiNameTextType、、 CategorySeverity PT1M
阻止的卷

在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器拒绝的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。
RAIRejectedRequests 计数 总计(总和) Region、、ModelDeploymentNameModelNameModelVersionApiName、、 TextTypeCategory PT1M
安全系统事件

用于风险与安全监视的系统事件。 可以添加筛选器或按以下维度应用拆分:EventType。
RAISystemEvent 计数 平均值 Region, EventType PT1M
为安全检查发送的总卷

在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器检测的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName。
RAITotalRequests 计数 总计(总和) Region、、ModelDeploymentNameModelNameModelVersionApiName PT1M

类别:ContentSafety - 用法

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
用于图像审查的调用计数

用于图像审查的调用数。
ContentSafetyImageAnalyzeRequestCount 计数 总计(总和) ApiVersion PT1M
用于文本审查的调用计数

用于文本审查的调用数。
ContentSafetyTextAnalyzeRequestCount 计数 总计(总和) ApiVersion PT1M

类别:估计

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
基线随机事件计数

基线随机事件计数的估算值。
BaselineRandomEventCount 计数 总计(总和) Mode, RunId PT1M
基线随机奖励

基线随机奖励的估算值。
BaselineRandomReward 计数 总计(总和) Mode, RunId PT1M
联机事件计数

联机事件计数的估算值。
OnlineEventCount 计数 总计(总和) Mode, RunId PT1M
联机奖励

联机奖励的估算值。
OnlineReward 计数 总计(总和) Mode, RunId PT1M
用户基线事件计数

用户定义的基线事件计数的估算值。
UserBaselineEventCount 计数 总计(总和) Mode, RunId PT1M
用户基线奖励

用户定义的基线奖励的估算值。
UserBaselineReward 计数 总计(总和) Mode, RunId PT1M

类别:功能发生

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
操作特征出现次数

每个操作特征的出现次数。
ActionFeatureIdOccurrences 计数 总计(总和) FeatureIdMode、、 RunId PT1M
上下文特征出现次数

每个上下文特征的出现次数。
ContextFeatureIdOccurrences 计数 总计(总和) FeatureIdMode、、 RunId PT1M
槽特征出现次数

每个槽特征的出现次数。
SlotFeatureIdOccurrences 计数 总计(总和) FeatureIdMode、、 RunId PT1M

类别:FeatureCardinality

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
按操作列出的特征基数

基于操作的特征基数。
FeatureCardinality_Action 计数 平均值 FeatureIdMode、、 RunId PT1M
按上下文列出的特征基数

基于上下文的特征基数。
FeatureCardinality_Context 计数 平均值 FeatureIdMode、、 RunId PT1M
按槽列出的特征基数

基于槽的特征基数。
FeatureCardinality_Slot 计数 平均值 FeatureIdMode、、 RunId PT1M

类别:每个事件的功能

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
每个事件的操作特征数

每个事件的平均操作特征数量。
ActionFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
每个事件的上下文特征数

每个事件的上下文特征数量。
ContextFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
每个事件的槽特征数

每个事件的平均槽特征数量。
SlotFeaturesPerEvent 计数 平均值 Mode, RunId PT1M

类别:每个事件的命名空间

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
每个事件的操作命名空间数

每个事件的平均操作命名空间数量。
ActionNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
每个事件的上下文命名空间数

每个事件的上下文命名空间数量。
ContextNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
每个事件的槽命名空间数

每个事件的平均槽命名空间数量。
SlotNamespacesPerEvent 计数 平均值 Mode, RunId PT1M

类别:奖励

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
每个事件的平均奖励

每个事件的平均奖励。
Reward 计数 平均值 BaselineAction、、ChosenActionIdMatchesBaselineNonDefaultRewardModeRunId PT1M
槽奖励

每个槽的奖励。
SlotReward 计数 平均值 BaselineActionId、、ChosenActionIdMatchesBaselineNonDefaultRewardSlotIdSlotIndex、、 ModeRunId PT1M

类别:槽

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
基线估算器总奖励

基线估算器总奖励。
BaselineEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
基线估算器槽奖励

按槽列出的基线估算器奖励。
BaselineEstimatorSlotReward 计数 平均值 SlotId、、SlotIndexMode、、RunId PT1M
基线随机估算器总奖励

基线随机估算器总奖励。
BaselineRandomEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
基线随机估算器槽奖励

按槽列出的基线随机估算器奖励。
BaselineRandomEstimatorSlotReward 计数 平均值 SlotId、、SlotIndexMode、、RunId PT1M


每个事件的槽数。
NumberOfSlots 计数 平均值 Mode, RunId PT1M
联机估算器总奖励

联机估算器总奖励。
OnlineEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
联机估算器槽奖励

按槽列出的联机估算器奖励。
OnlineEstimatorSlotReward 计数 平均值 SlotId、、SlotIndexMode、、RunId PT1M
槽出现次数

每个槽的出现次数。
SlotIdOccurrences 计数 总计(总和) SlotId、、SlotIndexMode、、RunId PT1M

类别:SpeechServices - 用法

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
转录的音频秒数

转录的秒数
AudioSecondsTranscribed 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
转换的音频秒数

转换的秒数
AudioSecondsTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
虚拟形象模型托管秒数

秒数。
AvatarModelHostingSeconds 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
说话人配置文件数

注册的说话人配置文件数。 每小时按比例计算。
NumberofSpeakerProfiles 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
说话人辨识事务

说话人辨识事务数
SpeakerRecognitionTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
语音模型托管时间

语音模型托管时间数
SpeechModelHostingHours 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
合成字符数

字符数。
SynthesizedCharacters 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
合成视频秒数

合成的秒数
VideoSecondsSynthesized 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
语音模型托管小时数

小时数。
VoiceModelHostingHours 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
语音模型训练分钟数

分钟数。
VoiceModelTrainingMinutes 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M

类别:使用情况

指标 REST API 中的名称 Unit 聚合 维度 时间粒度 DS 导出
推理计数

Carnegie Frontdoor 服务的推理计数
CarnegieInferenceCount 计数 总计(总和) Region、、ModalityCategoryLanguageSeverityLevelUseCustomList PT1M
训练的字符数(已弃用)

训练的字符总数。
CharactersTrained 计数 总计(总和) ApiNameOperationName、、 Region PT1M
转换的字符数(已弃用)

传入的文本请求中的字符总数。
CharactersTranslated 计数 总计(总和) ApiNameOperationName、、 Region PT1M
计算机视觉事务

计算机视觉事务数
ComputerVisionTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
自定义视觉训练时间

自定义视觉训练时间
CustomVisionTrainingTime 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
自定义视觉事务

自定义视觉预测事务数
CustomVisionTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
转换的文档字符数

文档翻译请求中的字符数。
DocumentCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
转换的文档自定义字符数

自定义文档翻译请求中的字符数。
DocumentCustomCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
训练的人脸图像

训练的图像数。 每个事务训练 1,000 个图像。
FaceImagesTrained 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
存储的人脸

存储的人脸数,每日按比例计算。 每日报告存储的人脸数。
FacesStored 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
人脸事务

对人脸服务进行 API 调用的数量
FaceTransactions 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
存储的图像

存储的自定义视觉图像数。
ImagesStored 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
已了解的事件数

已了解的事件数。
LearnedEvents 计数 总计(总和) IsMatchBaselineMode、、 RunId PT1M
LUIS 语音请求

LUIS 语音转意向理解请求数
LUISSpeechRequests 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
LUIS 文本请求

LUIS 文本请求数
LUISTextRequests 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
匹配的奖励数

匹配的奖励数。
MatchedRewards 计数 总计(总和) Mode, RunId PT1M
未激活的事件数

跳过的事件数量。
NonActivatedEvents 计数 总计(总和) Mode, RunId PT1M
观察到的奖励数

观察到的奖励数。
ObservedRewards 计数 总计(总和) Mode, RunId PT1M
转换的同步字符数

文档翻译(同步)请求中的字符数。
OneDocumentCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
已处理的字符数

沉浸式阅读器处理的字符数。
ProcessedCharacters 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
处理的运行状况文本记录

处理的运行状况文本记录数
ProcessedHealthTextRecords 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
已处理的图像

处理的图像数
ProcessedImages 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
处理的页面

处理的页面数
ProcessedPages 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
已处理的文本记录数

文本记录的计数。
ProcessedTextRecords 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
QA 文本记录

处理的文本记录数
QuestionAnsweringTextRecords 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
语音会话持续时间(已弃用)

语音会话的总持续时间(以秒计)。
SpeechSessionDuration 总计(总和) ApiNameOperationName、、 Region PT1M
转换的文本字符数

传入的文本翻译请求中的字符数。
TextCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
转换的文本自定义字符数

传入的自定义文本翻译请求中的字符数。
TextCustomCharactersTranslated 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
训练的文本字符数

使用文本翻译训练的字符数。
TextTrainedCharacters 计数 总计(总和) ApiName、、FeatureNameUsageChannel、、Region PT1M
Total Events

事件数量。
TotalEvents 计数 总计(总和) Mode, RunId PT1M
总事务(已弃用)

事务总数。
TotalTransactions 计数 总计(总和) <无> PT1M

后续步骤