Compartir a través de


Referencia de datos de supervisión de Azure OpenAI

Este artículo contiene toda la información de referencia de supervisión de este servicio.

Consulte Supervisión de Azure OpenAI para más información sobre los datos que puede recopilar para azure OpenAI Service y cómo usarlo.

Métricas

En esta sección se indican todas las métricas de la plataforma recopiladas automáticamente para este servicio. Estas métricas también forman parte de la lista global de todas las métricas de plataforma admitidas en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Métricas admitidas para Microsoft.CognitiveServices/accounts

Estas son las métricas más importantes que creemos que debe supervisar para Azure OpenAI. Más adelante en este artículo se muestra una lista más larga de todas las métricas de servicios de Azure AI disponibles, que contiene más detalles sobre las métricas de esta lista más corta.

  • Solicitudes de Azure OpenAI

  • Tokens activos

  • Tokens de finalización generados

  • Processed FineTuned Training Hours

  • Processed Inference Tokens

  • Tokens de solicitud procesados

  • Uso administrado aprovisionado V2

  • Solicitud de tasa de coincidencia de caché de tokens

  • Tiempo de respuesta

  • Tiempo entre tokens

  • Hora a último byte

  • Tiempo normalizado a primer byte

También puede supervisar las métricas de seguridad de contenido que usan otros servicios de Azure AI.

  • Volumen bloqueado
  • Volumen dañino detectado
  • Recuento de usuarios potencialmente abusivos
  • Evento del sistema de seguridad
  • Total de volumen enviado para comprobación de seguridad

Nota:

La métrica Uso administrado aprovisionado está en desuso y ya no se recomienda. Esta métrica se reemplazó por la métrica Uso administrado aprovisionado V2.

Las métricas de Cognitive Services tienen la categoría Cognitive Services: solicitudes HTTP en la tabla siguiente. Estas métricas son métricas heredadas que son comunes a todos los recursos de Azure AI Services. Microsoft ya no recomienda usar estas métricas con Azure OpenAI.

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.CognitiveServices/accounts.

  • Es posible que todas las columnas no estén presentes en todas las tablas.
  • Es posible que algunas columnas estén fuera del área de visualización de la página. Seleccione Expandir tabla para ver todas las columnas disponibles.

Encabezados de tabla

  • Categoría: el grupo de métricas o la clasificación.
  • Métrica: el nombre para mostrar de la métrica tal como aparece en Azure Portal.
  • Nombre en la API REST: el nombre de la métrica por el que se conoce en la API REST.
  • Unidad: unidad de medida.
  • Agregación: el tipo de agregación predeterminado. Valores válidos: promedio (Avg), mínimo (Min), máximo (Max), total (Sum), recuento.
  • Dimensiones - : dimensiones disponibles para la métrica.
  • Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
  • Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico. Para obtener más información sobre la exportación de métricas, consulte Crear configuración de diagnóstico en Azure Monitor.
Category Métrica Nombre en la API de REST Unidad Agregación Dimensiones Intervalos de agregación Exportación de DS
Repeticiones de características Repeticiones de características de acción

Número de veces que aparece cada característica de acción.
ActionFeatureIdOccurrences Count Total (Suma) FeatureId, , Mode, RunId PT1M
Características por evento Características de acción por evento

Número medio de características de acción por evento.
ActionFeaturesPerEvent Count Average Mode, RunId PT1M
Acciones Repeticiones de acciones

Número de veces que aparece cada acción.
ActionIdOccurrences Count Total (Suma) ActionId, , Mode, RunId PT1M
Espacios de nombres por evento Espacios de nombres de acción por evento

Número medio de espacios de nombres de acción por evento.
ActionNamespacesPerEvent Count Average Mode, RunId PT1M
Acciones Acciones por evento

Número de acciones por evento.
ActionsPerEvent Count Average Mode, RunId PT1M
Azure OpenAI: uso Tokens activos

Total de tokens menos los tokens almacenados en caché durante un período de tiempo. Se aplica a las PTU y a las implementaciones administradas por PTU. Use esta métrica para comprender el uso basado en TPS o TPM para las PTU y compararlo con los puntos de referencia de TPS o TPM de destino para sus escenarios. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion.
ActiveTokens Count Mínimo, Máximo, Promedio, Total (Suma) Region, ModelDeploymentName, , ModelName, ModelVersion PT1M
SpeechServices: uso Segundos de audio transcritos

Número de segundos transcritos.
AudioSecondsTranscribed Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
SpeechServices: uso Segundos de audio traducidos

Número de segundos traducidos.
AudioSecondsTranslated Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
SpeechServices: uso Segundos de hosting del modelo de avatar

Número de segundos.
AvatarModelHostingSeconds Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Azure OpenAI: solicitudes HTTP Solicitud de tasa de coincidencia de caché de tokens

Porcentaje de los tokens de solicitud que alcanzan la memoria caché, que se puede agregar para la administración de PTU.
AzureOpenAIContextTokensCacheMatchRate Porcentaje Mínimo, Máximo, Promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Azure OpenAI: uso Uso administrado aprovisionado

Porcentaje de uso de una implementación administrada provisoned, calculada como (PTUs consumidas o PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming).
AzureOpenAIProvisionedManagedUtilization Porcentaje Mínimo, Máximo, Promedio Region, StreamType, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Azure OpenAI: uso Uso administrado aprovisionado V2

Porcentaje de uso de una implementación administrada provisoned, calculada como (PTUs consumidas o PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming).
AzureOpenAIProvisionedManagedUtilizationV2 Porcentaje Mínimo, Máximo, Promedio Region, StreamType, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Azure OpenAI: solicitudes HTTP Solicitudes de Azure OpenAI

Número de llamadas realizadas a la API de Azure OpenAI durante un período de tiempo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion, StatusCode (correcto, clienterrors, errores de servidor), StreamType (solicitudes de streaming frente a solicitudes que no son de streaming) y operación.
AzureOpenAIRequests Count Total (Suma) ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M
Azure OpenAI: solicitudes HTTP Tiempo de respuesta

Tiempo de respuesta: medida de latencia recomendada (capacidad de respuesta) para las solicitudes de streaming. Se aplica a las PTU y a las implementaciones administradas por PTU. Se calcula como el tiempo necesario para que la primera respuesta aparezca después de que un usuario envíe una solicitud, según lo mida la puerta de enlace de API. Este número aumenta a medida que aumenta el tamaño de la solicitud o se reduzca el tamaño de aciertos de caché. Para desglosar el tiempo de la métrica de respuesta, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion.

Nota: Esta métrica es una aproximación, ya que la latencia medida depende en gran medida de varios factores, incluidas las llamadas simultáneas y el patrón general de carga de trabajo. Además, no tiene en cuenta ninguna latencia del lado cliente que pueda existir entre el cliente y el punto de conexión de API. Consulte su propio registro para obtener un seguimiento óptimo de la latencia.
AzureOpenAITimeToResponse MilliSeconds Mínimo, Máximo, Promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M
Slots Recompensa general del estimador de línea base

Recompensa general del estimador de línea de base.
BaselineEstimatorOverallReward Count Average Mode, RunId PT1M
Slots Recompensa de ranura del estimador de línea base

Recompensa del estimador de línea de base por ranura.
BaselineEstimatorSlotReward Count Average SlotId, SlotIndex, , Mode, RunId PT1M
Slots Recompensa general del estimador aleatorio de línea base

Recompensa general del estimador aleatorio de línea de base.
BaselineRandomEstimatorOverallReward Count Average Mode, RunId PT1M
Slots Recompensa de ranura del estimador aleatorio de línea base

Recompensa aleatoria del estimador de línea de base por ranura.
BaselineRandomEstimatorSlotReward Count Average SlotId, SlotIndex, , Mode, RunId PT1M
Estimaciones Recuento de eventos aleatorios de línea base

Estimación del número de eventos aleatorios de línea de base.
BaselineRandomEventCount Count Total (Suma) Mode, RunId PT1M
Estimaciones Recompensa aleatoria de línea base

Estimación de la recompensa aleatoria de línea de base.
BaselineRandomReward Count Total (Suma) Mode, RunId PT1M
Cognitive Services: solicitudes HTTP Llamadas bloqueadas

Número de llamadas que han superado la tasa o el límite de cuota. No use para el servicio Azure OpenAI.
BlockedCalls Count Total (Suma) ApiName, OperationName, , Region, RatelimitKey PT1M
Uso Recuento de inferencias

Recuento de inferencias del servicio Carnegie Frontdoor
CarnegieInferenceCount Count Total (Suma) Region, Modality, Category, Language, , SeverityLevel, UseCustomList PT1M
Uso Caracteres entrenados (en desuso)

Número total de caracteres entrenados.
CharactersTrained Count Total (Suma) ApiName, , OperationName, Region PT1M
Uso Caracteres traducidos (en desuso)

Número total de caracteres de la solicitud entrante de texto.
CharactersTranslated Count Total (Suma) ApiName, , OperationName, Region PT1M
Cognitive Services: solicitudes HTTP Errores de cliente

Número de llamadas con error interno del lado cliente (código de respuesta HTTP 4xx). No use para el servicio Azure OpenAI.
ClientErrors Count Total (Suma) ApiName, OperationName, , Region, RatelimitKey PT1M
Uso Transacciones de Computer Vision

Número de transacciones de Computer Vision.
ComputerVisionTransactions Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
ContentSafety: uso Recuento de llamadas para moderación de imágenes

Número de llamadas para la moderación de imágenes.
ContentSafetyImageAnalyzeRequestCount Count Total (Suma) ApiVersion PT1M
ContentSafety: uso Recuento de llamadas para moderación de texto

Número de llamadas para la moderación de texto.
ContentSafetyTextAnalyzeRequestCount Count Total (Suma) ApiVersion PT1M
Repeticiones de características Repeticiones de características de contexto

Número de veces que aparece cada característica de contexto.
ContextFeatureIdOccurrences Count Total (Suma) FeatureId, , Mode, RunId PT1M
Características por evento Características de contexto por evento

Número de características de contexto por evento.
ContextFeaturesPerEvent Count Average Mode, RunId PT1M
Espacios de nombres por evento Espacios de nombres de contexto por evento

Número de espacios de nombres de contexto por evento.
ContextNamespacesPerEvent Count Average Mode, RunId PT1M
Uso Tiempo de entrenamiento de Custom Vision

Tiempo de entrenamiento de Custom Vision.
CustomVisionTrainingTime Segundos Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Transacciones de Custom Vision

Número de transacciones de predicción de Custom Vision.
CustomVisionTransactions Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Cognitive Services: solicitudes HTTP Entrada de datos

Tamaño de los datos de entrada en bytes. No use para el servicio Azure OpenAI.
DataIn Bytes Total (Suma) ApiName, , OperationName, Region PT1M
Cognitive Services: solicitudes HTTP Salida de datos

Tamaño de los datos de salida en bytes. No use para el servicio Azure OpenAI.
DataOut Bytes Total (Suma) ApiName, , OperationName, Region PT1M
Uso Caracteres de documento traducidos

Número de caracteres en la solicitud de traducción de documentos.
DocumentCharactersTranslated Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Caracteres personalizados de documento traducidos

Número de caracteres en la solicitud de traducción de documentos personalizada.
DocumentCustomCharactersTranslated Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Imágenes de caras entrenadas

Número de imágenes entrenadas. 1000 imágenes entrenadas por transacción.
FaceImagesTrained Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Caras almacenadas

Número de caras almacenadas, prorrateadas diariamente. El número de caras almacenadas se notifica a diario.
FacesStored Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Transacciones de caras

Número de llamadas API realizadas al servicio Face.
FaceTransactions Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
FeatureCardinality Cardinalidad de características por acción

Cardinalidad de las características basada en la acción.
FeatureCardinality_Action Count Average FeatureId, , Mode, RunId PT1M
FeatureCardinality Cardinalidad de características por contexto

Cardinalidad de las características basada en el contexto.
FeatureCardinality_Context Count Average FeatureId, , Mode, RunId PT1M
FeatureCardinality Cardinalidad de características por ranura

Cardinalidad de las características basada en la ranura.
FeatureCardinality_Slot Count Average FeatureId, , Mode, RunId PT1M
Azure OpenAI: uso Horas de entrenamiento de FineTuned procesadas

Número de horas de entrenamiento procesadas en un modelo OpenAI FineTuned
FineTunedTrainingHours Count Total (Suma) ApiName, ModelDeploymentName, FeatureName, , UsageChannel, Region PT1M
Azure OpenAI: uso Tokens de finalización generados

Número de tokens generados (salida) a partir de un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.
GeneratedTokens Count Total (Suma) ApiName, ModelDeploymentName, FeatureName, UsageChannel, , Region, ModelVersion PT1M
Uso Imágenes almacenadas

Número de imágenes de Custom Vision almacenadas.
ImagesStored Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Cognitive Services: solicitudes HTTP Latency

Latencia en milisegundos. No use para el servicio Azure OpenAI.
Latency MilliSeconds Average ApiName, OperationName, , Region, RatelimitKey PT1M
Uso Eventos aprendidos

Número de eventos aprendidos.
LearnedEvents Count Total (Suma) IsMatchBaseline, , Mode, RunId PT1M
Uso Solicitudes de voz de LUIS

Número de solicitudes de conversión de voz en intención de LUIS.
LUISSpeechRequests Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Solicitudes de texto de LUIS

Número de solicitudes de texto de LUIS.
LUISTextRequests Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Recompensas coincidentes

Número de recompensas coincidentes.
MatchedRewards Count Total (Suma) Mode, RunId PT1M
Uso Eventos no activados

Número de eventos omitidos.
NonActivatedEvents Count Total (Suma) Mode, RunId PT1M
Slots Ranuras

Número de ranuras por evento.
NumberOfSlots Count Average Mode, RunId PT1M
SpeechServices: uso Número de perfiles de hablante

Número de perfiles de hablante inscritos. Se prorratea cada hora.
NumberofSpeakerProfiles Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Recompensas observadas

Número de recompensas observadas.
ObservedRewards Count Total (Suma) Mode, RunId PT1M
Uso Caracteres de sincronización de documentos traducidos

Número de caracteres en la solicitud de traducción de documentos (sincrónica).
OneDocumentCharactersTranslated Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Slots Recompensa general del estimador en línea

Recompensa general del estimador en línea.
OnlineEstimatorOverallReward Count Average Mode, RunId PT1M
Slots Recompensa de ranura estimador en línea

Recompensa del estimador en línea por ranura.
OnlineEstimatorSlotReward Count Average SlotId, SlotIndex, , Mode, RunId PT1M
Estimaciones Recuento de eventos en línea

Estimación del recuento de eventos en línea.
OnlineEventCount Count Total (Suma) Mode, RunId PT1M
Estimaciones Recompensa en línea

Estimación de la recompensa en línea.
OnlineReward Count Total (Suma) Mode, RunId PT1M
Uso Caracteres procesados

Número de caracteres procesados por Immersive Reader.
ProcessedCharacters Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Registros de texto de estado procesados

Número de registros de texto del estado procesados.
ProcessedHealthTextRecords Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Imágenes procesadas

Número de imágenes procesadas.
ProcessedImages Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Páginas procesadas

Número de páginas procesadas.
ProcessedPages Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Azure OpenAI: uso Tokens de solicitud procesados

Número de tokens de solicitud procesados (entrada) en un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.
ProcessedPromptTokens Count Total (Suma) ApiName, ModelDeploymentName, FeatureName, UsageChannel, , Region, ModelVersion PT1M
Uso Registros de texto procesados

Número de registros de texto.
ProcessedTextRecords Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Registros de texto qa

Número de registros de texto procesados
QuestionAnsweringTextRecords Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
ContentSafety - Riesgos y seguridad Recuento de usuarios potencialmente abusivos

Número de usuarios potencialmente abusivos que detectaron durante un período de tiempo. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: ModelDeploymentName.
RAIAbusiveUsersCount Count Total (Suma) Region, ModelDeploymentName PT1M
ContentSafety - Riesgos y seguridad Volumen dañino detectado

Número de llamadas realizadas a la API de Azure OpenAI y detectadas como perjudiciales (tanto el modelo de bloque como el modo de anotación) por filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType.
RAIHarmfulRequests Count Total (Suma) Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, , CategorySeverity PT1M
ContentSafety - Riesgos y seguridad Volumen bloqueado

Número de llamadas realizadas a la API de Azure OpenAI y rechazadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType.
RAIRejectedRequests Count Total (Suma) Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, , TextTypeCategory PT1M
ContentSafety - Riesgos y seguridad Evento del sistema de seguridad

Evento del sistema para riesgos y supervisión de seguridad. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: EventType.
RAISystemEvent Count Average Region, EventType PT1M
ContentSafety - Riesgos y seguridad Número total de volúmenes enviados para la comprobación de seguridad

Número de llamadas realizadas a la API de Azure OpenAI y detectadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName.
RAITotalRequests Count Total (Suma) Region, ModelDeploymentName, ModelName, , ModelVersion, ApiName PT1M
Cognitive Services: solicitudes HTTP Ratelimit

El límite de frecuencia actual de la clave ratelimit. No use para el servicio Azure OpenAI.
Ratelimit Count Total (Suma) Region, RatelimitKey PT1M
Recompensas Promedio de recompensas por evento

Recompensa media por evento.
Reward Count Average BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, , Mode, RunId PT1M
Cognitive Services: solicitudes HTTP Errores del servidor

Número de llamadas con error interno del servicio (código de respuesta HTTP 5xx). No use para el servicio Azure OpenAI.
ServerErrors Count Total (Suma) ApiName, OperationName, , Region, RatelimitKey PT1M
Repeticiones de características Repeticiones de características de ranura

Número de veces que aparece cada característica de ranura.
SlotFeatureIdOccurrences Count Total (Suma) FeatureId, , Mode, RunId PT1M
Características por evento Características de ranura por evento

Número medio de características de ranura por evento.
SlotFeaturesPerEvent Count Average Mode, RunId PT1M
Slots Repeticiones de ranuras

Número de veces que aparece cada ranura.
SlotIdOccurrences Count Total (Suma) SlotId, SlotIndex, , Mode, RunId PT1M
Espacios de nombres por evento Espacios de nombres de ranura por evento

Número medio de espacios de nombres de ranura por evento.
SlotNamespacesPerEvent Count Average Mode, RunId PT1M
Recompensas Recompensa de ranura

Recompensa por ranura.
SlotReward Count Average BaselineActionId, ChosenActionId, MatchesBaseline, NonDefaultReward, SlotId, SlotIndex, , ModeRunId PT1M
SpeechServices: uso Transacciones de speaker Recognition

Número de transacciones de reconocimiento del hablante.
SpeakerRecognitionTransactions Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
SpeechServices: uso Horas de hospedaje del modelo de voz

Número de horas de hospedaje del modelo de voz.
SpeechModelHostingHours Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Duración de la sesión de voz (en desuso)

Duración total de la sesión de voz en segundos.
SpeechSessionDuration Segundos Total (Suma) ApiName, , OperationName, Region PT1M
Cognitive Services: solicitudes HTTP Llamadas correctas

Número de llamadas correctas. No use para el servicio Azure OpenAI.
SuccessfulCalls Count Total (Suma) ApiName, OperationName, , Region, RatelimitKey PT1M
Cognitive Services: SLI AvailabilityRate

Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500. No use para el servicio Azure OpenAI.
SuccessRate Porcentaje Mínimo, Máximo, Promedio ApiName, OperationName, , Region, RatelimitKey PT1M No
SpeechServices: uso Caracteres sintetizados

Número de caracteres.
SynthesizedCharacters Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Caracteres de texto traducidos

Número de caracteres en la solicitud entrante de traducción de texto.
TextCharactersTranslated Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Caracteres personalizados de texto traducidos

Número de caracteres en la solicitud entrante personalizada de traducción de texto.
TextCustomCharactersTranslated Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Uso Caracteres entrenados de texto

Número de caracteres entrenados mediante la traducción de texto.
TextTrainedCharacters Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
Azure OpenAI: uso Tokens de inferencia procesados

Número de tokens de inferencia procesados en un modelo de OpenAI. Se calcula como tokens de solicitud (entrada) más tokens generados (salida). Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.
TokenTransaction Count Total (Suma) ApiName, ModelDeploymentName, FeatureName, UsageChannel, , Region, ModelVersion PT1M
Cognitive Services: solicitudes HTTP Total de llamadas

Número total de llamadas. No use para el servicio Azure OpenAI.
TotalCalls Count Total (Suma) ApiName, OperationName, , Region, RatelimitKey PT1M
Cognitive Services: solicitudes HTTP Total de errores

Número total de llamadas con respuesta de error (código de respuesta HTTP 4xx o 5xx). No use para el servicio Azure OpenAI.
TotalErrors Count Total (Suma) ApiName, OperationName, , Region, RatelimitKey PT1M
Uso N.º total de eventos

Número de eventos.
TotalEvents Count Total (Suma) Mode, RunId PT1M
Cognitive Services: solicitudes HTTP Total de llamadas de token

Número total de llamadas de token.
TotalTokenCalls Count Total (Suma) ApiName, , OperationName, Region PT1M
Uso Total de transacciones (en desuso)

Número total de transacciones.
TotalTransactions Count Total (Suma) <none> PT1M
Estimaciones Recuento de eventos de línea base de usuario

Estimación del número de eventos de línea de base definidos por el usuario.
UserBaselineEventCount Count Total (Suma) Mode, RunId PT1M
Estimaciones Recompensa de línea base de usuario

Estimación de la recompensa de línea de base definida por el usuario.
UserBaselineReward Count Total (Suma) Mode, RunId PT1M
SpeechServices: uso Segundos de vídeo sintetizados

Número de segundos sintetizados
VideoSecondsSynthesized Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
SpeechServices: uso Horas de hosting del modelo de voz

Número de horas.
VoiceModelHostingHours Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M
SpeechServices: uso Minutos de entrenamiento del modelo de voz

Número de minutos.
VoiceModelTrainingMinutes Count Total (Suma) ApiName, FeatureName, , UsageChannel, Region PT1M

Dimensiones de métricas

Para obtener más información sobre las dimensiones de métricas, consulte Métricas multidimensionales.

Este servicio tiene las siguientes dimensiones asociadas a sus métricas.

  • ApiName
  • FeatureName
  • ModelDeploymentName
  • ModelName
  • ModelVersion
  • OperationName
  • Region
  • StatusCode
  • StreamType
  • UsageChannel

Registros del recurso

En esta sección se enumeran los tipos de registros de recursos que se pueden recopilar para este servicio. La sección extrae de la lista de todos los tipos de categorías de registros admitidos en Azure Monitor.

Registros de recursos admitidos para Microsoft.CognitiveServices/accounts

Category Nombre para mostrar de categoría Tabla de registro Admite el plan de registro básico Admite la transformación en tiempo de ingesta Consultas de ejemplo Costos para exportar
Audit Registros de auditoría AzureDiagnostics

Registros de varios recursos de Azure.

No N.º No
RequestResponse Registros de solicitud y respuesta AzureDiagnostics

Registros de varios recursos de Azure.

No N.º No
Trace Registros de seguimiento AzureDiagnostics

Registros de varios recursos de Azure.

No N.º No

Tablas de registros de Azure Monitor

En esta sección, se enumeran todas las tablas de registros de Azure Monitor relacionadas con este servicio y que están disponibles para consulta mediante Log Analytics con consultas de Kusto. Las tablas contienen datos de registro de recursos y, posiblemente, más dependiendo de lo que se recopila y se enrutan a ellos.

Azure OpenAI microsoft.cognitiveservices/accounts

Registro de actividad

En la tabla vinculada se enumeran las operaciones que se pueden registrar en el registro de actividad de este servicio. Estas operaciones son un subconjunto de todas las posibles operaciones del proveedor de recursos en el registro de actividad.

Para obtener más información sobre el esquema de las entradas del registro de actividad, consulte Esquema del registro de actividad.