Referencia de datos de supervisión de Azure OpenAI
Este artículo contiene toda la información de referencia de supervisión de este servicio.
Consulte Supervisión de Azure OpenAI para más información sobre los datos que puede recopilar para azure OpenAI Service y cómo usarlo.
Métricas
En esta sección se indican todas las métricas de la plataforma recopiladas automáticamente para este servicio. Estas métricas también forman parte de la lista global de todas las métricas de plataforma admitidas en Azure Monitor.
Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.
Métricas admitidas para Microsoft.CognitiveServices/accounts
Estas son las métricas más importantes que creemos que debe supervisar para Azure OpenAI. Más adelante en este artículo se muestra una lista más larga de todas las métricas de servicios de Azure AI disponibles, que contiene más detalles sobre las métricas de esta lista más corta.
Solicitudes de Azure OpenAI
Tokens activos
Tokens de finalización generados
Processed FineTuned Training Hours
Processed Inference Tokens
Tokens de solicitud procesados
Uso administrado aprovisionado V2
Solicitud de tasa de coincidencia de caché de tokens
Tiempo de respuesta
Tiempo entre tokens
Hora a último byte
Tiempo normalizado a primer byte
También puede supervisar las métricas de seguridad de contenido que usan otros servicios de Azure AI.
- Volumen bloqueado
- Volumen dañino detectado
- Recuento de usuarios potencialmente abusivos
- Evento del sistema de seguridad
- Total de volumen enviado para comprobación de seguridad
Nota:
La métrica Uso administrado aprovisionado está en desuso y ya no se recomienda. Esta métrica se reemplazó por la métrica Uso administrado aprovisionado V2.
Las métricas de Cognitive Services tienen la categoría Cognitive Services: solicitudes HTTP en la tabla siguiente. Estas métricas son métricas heredadas que son comunes a todos los recursos de Azure AI Services. Microsoft ya no recomienda usar estas métricas con Azure OpenAI.
En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.CognitiveServices/accounts.
- Es posible que todas las columnas no estén presentes en todas las tablas.
- Es posible que algunas columnas estén fuera del área de visualización de la página. Seleccione Expandir tabla para ver todas las columnas disponibles.
Encabezados de tabla
- Categoría: el grupo de métricas o la clasificación.
- Métrica: el nombre para mostrar de la métrica tal como aparece en Azure Portal.
- Nombre en la API REST: el nombre de la métrica por el que se conoce en la API REST.
- Unidad: unidad de medida.
- Agregación: el tipo de agregación predeterminado. Valores válidos: promedio (Avg), mínimo (Min), máximo (Max), total (Sum), recuento.
- Dimensiones - : dimensiones disponibles para la métrica.
- Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo,
PT1M
indica que la métrica se muestrea cada minuto,PT30M
cada 30 minutos,PT1H
cada hora, etc. - Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico. Para obtener más información sobre la exportación de métricas, consulte Crear configuración de diagnóstico en Azure Monitor.
Category | Métrica | Nombre en la API de REST | Unidad | Agregación | Dimensiones | Intervalos de agregación | Exportación de DS |
---|---|---|---|---|---|---|---|
Repeticiones de características | Repeticiones de características de acción Número de veces que aparece cada característica de acción. |
ActionFeatureIdOccurrences |
Count | Total (Suma) | FeatureId , , Mode , RunId |
PT1M | Sí |
Características por evento | Características de acción por evento Número medio de características de acción por evento. |
ActionFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Sí |
Acciones | Repeticiones de acciones Número de veces que aparece cada acción. |
ActionIdOccurrences |
Count | Total (Suma) | ActionId , , Mode , RunId |
PT1M | Sí |
Espacios de nombres por evento | Espacios de nombres de acción por evento Número medio de espacios de nombres de acción por evento. |
ActionNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Sí |
Acciones | Acciones por evento Número de acciones por evento. |
ActionsPerEvent |
Count | Average | Mode , RunId |
PT1M | Sí |
Azure OpenAI: uso | Tokens activos Total de tokens menos los tokens almacenados en caché durante un período de tiempo. Se aplica a las PTU y a las implementaciones administradas por PTU. Use esta métrica para comprender el uso basado en TPS o TPM para las PTU y compararlo con los puntos de referencia de TPS o TPM de destino para sus escenarios. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion. |
ActiveTokens |
Count | Mínimo, Máximo, Promedio, Total (Suma) | Region , ModelDeploymentName , , ModelName , ModelVersion |
PT1M | Sí |
SpeechServices: uso | Segundos de audio transcritos Número de segundos transcritos. |
AudioSecondsTranscribed |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
SpeechServices: uso | Segundos de audio traducidos Número de segundos traducidos. |
AudioSecondsTranslated |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
SpeechServices: uso | Segundos de hosting del modelo de avatar Número de segundos. |
AvatarModelHostingSeconds |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Azure OpenAI: solicitudes HTTP | Solicitud de tasa de coincidencia de caché de tokens Porcentaje de los tokens de solicitud que alcanzan la memoria caché, que se puede agregar para la administración de PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Porcentaje | Mínimo, Máximo, Promedio | Region , ModelDeploymentName , , ModelName , ModelVersion |
PT1M | No |
Azure OpenAI: uso | Uso administrado aprovisionado Porcentaje de uso de una implementación administrada provisoned, calculada como (PTUs consumidas o PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming). |
AzureOpenAIProvisionedManagedUtilization |
Porcentaje | Mínimo, Máximo, Promedio | Region , StreamType , ModelDeploymentName , , ModelName , ModelVersion |
PT1M | No |
Azure OpenAI: uso | Uso administrado aprovisionado V2 Porcentaje de uso de una implementación administrada provisoned, calculada como (PTUs consumidas o PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming). |
AzureOpenAIProvisionedManagedUtilizationV2 |
Porcentaje | Mínimo, Máximo, Promedio | Region , StreamType , ModelDeploymentName , , ModelName , ModelVersion |
PT1M | No |
Azure OpenAI: solicitudes HTTP | Solicitudes de Azure OpenAI Número de llamadas realizadas a la API de Azure OpenAI durante un período de tiempo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion, StatusCode (correcto, clienterrors, errores de servidor), StreamType (solicitudes de streaming frente a solicitudes que no son de streaming) y operación. |
AzureOpenAIRequests |
Count | Total (Suma) | ApiName , OperationName , Region , StreamType , ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sí |
Azure OpenAI: solicitudes HTTP | Tiempo de respuesta Tiempo de respuesta: medida de latencia recomendada (capacidad de respuesta) para las solicitudes de streaming. Se aplica a las PTU y a las implementaciones administradas por PTU. Se calcula como el tiempo necesario para que la primera respuesta aparezca después de que un usuario envíe una solicitud, según lo mida la puerta de enlace de API. Este número aumenta a medida que aumenta el tamaño de la solicitud o se reduzca el tamaño de aciertos de caché. Para desglosar el tiempo de la métrica de respuesta, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion. Nota: Esta métrica es una aproximación, ya que la latencia medida depende en gran medida de varios factores, incluidas las llamadas simultáneas y el patrón general de carga de trabajo. Además, no tiene en cuenta ninguna latencia del lado cliente que pueda existir entre el cliente y el punto de conexión de API. Consulte su propio registro para obtener un seguimiento óptimo de la latencia. |
AzureOpenAITimeToResponse |
MilliSeconds | Mínimo, Máximo, Promedio | ApiName , OperationName , Region , StreamType , ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sí |
Slots | Recompensa general del estimador de línea base Recompensa general del estimador de línea de base. |
BaselineEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Sí |
Slots | Recompensa de ranura del estimador de línea base Recompensa del estimador de línea de base por ranura. |
BaselineEstimatorSlotReward |
Count | Average | SlotId , SlotIndex , , Mode , RunId |
PT1M | Sí |
Slots | Recompensa general del estimador aleatorio de línea base Recompensa general del estimador aleatorio de línea de base. |
BaselineRandomEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Sí |
Slots | Recompensa de ranura del estimador aleatorio de línea base Recompensa aleatoria del estimador de línea de base por ranura. |
BaselineRandomEstimatorSlotReward |
Count | Average | SlotId , SlotIndex , , Mode , RunId |
PT1M | Sí |
Estimaciones | Recuento de eventos aleatorios de línea base Estimación del número de eventos aleatorios de línea de base. |
BaselineRandomEventCount |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Estimaciones | Recompensa aleatoria de línea base Estimación de la recompensa aleatoria de línea de base. |
BaselineRandomReward |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Llamadas bloqueadas Número de llamadas que han superado la tasa o el límite de cuota. No use para el servicio Azure OpenAI. |
BlockedCalls |
Count | Total (Suma) | ApiName , OperationName , , Region , RatelimitKey |
PT1M | Sí |
Uso | Recuento de inferencias Recuento de inferencias del servicio Carnegie Frontdoor |
CarnegieInferenceCount |
Count | Total (Suma) | Region , Modality , Category , Language , , SeverityLevel , UseCustomList |
PT1M | Sí |
Uso | Caracteres entrenados (en desuso) Número total de caracteres entrenados. |
CharactersTrained |
Count | Total (Suma) | ApiName , , OperationName , Region |
PT1M | Sí |
Uso | Caracteres traducidos (en desuso) Número total de caracteres de la solicitud entrante de texto. |
CharactersTranslated |
Count | Total (Suma) | ApiName , , OperationName , Region |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Errores de cliente Número de llamadas con error interno del lado cliente (código de respuesta HTTP 4xx). No use para el servicio Azure OpenAI. |
ClientErrors |
Count | Total (Suma) | ApiName , OperationName , , Region , RatelimitKey |
PT1M | Sí |
Uso | Transacciones de Computer Vision Número de transacciones de Computer Vision. |
ComputerVisionTransactions |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
ContentSafety: uso | Recuento de llamadas para moderación de imágenes Número de llamadas para la moderación de imágenes. |
ContentSafetyImageAnalyzeRequestCount |
Count | Total (Suma) | ApiVersion |
PT1M | Sí |
ContentSafety: uso | Recuento de llamadas para moderación de texto Número de llamadas para la moderación de texto. |
ContentSafetyTextAnalyzeRequestCount |
Count | Total (Suma) | ApiVersion |
PT1M | Sí |
Repeticiones de características | Repeticiones de características de contexto Número de veces que aparece cada característica de contexto. |
ContextFeatureIdOccurrences |
Count | Total (Suma) | FeatureId , , Mode , RunId |
PT1M | Sí |
Características por evento | Características de contexto por evento Número de características de contexto por evento. |
ContextFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Sí |
Espacios de nombres por evento | Espacios de nombres de contexto por evento Número de espacios de nombres de contexto por evento. |
ContextNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Sí |
Uso | Tiempo de entrenamiento de Custom Vision Tiempo de entrenamiento de Custom Vision. |
CustomVisionTrainingTime |
Segundos | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Transacciones de Custom Vision Número de transacciones de predicción de Custom Vision. |
CustomVisionTransactions |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Entrada de datos Tamaño de los datos de entrada en bytes. No use para el servicio Azure OpenAI. |
DataIn |
Bytes | Total (Suma) | ApiName , , OperationName , Region |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Salida de datos Tamaño de los datos de salida en bytes. No use para el servicio Azure OpenAI. |
DataOut |
Bytes | Total (Suma) | ApiName , , OperationName , Region |
PT1M | Sí |
Uso | Caracteres de documento traducidos Número de caracteres en la solicitud de traducción de documentos. |
DocumentCharactersTranslated |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Caracteres personalizados de documento traducidos Número de caracteres en la solicitud de traducción de documentos personalizada. |
DocumentCustomCharactersTranslated |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Imágenes de caras entrenadas Número de imágenes entrenadas. 1000 imágenes entrenadas por transacción. |
FaceImagesTrained |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Caras almacenadas Número de caras almacenadas, prorrateadas diariamente. El número de caras almacenadas se notifica a diario. |
FacesStored |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Transacciones de caras Número de llamadas API realizadas al servicio Face. |
FaceTransactions |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
FeatureCardinality | Cardinalidad de características por acción Cardinalidad de las características basada en la acción. |
FeatureCardinality_Action |
Count | Average | FeatureId , , Mode , RunId |
PT1M | Sí |
FeatureCardinality | Cardinalidad de características por contexto Cardinalidad de las características basada en el contexto. |
FeatureCardinality_Context |
Count | Average | FeatureId , , Mode , RunId |
PT1M | Sí |
FeatureCardinality | Cardinalidad de características por ranura Cardinalidad de las características basada en la ranura. |
FeatureCardinality_Slot |
Count | Average | FeatureId , , Mode , RunId |
PT1M | Sí |
Azure OpenAI: uso | Horas de entrenamiento de FineTuned procesadas Número de horas de entrenamiento procesadas en un modelo OpenAI FineTuned |
FineTunedTrainingHours |
Count | Total (Suma) | ApiName , ModelDeploymentName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Azure OpenAI: uso | Tokens de finalización generados Número de tokens generados (salida) a partir de un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName. |
GeneratedTokens |
Count | Total (Suma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , , Region , ModelVersion |
PT1M | Sí |
Uso | Imágenes almacenadas Número de imágenes de Custom Vision almacenadas. |
ImagesStored |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Latency Latencia en milisegundos. No use para el servicio Azure OpenAI. |
Latency |
MilliSeconds | Average | ApiName , OperationName , , Region , RatelimitKey |
PT1M | Sí |
Uso | Eventos aprendidos Número de eventos aprendidos. |
LearnedEvents |
Count | Total (Suma) | IsMatchBaseline , , Mode , RunId |
PT1M | Sí |
Uso | Solicitudes de voz de LUIS Número de solicitudes de conversión de voz en intención de LUIS. |
LUISSpeechRequests |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Solicitudes de texto de LUIS Número de solicitudes de texto de LUIS. |
LUISTextRequests |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Recompensas coincidentes Número de recompensas coincidentes. |
MatchedRewards |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Uso | Eventos no activados Número de eventos omitidos. |
NonActivatedEvents |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Slots | Ranuras Número de ranuras por evento. |
NumberOfSlots |
Count | Average | Mode , RunId |
PT1M | Sí |
SpeechServices: uso | Número de perfiles de hablante Número de perfiles de hablante inscritos. Se prorratea cada hora. |
NumberofSpeakerProfiles |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Recompensas observadas Número de recompensas observadas. |
ObservedRewards |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Uso | Caracteres de sincronización de documentos traducidos Número de caracteres en la solicitud de traducción de documentos (sincrónica). |
OneDocumentCharactersTranslated |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Slots | Recompensa general del estimador en línea Recompensa general del estimador en línea. |
OnlineEstimatorOverallReward |
Count | Average | Mode , RunId |
PT1M | Sí |
Slots | Recompensa de ranura estimador en línea Recompensa del estimador en línea por ranura. |
OnlineEstimatorSlotReward |
Count | Average | SlotId , SlotIndex , , Mode , RunId |
PT1M | Sí |
Estimaciones | Recuento de eventos en línea Estimación del recuento de eventos en línea. |
OnlineEventCount |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Estimaciones | Recompensa en línea Estimación de la recompensa en línea. |
OnlineReward |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Uso | Caracteres procesados Número de caracteres procesados por Immersive Reader. |
ProcessedCharacters |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Registros de texto de estado procesados Número de registros de texto del estado procesados. |
ProcessedHealthTextRecords |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Imágenes procesadas Número de imágenes procesadas. |
ProcessedImages |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Páginas procesadas Número de páginas procesadas. |
ProcessedPages |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Azure OpenAI: uso | Tokens de solicitud procesados Número de tokens de solicitud procesados (entrada) en un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName. |
ProcessedPromptTokens |
Count | Total (Suma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , , Region , ModelVersion |
PT1M | Sí |
Uso | Registros de texto procesados Número de registros de texto. |
ProcessedTextRecords |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Registros de texto qa Número de registros de texto procesados |
QuestionAnsweringTextRecords |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
ContentSafety - Riesgos y seguridad | Recuento de usuarios potencialmente abusivos Número de usuarios potencialmente abusivos que detectaron durante un período de tiempo. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Total (Suma) | Region , ModelDeploymentName |
PT1M | Sí |
ContentSafety - Riesgos y seguridad | Volumen dañino detectado Número de llamadas realizadas a la API de Azure OpenAI y detectadas como perjudiciales (tanto el modelo de bloque como el modo de anotación) por filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType. |
RAIHarmfulRequests |
Count | Total (Suma) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName , TextType , , Category Severity |
PT1M | Sí |
ContentSafety - Riesgos y seguridad | Volumen bloqueado Número de llamadas realizadas a la API de Azure OpenAI y rechazadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType. |
RAIRejectedRequests |
Count | Total (Suma) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName , , TextType Category |
PT1M | Sí |
ContentSafety - Riesgos y seguridad | Evento del sistema de seguridad Evento del sistema para riesgos y supervisión de seguridad. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: EventType. |
RAISystemEvent |
Count | Average | Region , EventType |
PT1M | Sí |
ContentSafety - Riesgos y seguridad | Número total de volúmenes enviados para la comprobación de seguridad Número de llamadas realizadas a la API de Azure OpenAI y detectadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Total (Suma) | Region , ModelDeploymentName , ModelName , , ModelVersion , ApiName |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Ratelimit El límite de frecuencia actual de la clave ratelimit. No use para el servicio Azure OpenAI. |
Ratelimit |
Count | Total (Suma) | Region , RatelimitKey |
PT1M | Sí |
Recompensas | Promedio de recompensas por evento Recompensa media por evento. |
Reward |
Count | Average | BaselineAction , ChosenActionId , MatchesBaseline , NonDefaultReward , , Mode , RunId |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Errores del servidor Número de llamadas con error interno del servicio (código de respuesta HTTP 5xx). No use para el servicio Azure OpenAI. |
ServerErrors |
Count | Total (Suma) | ApiName , OperationName , , Region , RatelimitKey |
PT1M | Sí |
Repeticiones de características | Repeticiones de características de ranura Número de veces que aparece cada característica de ranura. |
SlotFeatureIdOccurrences |
Count | Total (Suma) | FeatureId , , Mode , RunId |
PT1M | Sí |
Características por evento | Características de ranura por evento Número medio de características de ranura por evento. |
SlotFeaturesPerEvent |
Count | Average | Mode , RunId |
PT1M | Sí |
Slots | Repeticiones de ranuras Número de veces que aparece cada ranura. |
SlotIdOccurrences |
Count | Total (Suma) | SlotId , SlotIndex , , Mode , RunId |
PT1M | Sí |
Espacios de nombres por evento | Espacios de nombres de ranura por evento Número medio de espacios de nombres de ranura por evento. |
SlotNamespacesPerEvent |
Count | Average | Mode , RunId |
PT1M | Sí |
Recompensas | Recompensa de ranura Recompensa por ranura. |
SlotReward |
Count | Average | BaselineActionId , ChosenActionId , MatchesBaseline , NonDefaultReward , SlotId , SlotIndex , , Mode RunId |
PT1M | Sí |
SpeechServices: uso | Transacciones de speaker Recognition Número de transacciones de reconocimiento del hablante. |
SpeakerRecognitionTransactions |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
SpeechServices: uso | Horas de hospedaje del modelo de voz Número de horas de hospedaje del modelo de voz. |
SpeechModelHostingHours |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Duración de la sesión de voz (en desuso) Duración total de la sesión de voz en segundos. |
SpeechSessionDuration |
Segundos | Total (Suma) | ApiName , , OperationName , Region |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Llamadas correctas Número de llamadas correctas. No use para el servicio Azure OpenAI. |
SuccessfulCalls |
Count | Total (Suma) | ApiName , OperationName , , Region , RatelimitKey |
PT1M | Sí |
Cognitive Services: SLI | AvailabilityRate Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500. No use para el servicio Azure OpenAI. |
SuccessRate |
Porcentaje | Mínimo, Máximo, Promedio | ApiName , OperationName , , Region , RatelimitKey |
PT1M | No |
SpeechServices: uso | Caracteres sintetizados Número de caracteres. |
SynthesizedCharacters |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Caracteres de texto traducidos Número de caracteres en la solicitud entrante de traducción de texto. |
TextCharactersTranslated |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Caracteres personalizados de texto traducidos Número de caracteres en la solicitud entrante personalizada de traducción de texto. |
TextCustomCharactersTranslated |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Uso | Caracteres entrenados de texto Número de caracteres entrenados mediante la traducción de texto. |
TextTrainedCharacters |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Azure OpenAI: uso | Tokens de inferencia procesados Número de tokens de inferencia procesados en un modelo de OpenAI. Se calcula como tokens de solicitud (entrada) más tokens generados (salida). Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName. |
TokenTransaction |
Count | Total (Suma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , , Region , ModelVersion |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Total de llamadas Número total de llamadas. No use para el servicio Azure OpenAI. |
TotalCalls |
Count | Total (Suma) | ApiName , OperationName , , Region , RatelimitKey |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Total de errores Número total de llamadas con respuesta de error (código de respuesta HTTP 4xx o 5xx). No use para el servicio Azure OpenAI. |
TotalErrors |
Count | Total (Suma) | ApiName , OperationName , , Region , RatelimitKey |
PT1M | Sí |
Uso | N.º total de eventos Número de eventos. |
TotalEvents |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Cognitive Services: solicitudes HTTP | Total de llamadas de token Número total de llamadas de token. |
TotalTokenCalls |
Count | Total (Suma) | ApiName , , OperationName , Region |
PT1M | Sí |
Uso | Total de transacciones (en desuso) Número total de transacciones. |
TotalTransactions |
Count | Total (Suma) | <none> | PT1M | Sí |
Estimaciones | Recuento de eventos de línea base de usuario Estimación del número de eventos de línea de base definidos por el usuario. |
UserBaselineEventCount |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
Estimaciones | Recompensa de línea base de usuario Estimación de la recompensa de línea de base definida por el usuario. |
UserBaselineReward |
Count | Total (Suma) | Mode , RunId |
PT1M | Sí |
SpeechServices: uso | Segundos de vídeo sintetizados Número de segundos sintetizados |
VideoSecondsSynthesized |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
SpeechServices: uso | Horas de hosting del modelo de voz Número de horas. |
VoiceModelHostingHours |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
SpeechServices: uso | Minutos de entrenamiento del modelo de voz Número de minutos. |
VoiceModelTrainingMinutes |
Count | Total (Suma) | ApiName , FeatureName , , UsageChannel , Region |
PT1M | Sí |
Dimensiones de métricas
Para obtener más información sobre las dimensiones de métricas, consulte Métricas multidimensionales.
Este servicio tiene las siguientes dimensiones asociadas a sus métricas.
- ApiName
- FeatureName
- ModelDeploymentName
- ModelName
- ModelVersion
- OperationName
- Region
- StatusCode
- StreamType
- UsageChannel
Registros del recurso
En esta sección se enumeran los tipos de registros de recursos que se pueden recopilar para este servicio. La sección extrae de la lista de todos los tipos de categorías de registros admitidos en Azure Monitor.
Registros de recursos admitidos para Microsoft.CognitiveServices/accounts
Category | Nombre para mostrar de categoría | Tabla de registro | Admite el plan de registro básico | Admite la transformación en tiempo de ingesta | Consultas de ejemplo | Costos para exportar |
---|---|---|---|---|---|---|
Audit |
Registros de auditoría | AzureDiagnostics Registros de varios recursos de Azure. |
No | N.º | No | |
RequestResponse |
Registros de solicitud y respuesta | AzureDiagnostics Registros de varios recursos de Azure. |
No | N.º | No | |
Trace |
Registros de seguimiento | AzureDiagnostics Registros de varios recursos de Azure. |
No | N.º | No |
Tablas de registros de Azure Monitor
En esta sección, se enumeran todas las tablas de registros de Azure Monitor relacionadas con este servicio y que están disponibles para consulta mediante Log Analytics con consultas de Kusto. Las tablas contienen datos de registro de recursos y, posiblemente, más dependiendo de lo que se recopila y se enrutan a ellos.
Azure OpenAI microsoft.cognitiveservices/accounts
Registro de actividad
En la tabla vinculada se enumeran las operaciones que se pueden registrar en el registro de actividad de este servicio. Estas operaciones son un subconjunto de todas las posibles operaciones del proveedor de recursos en el registro de actividad.
Para obtener más información sobre el esquema de las entradas del registro de actividad, consulte Esquema del registro de actividad.
Contenido relacionado
- Consulte Supervisión de Azure OpenAI para obtener una descripción de la supervisión de Azure OpenAI.
- Consulte Supervisión de los recursos de Azure con Azure Monitor para obtener información sobre la supervisión de los recursos de Azure.