Referência de dados de monitoramento do OpenAI do Azure

Artigo
01/03/2025

Este artigo contém todas as informações de referência de monitoramento para este serviço.

Consulte Monitorar o Azure OpenAI para obter detalhes sobre os dados que você pode coletar para o Serviço OpenAI do Azure e como usá-los.

Métricas

Esta seção lista todas as métricas da plataforma coletadas automaticamente para este serviço. Essas métricas também fazem parte da lista global de todas as métricas da plataforma com suporte no Azure Monitor.

Para obter informações sobre retenção de métricas, consulte Visão geral das métricas do Azure Monitor.

Métricas com suporte para Microsoft.CognitiveServices/accounts

Aqui estão as métricas mais importantes que achamos que você deve monitorar para o Azure OpenAI. Mais adiante neste artigo, há uma lista mais longa de todas as métricas de serviços de IA do Azure disponíveis, que contém mais detalhes sobre as métricas nessa lista mais curta.

Solicitações do OpenAI do Azure
Tokens ativos
Tokens de conclusão gerados
Horas de treinamento ajustadas processadas
Tokens de inferência processados
Tokens de prompt processados
Utilização gerenciada provisionada V2
Solicitar taxa de correspondência de cache de token
Tempo de resposta
Tempo entre tokens
Tempo até o último byte
Tempo normalizado para o primeiro byte

Você também pode monitorar as métricas de Segurança de Conteúdo usadas por outros serviços de IA do Azure.

Volume bloqueado
Volume prejudicial detectado
Contagem de usuários potencialmente abusivos
Evento do Sistema de Segurança
Volume total enviado para verificação de segurança

Observação

A métrica de Utilização Gerenciada Provisionada agora está obsoleta e não é mais recomendada. Essa métrica foi substituída pela métrica de Utilização gerenciada por Provisionamento V2.

As métricas dos Serviços Cognitivos têm a categoria Serviços Cognitivos – Solicitações HTTP na tabela a seguir. Essas métricas são métricas herdadas comuns a todos os recursos dos Serviços de IA do Azure. A Microsoft não recomenda mais que você use essas métricas com o Azure OpenAI.

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.CognitiveServices/accounts.

Nem todas as colunas podem estar presentes em todas as tabelas.
Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para exibir todas as colunas disponíveis.

Títulos de tabela

Categoria: o grupo ou classificação de métricas.
Métrica: o nome de exibição da métrica como aparece no portal do Azure.
Nome na API REST: o nome da métrica, conforme mencionado na API REST.
Unidade: unidade de medida
Agregação: o tipo de agregação padrão. Valores válidos: Médio (Méd.), Mínimo (Mín.), Máximo (Máx.), Total (Soma), Contagem.
Dimensões: as Dimensões disponíveis para a métrica.
Intervalos de agregação: os Intervalos em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
Exportação de DS: se a métrica é exportável para os Logs do Azure Monitor via configurações de diagnóstico. Para obter mais informações sobre exportação de métricas, consulte as Criar configurações de diagnóstico no Azure Monitor.

Categoria	Metric	Nome na API REST	Unidade	Agregação	Dimensões	Granularidade de tempo	Exportação de DS
Ocorrências de recursos	Ocorrências de recursos de ação Número de vezes que cada recurso de ação aparece.	`ActionFeatureIdOccurrences`	Count	Total (Soma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
Recursos por evento	Recursos de ação por evento Número médio de recursos de ação por evento.	`ActionFeaturesPerEvent`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Ações	Ocorrências de ação Número de vezes que cada ação aparece.	`ActionIdOccurrences`	Count	Total (Soma)	`ActionId`, `Mode`, `RunId`	PT1M	Sim
Namespaces por evento	Namespaces de ação por evento Número médio de namespaces da ação por evento.	`ActionNamespacesPerEvent`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Ações	Ações por evento Número de ações por evento.	`ActionsPerEvent`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
OpenAI do Azure – Uso	Tokens ativos Total de tokens menos os tokens armazenados em cache durante um período. Aplica-se à PTU e a SKUs gerenciados por PTU. Use essa métrica para entender sua utilização baseada em TPS ou TPM para PTUs e compare com seus parâmetros de comparação para TPS ou TPM de destino para seus cenários. Para detalhar as solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion.	`ActiveTokens`	Count	Mínimo, Máximo, Média, Total (Soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Sim
SpeechServices - Uso	Segundos de áudio transcritos Número de segundos transcritos	`AudioSecondsTranscribed`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Uso	Segundos de áudio traduzidos Número de segundos traduzidos	`AudioSecondsTranslated`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Uso	Segundos de Hosting do Modelo de Avatar Número de segundos.	`AvatarModelHostingSeconds`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Azure OpenAI – Solicitações HTTP	Solicitar taxa de correspondência de cache de token A porcentagem dos tokens de prompt atingiu o cache, disponível para gerenciamento de PTU.	`AzureOpenAIContextTokensCacheMatchRate`	Porcentagem	Mínimo, Máximo, Média	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
OpenAI do Azure – Uso	Utilização gerenciada provisionada % de utilização para uma implantação gerenciada pela Provisão, calculada como (PTUs consumidas/PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (solicitações de streaming versus não streaming)	`AzureOpenAIProvisionedManagedUtilization`	Porcentagem	Mínimo, Máximo, Média	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
OpenAI do Azure – Uso	Utilização gerenciada provisionada V2 % de utilização para uma implantação gerenciada pela Provisão, calculada como (PTUs consumidas/PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (solicitações de streaming versus não streaming)	`AzureOpenAIProvisionedManagedUtilizationV2`	Porcentagem	Mínimo, Máximo, Média	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Azure OpenAI – Solicitações HTTP	Solicitações do OpenAI do Azure Número de chamadas feitas para a API do OpenAI do Azure durante um período de tempo. Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar as solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (bem-sucedido, clienterrors, erros de servidor), StreamType (solicitações de streaming versus não streaming) e operação.	`AzureOpenAIRequests`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersion`, , `StatusCode`	PT1M	Sim
Azure OpenAI – Solicitações HTTP	Tempo de resposta Medida de latência recomendada (capacidade de resposta) para solicitações de streaming. Aplica-se à PTU e a SKUs gerenciados por PTU. Calculado conforme o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho da solicitação aumenta e/ou o tamanho da ocorrência no cache é reduzido. Para detalhar o tempo de resposta métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Observação: essa métrica é uma aproximação, pois a latência medida depende muito de vários fatores, incluindo chamadas simultâneas e padrão de carga de trabalho geral. Além disso, ele não leva em conta nenhuma latência do lado do cliente que possa existir entre o cliente e o endpoint da API. Consulte seu próprio registro em log para o acompanhamento da latência ideal.	`AzureOpenAITimeToResponse`	MilliSeconds	Mínimo, Máximo, Média	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersion`, , `StatusCode`	PT1M	Sim
Slots	Recompensa geral do estimador de linha de base Recompensa geral do avaliador de linha de base.	`BaselineEstimatorOverallReward`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Slots	Recompensa do Espaço do Estimador de Linha de Base Recompensa do avaliador de linha de base por slot.	`BaselineEstimatorSlotReward`	Contagem	Média	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Slots	Recompensa geral do estimador aleatório da linha de base Recompensa geral do avaliador aleatório de linha de base.	`BaselineRandomEstimatorOverallReward`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Slots	Recompensa do slot do estimador aleatório de linha de base Recompensa do avaliador aleatório de linha de base por slot.	`BaselineRandomEstimatorSlotReward`	Contagem	Média	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Estimativas	Contagem de eventos aleatórios de linha de base Estimativa da contagem de eventos aleatórios de linha de base.	`BaselineRandomEventCount`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Estimativas	Recompensa aleatória de linha de base Estimativa da recompensa aleatória de linha de base.	`BaselineRandomReward`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Chamadas bloqueadas Número de chamadas que excederam a taxa ou o limite de cota. Não use para o serviço OpenAI do Azure.	`BlockedCalls`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Uso	Contagem de inferência Contagem de Inferência do Serviço Carnegie Frontdoor	`CarnegieInferenceCount`	Count	Total (Soma)	`Region`, `Modality`, `Category`, `Language`, `SeverityLevel`, , `UseCustomList`	PT1M	Sim
Uso	Personagens treinados (obsoletos) Número total de caracteres treinados.	`CharactersTrained`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Uso	Caracteres traduzidos (obsoletos) Número total de caracteres na solicitação de texto de entrada.	`CharactersTranslated`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Erros do cliente Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o serviço OpenAI do Azure.	`ClientErrors`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Uso	Transações de Pesquisa Visual Computacional Numero de Transações de Pesquisa Visual Computacional	`ComputerVisionTransactions`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
ContentSafety - Uso	Contagem de chamadas para moderação de imagem Número de chamadas para moderação de imagem.	`ContentSafetyImageAnalyzeRequestCount`	Count	Total (Soma)	`ApiVersion`	PT1M	Sim
ContentSafety - Uso	Contagem de chamadas para moderação de texto Número de chamadas para moderação de texto.	`ContentSafetyTextAnalyzeRequestCount`	Count	Total (Soma)	`ApiVersion`	PT1M	Sim
Ocorrências de recursos	Ocorrências de recursos de contexto Número de vezes que cada recurso de contexto aparece.	`ContextFeatureIdOccurrences`	Count	Total (Soma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
Recursos por evento	Recursos de contexto por evento Número de recursos de contexto por evento.	`ContextFeaturesPerEvent`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Namespaces por evento	Namespaces de contexto por evento Número de namespaces de contexto por evento.	`ContextNamespacesPerEvent`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Uso	Tempo de treinamento de visão personalizada Tempo de treinamento de Visão Personalizada	`CustomVisionTrainingTime`	Segundos	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Transações de Visão Personalizada Número de transações de previsão de Visão Personalizada	`CustomVisionTransactions`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Entrada de Dados Tamanho dos dados de entrada em bytes. Não use para o serviço OpenAI do Azure.	`DataIn`	Bytes	Total (Soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Saída de dados Tamanho dos dados de saída em bytes. Não use para o serviço OpenAI do Azure.	`DataOut`	Bytes	Total (Soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Uso	Caracteres do documento traduzidos Número de caracteres na solicitação de tradução do documento.	`DocumentCharactersTranslated`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Caracteres personalizados do documento traduzidos Número de caracteres na solicitação de tradução do documento personalizado.	`DocumentCustomCharactersTranslated`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Imagens de rosto treinadas Número de imagens treinadas. 1\.000 imagens treinadas por transação.	`FaceImagesTrained`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Rostos armazenados Número de rostos armazenados, rateado por dia. O número de rostos armazenados é relatado diariamente.	`FacesStored`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Transações de face Número de chamadas à API feitas para o serviço de detecção facial	`FaceTransactions`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
RecursoCardinalidade	Cardinalidade de recursos por ação Cardinalidade do recurso com base na ação.	`FeatureCardinality_Action`	Contagem	Média	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
RecursoCardinalidade	Cardinalidade de recursos por contexto Cardinalidade do recurso com base no contexto.	`FeatureCardinality_Context`	Contagem	Média	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
RecursoCardinalidade	Cardinalidade de recursos por slot Cardinalidade do recurso com base no slot.	`FeatureCardinality_Slot`	Contagem	Média	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
OpenAI do Azure – Uso	Horas de treinamento FineTuned processadas Número de horas de treinamento processadas em um modelo OpenAI ajustado	`FineTunedTrainingHours`	Count	Total (Soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
OpenAI do Azure – Uso	Tokens de conclusão gerados Número de tokens gerados (saída) de um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`GeneratedTokens`	Count	Total (Soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, , `ModelVersion`	PT1M	Sim
Uso	Imagens armazenadas Número de imagens de Visão Personalizada armazenadas.	`ImagesStored`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Latência Latência em milissegundos. Não use para o serviço OpenAI do Azure.	`Latency`	MilliSeconds	Média	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Uso	Eventos Aprendidos Número de eventos aprendidos.	`LearnedEvents`	Count	Total (Soma)	`IsMatchBaseline`, `Mode`, `RunId`	PT1M	Sim
Uso	Solicitações de Fala do LUIS Número de solicitações de reconhecimento vocal e conversão de fala em intenção	`LUISSpeechRequests`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Solicitações de texto do LUIS Número de solicitações de texto de reconhecimento vocal	`LUISTextRequests`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Recompensas Correspondentes Número de recompensas correspondentes.	`MatchedRewards`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Uso	Eventos não ativados Número de eventos ignorados.	`NonActivatedEvents`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Slots	Slots Número de slots por evento.	`NumberOfSlots`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
SpeechServices - Uso	Número de perfis de alto-falante Número de perfis de orador inscritos. Rateado por hora.	`NumberofSpeakerProfiles`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Recompensas observadas Número de recompensas observadas.	`ObservedRewards`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Uso	Caracteres de sincronização de documentos traduzidos Número de caracteres na solicitação de tradução de documento (síncrona).	`OneDocumentCharactersTranslated`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Slots	Recompensa geral do estimador online Recompensa geral do avaliador online.	`OnlineEstimatorOverallReward`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Slots	Recompensa do Slot Estimator Online Recompensa do avaliador online por slot.	`OnlineEstimatorSlotReward`	Contagem	Média	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Estimativas	Contagem de eventos online Estimativa para a contagem de eventos online.	`OnlineEventCount`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Estimativas	Recompensa Online Estimativa de recompensa online.	`OnlineReward`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Uso	Caracteres processados Número de caracteres processados por Leitura Avançada.	`ProcessedCharacters`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Registros de texto de saúde processados Número de registros de texto de integridade processados	`ProcessedHealthTextRecords`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Imagens processadas Número de imagens processadas	`ProcessedImages`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Páginas processadas Número de páginas processadas	`ProcessedPages`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
OpenAI do Azure – Uso	Tokens de prompt processados Número de tokens de prompt processados (entrada) em um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`ProcessedPromptTokens`	Count	Total (Soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, , `ModelVersion`	PT1M	Sim
Uso	Registros de texto processados Contagem de registros de texto.	`ProcessedTextRecords`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Registros de texto de controle de qualidade Número de registros de texto processados	`QuestionAnsweringTextRecords`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
ContentSafety - Riscos e Segurança	Contagem de usuários potencialmente abusivos Número de usuários potencialmente abusivos detectados durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName.	`RAIAbusiveUsersCount`	Count	Total (Soma)	`Region`, `ModelDeploymentName`	PT1M	Sim
ContentSafety - Riscos e Segurança	Volume prejudicial detectado Número de chamadas feitas para a API do OpenAI do Azure e detectadas como prejudiciais (modelo de bloco e modo de anotação) pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.	`RAIHarmfulRequests`	Count	Total (Soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, `TextType`, , `Category`, , `Severity`	PT1M	Sim
ContentSafety - Riscos e Segurança	Volume bloqueado Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.	`RAIRejectedRequests`	Count	Total (Soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, `TextType`, , `Category`	PT1M	Sim
ContentSafety - Riscos e Segurança	Evento do Sistema de Segurança Evento do sistema para monitoramento de riscos e segurança. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: EventType.	`RAISystemEvent`	Contagem	Média	`Region`, `EventType`	PT1M	Sim
ContentSafety - Riscos e Segurança	Volume total enviado para verificação de segurança Número de chamadas feitas para a API OpenAI do Azure e detectadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName.	`RAITotalRequests`	Count	Total (Soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Limite de taxa O ratelimit atual da chave ratelimit. Não use para o serviço OpenAI do Azure.	`Ratelimit`	Count	Total (Soma)	`Region`, `RatelimitKey`	PT1M	Sim
Recompensas	Recompensa média por evento Recompensa média por evento.	`Reward`	Contagem	Média	`BaselineAction`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `Mode`, , `RunId`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Erros do Servidor Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o serviço OpenAI do Azure.	`ServerErrors`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Ocorrências de recursos	Ocorrências de recursos de slot Número de vezes que cada recurso de slot aparece.	`SlotFeatureIdOccurrences`	Count	Total (Soma)	`FeatureId`, `Mode`, `RunId`	PT1M	Sim
Recursos por evento	Recursos do slot por evento Número médio de recursos de slot por evento.	`SlotFeaturesPerEvent`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Slots	Ocorrências de slot Número de vezes que cada slot é exibido.	`SlotIdOccurrences`	Count	Total (Soma)	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Sim
Namespaces por evento	Namespaces de slot por evento Número médio de namespaces do slot por evento.	`SlotNamespacesPerEvent`	Contagem	Média	`Mode`, `RunId`	PT1M	Sim
Recompensas	Recompensa do slot Recompensa por slot.	`SlotReward`	Contagem	Média	`BaselineActionId`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `SlotId`, `SlotIndex`, , `Mode`, , `RunId`	PT1M	Sim
SpeechServices - Uso	Transações de reconhecimento de locutor Número de Transações de Reconhecimento do Locutor	`SpeakerRecognitionTransactions`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Uso	Horário de hospedagem do modelo de fala Número de horas de hospedagem do modelo de fala	`SpeechModelHostingHours`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Duração da Sessão de Fala (Preterida) Duração total da sessão de fala em segundos.	`SpeechSessionDuration`	Segundos	Total (Soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Chamadas bem-sucedidas Número de chamadas com êxito. Não use para o serviço OpenAI do Azure.	`SuccessfulCalls`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Serviços Cognitivos – SLI	Taxa de disponibilidade Percentual de disponibilidade com o seguinte cálculo: (Total de Chamadas – Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas HTTP >=500. Não use para o serviço OpenAI do Azure.	`SuccessRate`	Porcentagem	Mínimo, Máximo, Média	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Não
SpeechServices - Uso	Caracteres Sintetizados Número de caracteres.	`SynthesizedCharacters`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Caracteres de texto traduzidos Número de caracteres na solicitação de tradução do texto de entrada.	`TextCharactersTranslated`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Caracteres personalizados de texto traduzidos Número de caracteres na solicitação de tradução do texto personalizado de entrada.	`TextCustomCharactersTranslated`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
Uso	Caracteres treinados em texto Número de caracteres treinados usando a tradução de texto.	`TextTrainedCharacters`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
OpenAI do Azure – Uso	Tokens de inferência processados Número de tokens de inferência processados em um modelo OpenAI. Calculado como tokens de prompt (entrada) mais tokens gerados (saída). Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`TokenTransaction`	Count	Total (Soma)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, , `ModelVersion`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Total de chamadas Número total de chamadas. Não use para o serviço OpenAI do Azure.	`TotalCalls`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Total de Erros Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o serviço OpenAI do Azure.	`TotalErrors`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Sim
Uso	Total de eventos Número de eventos.	`TotalEvents`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Serviços Cognitivos – Solicitações HTTP	Total de chamadas de token Número total de chamadas de token.	`TotalTokenCalls`	Count	Total (Soma)	`ApiName`, `OperationName`, `Region`	PT1M	Sim
Uso	Total de transações (preterido) Número total de transações.	`TotalTransactions`	Count	Total (Soma)	<none>	PT1M	Sim
Estimativas	Contagem de eventos de linha de base do usuário Estimativa da contagem de eventos de linha de base definida pelo usuário.	`UserBaselineEventCount`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
Estimativas	Recompensa da linha de base do usuário Estimativa da recompensa de linha de base definida pelo usuário.	`UserBaselineReward`	Count	Total (Soma)	`Mode`, `RunId`	PT1M	Sim
SpeechServices - Uso	Segundos de Vídeo Sintetizados Número de segundos sintetizados	`VideoSecondsSynthesized`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Uso	Horas de Hosting do Modelo de Voz Número de horas.	`VoiceModelHostingHours`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Sim
SpeechServices - Uso	Minutos de treinamento do modelo de voz Número de minutos.	`VoiceModelTrainingMinutes`	Count	Total (Soma)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes

Dimensões de métrica

Para obter mais informações sobre o que são dimensões de métrica, confira Métricas multidimensionais.

Este serviço tem as dimensões a seguir associadas a essas métricas.

ApiName
FeatureName
Nome_da_Implantação_do_Modelo
ModelName
Versão do modelo
OperationName
Region
StatusCode
StreamType
Canal de Uso

Logs de recursos

Esta seção lista os tipos de logs de recursos que você pode coletar para o este serviço. A seção extrai da lista de todos os tipos de categoria de logs de recursos com suporte no Azure Monitor.

Logs de recursos com suporte para Microsoft.CognitiveServices/accounts

Categoria	Nome de exibição da categoria	Tabela de log	Com suporte a plano de log básico	Com suporte a transformações de tempo-ingestão	Custos para exportar
`Audit`	Logs de Auditoria	AzureDiagnostics Logs de vários recursos do Azure.	Não	No	Não
`RequestResponse`	Logs de Solicitação e Resposta	AzureDiagnostics Logs de vários recursos do Azure.	Não	No	Não
`Trace`	Logs de rastreamento	AzureDiagnostics Logs de vários recursos do Azure.	Não	No	No

Tabelas de Logs do Azure Monitor

Esta seção lista todas as tabelas dos Logs do Azure Monitor relevantes para este serviço e disponíveis para consulta pela análise de logs usando o Kusto. As tabelas contêm dados de log de recursos e possivelmente mais, dependendo do que é coletado e roteado para elas.

OpenAI do Azure microsoft.cognitiveservices/accounts

Log de atividades

A tabela vinculada lista as operações que podem ser registradas no log de atividades desse serviço. Essas operações são um subconjunto de todas as operações do provedor de recursos possíveis no log de atividades.

Para obter mais informações sobre o esquema de entradas do log de atividades, confira Esquema do log de atividades.

Operações do provedor de recursos de IA + aprendizado de máquina

Consulte Monitorar o Azure OpenAI para obter uma descrição do monitoramento do Azure OpenAI.
Confira Monitorar recursos do Azure com o Azure Monitor para ver informações detalhadas sobre o monitoramento dos recursos do Azure.

Compartilhar via

Referência de dados de monitoramento do OpenAI do Azure

Métricas

Métricas com suporte para Microsoft.CognitiveServices/accounts

Dimensões de métrica

Logs de recursos

Logs de recursos com suporte para Microsoft.CognitiveServices/accounts

Tabelas de Logs do Azure Monitor

OpenAI do Azure microsoft.cognitiveservices/accounts

Log de atividades

Comentários

Recursos adicionais

Compartilhar via

Referência de dados de monitoramento do OpenAI do Azure

Métricas

Métricas com suporte para Microsoft.CognitiveServices/accounts

Dimensões de métrica

Logs de recursos

Logs de recursos com suporte para Microsoft.CognitiveServices/accounts

Tabelas de Logs do Azure Monitor

OpenAI do Azure microsoft.cognitiveservices/accounts

Log de atividades

Conteúdo relacionado

Comentários

Recursos adicionais