Referência de dados de monitoramento do OpenAI do Azure
Este artigo contém todas as informações de referência de monitoramento para este serviço.
Consulte Monitorar o Azure OpenAI para obter detalhes sobre os dados que você pode coletar para o Serviço OpenAI do Azure e como usá-los.
Métricas
Esta seção lista todas as métricas da plataforma coletadas automaticamente para este serviço. Essas métricas também fazem parte da lista global de todas as métricas da plataforma com suporte no Azure Monitor.
Para obter informações sobre retenção de métricas, consulte Visão geral das métricas do Azure Monitor.
Métricas com suporte para Microsoft.CognitiveServices/accounts
Aqui estão as métricas mais importantes que achamos que você deve monitorar para o Azure OpenAI. Mais adiante neste artigo, há uma lista mais longa de todas as métricas de serviços de IA do Azure disponíveis, que contém mais detalhes sobre as métricas nessa lista mais curta.
Solicitações do OpenAI do Azure
Tokens ativos
Tokens de conclusão gerados
Horas de treinamento ajustadas processadas
Tokens de inferência processados
Tokens de prompt processados
Utilização gerenciada provisionada V2
Solicitar taxa de correspondência de cache de token
Tempo de resposta
Tempo entre tokens
Tempo até o último byte
Tempo normalizado para o primeiro byte
Você também pode monitorar as métricas de Segurança de Conteúdo usadas por outros serviços de IA do Azure.
- Volume bloqueado
- Volume prejudicial detectado
- Contagem de usuários potencialmente abusivos
- Evento do Sistema de Segurança
- Volume total enviado para verificação de segurança
Observação
A métrica de Utilização Gerenciada Provisionada agora está obsoleta e não é mais recomendada. Essa métrica foi substituída pela métrica de Utilização gerenciada por Provisionamento V2.
As métricas dos Serviços Cognitivos têm a categoria Serviços Cognitivos – Solicitações HTTP na tabela a seguir. Essas métricas são métricas herdadas comuns a todos os recursos dos Serviços de IA do Azure. A Microsoft não recomenda mais que você use essas métricas com o Azure OpenAI.
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.CognitiveServices/accounts.
- Nem todas as colunas podem estar presentes em todas as tabelas.
- Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para exibir todas as colunas disponíveis.
Títulos de tabela
- Categoria: o grupo ou classificação de métricas.
- Métrica: o nome de exibição da métrica como aparece no portal do Azure.
- Nome na API REST: o nome da métrica, conforme mencionado na API REST.
- Unidade: unidade de medida
- Agregação: o tipo de agregação padrão. Valores válidos: Médio (Méd.), Mínimo (Mín.), Máximo (Máx.), Total (Soma), Contagem.
- Dimensões: as Dimensões disponíveis para a métrica.
- Intervalos de agregação: os Intervalos em que a métrica é amostrada. Por exemplo,
PT1M
indica que a métrica é amostrada a cada minuto,PT30M
a cada 30 minutos,PT1H
a cada hora e assim por diante. - Exportação de DS: se a métrica é exportável para os Logs do Azure Monitor via configurações de diagnóstico. Para obter mais informações sobre exportação de métricas, consulte as Criar configurações de diagnóstico no Azure Monitor.
Categoria | Metric | Nome na API REST | Unidade | Agregação | Dimensões | Granularidade de tempo | Exportação de DS |
---|---|---|---|---|---|---|---|
Ocorrências de recursos | Ocorrências de recursos de ação Número de vezes que cada recurso de ação aparece. |
ActionFeatureIdOccurrences |
Count | Total (Soma) | FeatureId , Mode , RunId |
PT1M | Sim |
Recursos por evento | Recursos de ação por evento Número médio de recursos de ação por evento. |
ActionFeaturesPerEvent |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Ações | Ocorrências de ação Número de vezes que cada ação aparece. |
ActionIdOccurrences |
Count | Total (Soma) | ActionId , Mode , RunId |
PT1M | Sim |
Namespaces por evento | Namespaces de ação por evento Número médio de namespaces da ação por evento. |
ActionNamespacesPerEvent |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Ações | Ações por evento Número de ações por evento. |
ActionsPerEvent |
Contagem | Média | Mode , RunId |
PT1M | Sim |
OpenAI do Azure – Uso | Tokens ativos Total de tokens menos os tokens armazenados em cache durante um período. Aplica-se à PTU e a SKUs gerenciados por PTU. Use essa métrica para entender sua utilização baseada em TPS ou TPM para PTUs e compare com seus parâmetros de comparação para TPS ou TPM de destino para seus cenários. Para detalhar as solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. |
ActiveTokens |
Count | Mínimo, Máximo, Média, Total (Soma) | Region , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Sim |
SpeechServices - Uso | Segundos de áudio transcritos Número de segundos transcritos |
AudioSecondsTranscribed |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Uso | Segundos de áudio traduzidos Número de segundos traduzidos |
AudioSecondsTranslated |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Uso | Segundos de Hosting do Modelo de Avatar Número de segundos. |
AvatarModelHostingSeconds |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Azure OpenAI – Solicitações HTTP | Solicitar taxa de correspondência de cache de token A porcentagem dos tokens de prompt atingiu o cache, disponível para gerenciamento de PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Porcentagem | Mínimo, Máximo, Média | Region , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Não |
OpenAI do Azure – Uso | Utilização gerenciada provisionada % de utilização para uma implantação gerenciada pela Provisão, calculada como (PTUs consumidas/PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (solicitações de streaming versus não streaming) |
AzureOpenAIProvisionedManagedUtilization |
Porcentagem | Mínimo, Máximo, Média | Region , StreamType , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Não |
OpenAI do Azure – Uso | Utilização gerenciada provisionada V2 % de utilização para uma implantação gerenciada pela Provisão, calculada como (PTUs consumidas/PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (solicitações de streaming versus não streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Porcentagem | Mínimo, Máximo, Média | Region , StreamType , ModelDeploymentName , ModelName , ModelVersion |
PT1M | Não |
Azure OpenAI – Solicitações HTTP | Solicitações do OpenAI do Azure Número de chamadas feitas para a API do OpenAI do Azure durante um período de tempo. Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar as solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (bem-sucedido, clienterrors, erros de servidor), StreamType (solicitações de streaming versus não streaming) e operação. |
AzureOpenAIRequests |
Count | Total (Soma) | ApiName , OperationName , Region , StreamType , ModelDeploymentName , ModelName , , ModelVersion , , StatusCode |
PT1M | Sim |
Azure OpenAI – Solicitações HTTP | Tempo de resposta Medida de latência recomendada (capacidade de resposta) para solicitações de streaming. Aplica-se à PTU e a SKUs gerenciados por PTU. Calculado conforme o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho da solicitação aumenta e/ou o tamanho da ocorrência no cache é reduzido. Para detalhar o tempo de resposta métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Observação: essa métrica é uma aproximação, pois a latência medida depende muito de vários fatores, incluindo chamadas simultâneas e padrão de carga de trabalho geral. Além disso, ele não leva em conta nenhuma latência do lado do cliente que possa existir entre o cliente e o endpoint da API. Consulte seu próprio registro em log para o acompanhamento da latência ideal. |
AzureOpenAITimeToResponse |
MilliSeconds | Mínimo, Máximo, Média | ApiName , OperationName , Region , StreamType , ModelDeploymentName , ModelName , , ModelVersion , , StatusCode |
PT1M | Sim |
Slots | Recompensa geral do estimador de linha de base Recompensa geral do avaliador de linha de base. |
BaselineEstimatorOverallReward |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Slots | Recompensa do Espaço do Estimador de Linha de Base Recompensa do avaliador de linha de base por slot. |
BaselineEstimatorSlotReward |
Contagem | Média | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Slots | Recompensa geral do estimador aleatório da linha de base Recompensa geral do avaliador aleatório de linha de base. |
BaselineRandomEstimatorOverallReward |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Slots | Recompensa do slot do estimador aleatório de linha de base Recompensa do avaliador aleatório de linha de base por slot. |
BaselineRandomEstimatorSlotReward |
Contagem | Média | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Estimativas | Contagem de eventos aleatórios de linha de base Estimativa da contagem de eventos aleatórios de linha de base. |
BaselineRandomEventCount |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Estimativas | Recompensa aleatória de linha de base Estimativa da recompensa aleatória de linha de base. |
BaselineRandomReward |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Chamadas bloqueadas Número de chamadas que excederam a taxa ou o limite de cota. Não use para o serviço OpenAI do Azure. |
BlockedCalls |
Count | Total (Soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Uso | Contagem de inferência Contagem de Inferência do Serviço Carnegie Frontdoor |
CarnegieInferenceCount |
Count | Total (Soma) | Region , Modality , Category , Language , SeverityLevel , , UseCustomList |
PT1M | Sim |
Uso | Personagens treinados (obsoletos) Número total de caracteres treinados. |
CharactersTrained |
Count | Total (Soma) | ApiName , OperationName , Region |
PT1M | Sim |
Uso | Caracteres traduzidos (obsoletos) Número total de caracteres na solicitação de texto de entrada. |
CharactersTranslated |
Count | Total (Soma) | ApiName , OperationName , Region |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Erros do cliente Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o serviço OpenAI do Azure. |
ClientErrors |
Count | Total (Soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Uso | Transações de Pesquisa Visual Computacional Numero de Transações de Pesquisa Visual Computacional |
ComputerVisionTransactions |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
ContentSafety - Uso | Contagem de chamadas para moderação de imagem Número de chamadas para moderação de imagem. |
ContentSafetyImageAnalyzeRequestCount |
Count | Total (Soma) | ApiVersion |
PT1M | Sim |
ContentSafety - Uso | Contagem de chamadas para moderação de texto Número de chamadas para moderação de texto. |
ContentSafetyTextAnalyzeRequestCount |
Count | Total (Soma) | ApiVersion |
PT1M | Sim |
Ocorrências de recursos | Ocorrências de recursos de contexto Número de vezes que cada recurso de contexto aparece. |
ContextFeatureIdOccurrences |
Count | Total (Soma) | FeatureId , Mode , RunId |
PT1M | Sim |
Recursos por evento | Recursos de contexto por evento Número de recursos de contexto por evento. |
ContextFeaturesPerEvent |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Namespaces por evento | Namespaces de contexto por evento Número de namespaces de contexto por evento. |
ContextNamespacesPerEvent |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Uso | Tempo de treinamento de visão personalizada Tempo de treinamento de Visão Personalizada |
CustomVisionTrainingTime |
Segundos | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Transações de Visão Personalizada Número de transações de previsão de Visão Personalizada |
CustomVisionTransactions |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Entrada de Dados Tamanho dos dados de entrada em bytes. Não use para o serviço OpenAI do Azure. |
DataIn |
Bytes | Total (Soma) | ApiName , OperationName , Region |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Saída de dados Tamanho dos dados de saída em bytes. Não use para o serviço OpenAI do Azure. |
DataOut |
Bytes | Total (Soma) | ApiName , OperationName , Region |
PT1M | Sim |
Uso | Caracteres do documento traduzidos Número de caracteres na solicitação de tradução do documento. |
DocumentCharactersTranslated |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Caracteres personalizados do documento traduzidos Número de caracteres na solicitação de tradução do documento personalizado. |
DocumentCustomCharactersTranslated |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Imagens de rosto treinadas Número de imagens treinadas. 1\.000 imagens treinadas por transação. |
FaceImagesTrained |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Rostos armazenados Número de rostos armazenados, rateado por dia. O número de rostos armazenados é relatado diariamente. |
FacesStored |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Transações de face Número de chamadas à API feitas para o serviço de detecção facial |
FaceTransactions |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
RecursoCardinalidade | Cardinalidade de recursos por ação Cardinalidade do recurso com base na ação. |
FeatureCardinality_Action |
Contagem | Média | FeatureId , Mode , RunId |
PT1M | Sim |
RecursoCardinalidade | Cardinalidade de recursos por contexto Cardinalidade do recurso com base no contexto. |
FeatureCardinality_Context |
Contagem | Média | FeatureId , Mode , RunId |
PT1M | Sim |
RecursoCardinalidade | Cardinalidade de recursos por slot Cardinalidade do recurso com base no slot. |
FeatureCardinality_Slot |
Contagem | Média | FeatureId , Mode , RunId |
PT1M | Sim |
OpenAI do Azure – Uso | Horas de treinamento FineTuned processadas Número de horas de treinamento processadas em um modelo OpenAI ajustado |
FineTunedTrainingHours |
Count | Total (Soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region |
PT1M | Sim |
OpenAI do Azure – Uso | Tokens de conclusão gerados Número de tokens gerados (saída) de um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
GeneratedTokens |
Count | Total (Soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region , , ModelVersion |
PT1M | Sim |
Uso | Imagens armazenadas Número de imagens de Visão Personalizada armazenadas. |
ImagesStored |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Latência Latência em milissegundos. Não use para o serviço OpenAI do Azure. |
Latency |
MilliSeconds | Média | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Uso | Eventos Aprendidos Número de eventos aprendidos. |
LearnedEvents |
Count | Total (Soma) | IsMatchBaseline , Mode , RunId |
PT1M | Sim |
Uso | Solicitações de Fala do LUIS Número de solicitações de reconhecimento vocal e conversão de fala em intenção |
LUISSpeechRequests |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Solicitações de texto do LUIS Número de solicitações de texto de reconhecimento vocal |
LUISTextRequests |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Recompensas Correspondentes Número de recompensas correspondentes. |
MatchedRewards |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Uso | Eventos não ativados Número de eventos ignorados. |
NonActivatedEvents |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Slots | Slots Número de slots por evento. |
NumberOfSlots |
Contagem | Média | Mode , RunId |
PT1M | Sim |
SpeechServices - Uso | Número de perfis de alto-falante Número de perfis de orador inscritos. Rateado por hora. |
NumberofSpeakerProfiles |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Recompensas observadas Número de recompensas observadas. |
ObservedRewards |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Uso | Caracteres de sincronização de documentos traduzidos Número de caracteres na solicitação de tradução de documento (síncrona). |
OneDocumentCharactersTranslated |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Slots | Recompensa geral do estimador online Recompensa geral do avaliador online. |
OnlineEstimatorOverallReward |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Slots | Recompensa do Slot Estimator Online Recompensa do avaliador online por slot. |
OnlineEstimatorSlotReward |
Contagem | Média | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Estimativas | Contagem de eventos online Estimativa para a contagem de eventos online. |
OnlineEventCount |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Estimativas | Recompensa Online Estimativa de recompensa online. |
OnlineReward |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Uso | Caracteres processados Número de caracteres processados por Leitura Avançada. |
ProcessedCharacters |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Registros de texto de saúde processados Número de registros de texto de integridade processados |
ProcessedHealthTextRecords |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Imagens processadas Número de imagens processadas |
ProcessedImages |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Páginas processadas Número de páginas processadas |
ProcessedPages |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
OpenAI do Azure – Uso | Tokens de prompt processados Número de tokens de prompt processados (entrada) em um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
ProcessedPromptTokens |
Count | Total (Soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region , , ModelVersion |
PT1M | Sim |
Uso | Registros de texto processados Contagem de registros de texto. |
ProcessedTextRecords |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Registros de texto de controle de qualidade Número de registros de texto processados |
QuestionAnsweringTextRecords |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Contagem de usuários potencialmente abusivos Número de usuários potencialmente abusivos detectados durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Total (Soma) | Region , ModelDeploymentName |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Volume prejudicial detectado Número de chamadas feitas para a API do OpenAI do Azure e detectadas como prejudiciais (modelo de bloco e modo de anotação) pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIHarmfulRequests |
Count | Total (Soma) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName , TextType , , Category , , Severity |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Volume bloqueado Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIRejectedRequests |
Count | Total (Soma) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName , TextType , , Category |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Evento do Sistema de Segurança Evento do sistema para monitoramento de riscos e segurança. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: EventType. |
RAISystemEvent |
Contagem | Média | Region , EventType |
PT1M | Sim |
ContentSafety - Riscos e Segurança | Volume total enviado para verificação de segurança Número de chamadas feitas para a API OpenAI do Azure e detectadas pelo filtro de conteúdo aplicado durante um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Total (Soma) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Limite de taxa O ratelimit atual da chave ratelimit. Não use para o serviço OpenAI do Azure. |
Ratelimit |
Count | Total (Soma) | Region , RatelimitKey |
PT1M | Sim |
Recompensas | Recompensa média por evento Recompensa média por evento. |
Reward |
Contagem | Média | BaselineAction , ChosenActionId , MatchesBaseline , NonDefaultReward , Mode , , RunId |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Erros do Servidor Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o serviço OpenAI do Azure. |
ServerErrors |
Count | Total (Soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Ocorrências de recursos | Ocorrências de recursos de slot Número de vezes que cada recurso de slot aparece. |
SlotFeatureIdOccurrences |
Count | Total (Soma) | FeatureId , Mode , RunId |
PT1M | Sim |
Recursos por evento | Recursos do slot por evento Número médio de recursos de slot por evento. |
SlotFeaturesPerEvent |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Slots | Ocorrências de slot Número de vezes que cada slot é exibido. |
SlotIdOccurrences |
Count | Total (Soma) | SlotId , SlotIndex , Mode , RunId |
PT1M | Sim |
Namespaces por evento | Namespaces de slot por evento Número médio de namespaces do slot por evento. |
SlotNamespacesPerEvent |
Contagem | Média | Mode , RunId |
PT1M | Sim |
Recompensas | Recompensa do slot Recompensa por slot. |
SlotReward |
Contagem | Média | BaselineActionId , ChosenActionId , MatchesBaseline , NonDefaultReward , SlotId , SlotIndex , , Mode , , RunId |
PT1M | Sim |
SpeechServices - Uso | Transações de reconhecimento de locutor Número de Transações de Reconhecimento do Locutor |
SpeakerRecognitionTransactions |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Uso | Horário de hospedagem do modelo de fala Número de horas de hospedagem do modelo de fala |
SpeechModelHostingHours |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Duração da Sessão de Fala (Preterida) Duração total da sessão de fala em segundos. |
SpeechSessionDuration |
Segundos | Total (Soma) | ApiName , OperationName , Region |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Chamadas bem-sucedidas Número de chamadas com êxito. Não use para o serviço OpenAI do Azure. |
SuccessfulCalls |
Count | Total (Soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Serviços Cognitivos – SLI | Taxa de disponibilidade Percentual de disponibilidade com o seguinte cálculo: (Total de Chamadas – Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas HTTP >=500. Não use para o serviço OpenAI do Azure. |
SuccessRate |
Porcentagem | Mínimo, Máximo, Média | ApiName , OperationName , Region , RatelimitKey |
PT1M | Não |
SpeechServices - Uso | Caracteres Sintetizados Número de caracteres. |
SynthesizedCharacters |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Caracteres de texto traduzidos Número de caracteres na solicitação de tradução do texto de entrada. |
TextCharactersTranslated |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Caracteres personalizados de texto traduzidos Número de caracteres na solicitação de tradução do texto personalizado de entrada. |
TextCustomCharactersTranslated |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
Uso | Caracteres treinados em texto Número de caracteres treinados usando a tradução de texto. |
TextTrainedCharacters |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
OpenAI do Azure – Uso | Tokens de inferência processados Número de tokens de inferência processados em um modelo OpenAI. Calculado como tokens de prompt (entrada) mais tokens gerados (saída). Aplica-se a implantações PTU, gerenciadas por PTU e pagas conforme o uso. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
TokenTransaction |
Count | Total (Soma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region , , ModelVersion |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Total de chamadas Número total de chamadas. Não use para o serviço OpenAI do Azure. |
TotalCalls |
Count | Total (Soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Total de Erros Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o serviço OpenAI do Azure. |
TotalErrors |
Count | Total (Soma) | ApiName , OperationName , Region , RatelimitKey |
PT1M | Sim |
Uso | Total de eventos Número de eventos. |
TotalEvents |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Serviços Cognitivos – Solicitações HTTP | Total de chamadas de token Número total de chamadas de token. |
TotalTokenCalls |
Count | Total (Soma) | ApiName , OperationName , Region |
PT1M | Sim |
Uso | Total de transações (preterido) Número total de transações. |
TotalTransactions |
Count | Total (Soma) | <none> | PT1M | Sim |
Estimativas | Contagem de eventos de linha de base do usuário Estimativa da contagem de eventos de linha de base definida pelo usuário. |
UserBaselineEventCount |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
Estimativas | Recompensa da linha de base do usuário Estimativa da recompensa de linha de base definida pelo usuário. |
UserBaselineReward |
Count | Total (Soma) | Mode , RunId |
PT1M | Sim |
SpeechServices - Uso | Segundos de Vídeo Sintetizados Número de segundos sintetizados |
VideoSecondsSynthesized |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Uso | Horas de Hosting do Modelo de Voz Número de horas. |
VoiceModelHostingHours |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Sim |
SpeechServices - Uso | Minutos de treinamento do modelo de voz Número de minutos. |
VoiceModelTrainingMinutes |
Count | Total (Soma) | ApiName , FeatureName , UsageChannel , Region |
PT1M | Yes |
Dimensões de métrica
Para obter mais informações sobre o que são dimensões de métrica, confira Métricas multidimensionais.
Este serviço tem as dimensões a seguir associadas a essas métricas.
- ApiName
- FeatureName
- Nome_da_Implantação_do_Modelo
- ModelName
- Versão do modelo
- OperationName
- Region
- StatusCode
- StreamType
- Canal de Uso
Logs de recursos
Esta seção lista os tipos de logs de recursos que você pode coletar para o este serviço. A seção extrai da lista de todos os tipos de categoria de logs de recursos com suporte no Azure Monitor.
Logs de recursos com suporte para Microsoft.CognitiveServices/accounts
Categoria | Nome de exibição da categoria | Tabela de log | Com suporte a plano de log básico | Com suporte a transformações de tempo-ingestão | Consultas de exemplo | Custos para exportar |
---|---|---|---|---|---|---|
Audit |
Logs de Auditoria | AzureDiagnostics Logs de vários recursos do Azure. |
Não | No | Não | |
RequestResponse |
Logs de Solicitação e Resposta | AzureDiagnostics Logs de vários recursos do Azure. |
Não | No | Não | |
Trace |
Logs de rastreamento | AzureDiagnostics Logs de vários recursos do Azure. |
Não | No | No |
Tabelas de Logs do Azure Monitor
Esta seção lista todas as tabelas dos Logs do Azure Monitor relevantes para este serviço e disponíveis para consulta pela análise de logs usando o Kusto. As tabelas contêm dados de log de recursos e possivelmente mais, dependendo do que é coletado e roteado para elas.
OpenAI do Azure microsoft.cognitiveservices/accounts
Log de atividades
A tabela vinculada lista as operações que podem ser registradas no log de atividades desse serviço. Essas operações são um subconjunto de todas as operações do provedor de recursos possíveis no log de atividades.
Para obter mais informações sobre o esquema de entradas do log de atividades, confira Esquema do log de atividades.
Conteúdo relacionado
- Consulte Monitorar o Azure OpenAI para obter uma descrição do monitoramento do Azure OpenAI.
- Confira Monitorar recursos do Azure com o Azure Monitor para ver informações detalhadas sobre o monitoramento dos recursos do Azure.