Azure OpenAI 모니터링 데이터 참조
이 문서에는 이 서비스에 대한 모든 모니터링 참조 정보가 포함되어 있습니다.
Azure OpenAI 서비스에 대해 수집할 수 있는 데이터 및 사용 방법에 대한 자세한 내용은 Azure OpenAI 모니터링을 참조하세요.
메트릭
이 섹션에는 이 서비스에 대해 자동으로 모은 플랫폼 메트릭이 모두 나열되어 있습니다. 이러한 메트릭은 Azure Monitor에서 지원되는 모든 플랫폼 메트릭의 전역 목록의 일부이기도 합니다.
메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.
Microsoft.CognitiveServices/계정에 대해 지원되는 메트릭
다음은 Azure OpenAI에 대해 모니터링해야 한다고 생각하는 가장 중요한 메트릭입니다. 이 문서의 뒷부분에서는 이 짧은 목록의 메트릭에 대한 자세한 내용을 포함하는 사용 가능한 모든 Azure AI 서비스 메트릭의 긴 목록입니다.
Azure OpenAI 요청
활성 토큰
생성된 완료 토큰
처리된 FineTuned 학습 시간
처리된 유추 토큰
처리된 프롬프트 토큰
프로비저닝된 관리되는 사용률 V2
프롬프트 토큰 캐시 일치 속도
응답 시간
토큰 간 시간
마지막 바이트까지의 시간
정규화된 첫 번째 바이트 시간
다른 Azure AI 서비스에서 사용하는 콘텐츠 안전 메트릭을 모니터링할 수도 있습니다.
- 차단된 볼륨
- 유해한 볼륨이 감지됨
- 잠재적인 악의적인 사용자 수
- 안전 시스템 이벤트
- 안전 확인을 위해 전송된 총 볼륨
참고 항목
프로비전된 관리되는 사용률 메트릭은 이제 더 이상 사용되지 않으며 더 이상 권장되지 않습니다. 이 메트릭은 프로비전된 관리되는 사용률 V2 메트릭으로 대체되었습니다.
Cognitive Services 메트릭에는 다음 표의 Cognitive Services - HTTP 요청 범주가 있습니다. 이러한 메트릭은 모든 Azure AI Services 리소스에 공통적인 레거시 메트릭입니다. 더 이상 Azure OpenAI에서 이러한 메트릭을 사용하는 것이 좋습니다.
다음 표에서는 Microsoft.CognitiveServices/accounts 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
- 모든 테이블에 모든 열이 있는 것은 아닙니다.
- 일부 열은 페이지의 보기 영역 밖에 있을 수 있습니다. 사용 가능한 모든 열을 보려면 테이블 확장을 선택합니다.
테이블 제목
- 범주 - 메트릭 그룹 또는 분류입니다.
- 메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
- REST API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
- 단위 - 측정 단위입니다.
- 집계 - 기본 집계 형식입니다. 유효한 값은 평균(Avg), 최소(Min), 최대(Max), 합계(Sum), 개수입니다.
- 차원 - 메트릭에 사용할 수 있는 차원입니다.
- 시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어,
PT1M
은 메트릭이 1분마다,PT30M
은 30분마다,PT1H
는 1시간마다 샘플링됨을 나타냅니다. - DS 내보내기- 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부를 나타냅니다. 메트릭 내보내기에 대한 자세한 내용은 Azure Monitor의 진단 설정 생성을 참조하세요.
범주 | 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|---|
기능 발생 | 작업 기능 발생 각 작업 기능이 표시되는 횟수입니다. |
ActionFeatureIdOccurrences |
Count | 합계(Sum) | FeatureId , , Mode RunId |
PT1M | 예 |
이벤트당 기능 | 이벤트당 작업 기능 이벤트당 평균 작업 기능 수입니다. |
ActionFeaturesPerEvent |
Count | 평균 | Mode , RunId |
PT1M | 예 |
actions | 작업 발생 각 동작이 표시되는 횟수입니다. |
ActionIdOccurrences |
Count | 합계(Sum) | ActionId , , Mode RunId |
PT1M | 예 |
이벤트당 네임스페이스 | 이벤트당 작업 네임스페이스 이벤트당 평균 작업 네임스페이스 수입니다. |
ActionNamespacesPerEvent |
Count | 평균 | Mode , RunId |
PT1M | 예 |
actions | 이벤트당 작업 이벤트당 작업 수입니다. |
ActionsPerEvent |
Count | 평균 | Mode , RunId |
PT1M | 예 |
Azure OpenAI - 사용량 | 활성 토큰 총 토큰에서 일정 기간 동안 캐시된 토큰을 뺀 값입니다. PTU 및 PTU 관리형 배포에 적용됩니다. 이 메트릭을 사용하여 TPS 또는 TPM 기반 PTU 사용률을 파악하고 시나리오의 대상 TPS 또는 TPM에 대한 벤치마크와 비교합니다. API 요청을 분석하려면 필터를 추가하거나 ModelDeploymentName, ModelName 및 ModelVersion 차원으로 분할을 적용할 수 있습니다. |
ActiveTokens |
Count | 최소, 최대, 평균, 합계(합계) | Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | 예 |
SpeechServices - 사용량 | 오디오 초 전사 전사된 시간(초) |
AudioSecondsTranscribed |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
SpeechServices - 사용량 | 오디오 초 번역됨 번역된 시간(초) |
AudioSecondsTranslated |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
SpeechServices - 사용량 | 아바타 모델 호스팅 초 초 수입니다. |
AvatarModelHostingSeconds |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
Azure OpenAI - HTTP 요청 | 프롬프트 토큰 캐시 일치 속도 프롬프트 토큰의 백분율이 캐시에 도달하여 PTU 관리용으로 사용할 수 있습니다. |
AzureOpenAIContextTokensCacheMatchRate |
Percent | Minimum, Maximum, Average | Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | 아니요 |
Azure OpenAI - 사용량 | 프로비저닝된 관리되는 사용률 프로비저닝된 관리형 배포의 사용률%(사용된 CPU/배포된 CPU) x 100으로 계산됩니다. 사용률이 100%보다 크거나 같으면 호출이 제한되고 오류 코드 429가 반환됩니다. 이 메트릭을 분석하려면 필터를 추가하거나 ModelDeploymentName, ModelName, ModelVersion 및 StreamType(스트리밍 및 비 스트리밍 요청) 차원으로 분할을 적용할 수 있습니다. |
AzureOpenAIProvisionedManagedUtilization |
Percent | Minimum, Maximum, Average | Region , StreamType , ModelDeploymentName , ModelName ModelVersion |
PT1M | 아니요 |
Azure OpenAI - 사용량 | 프로비저닝된 관리되는 사용률 V2 프로비저닝된 관리형 배포의 사용률%(사용된 CPU/배포된 CPU) x 100으로 계산됩니다. 사용률이 100%보다 크거나 같으면 호출이 제한되고 오류 코드 429가 반환됩니다. 이 메트릭을 분석하려면 필터를 추가하거나 ModelDeploymentName, ModelName, ModelVersion 및 StreamType(스트리밍 및 비 스트리밍 요청) 차원으로 분할을 적용할 수 있습니다. |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percent | Minimum, Maximum, Average | Region , StreamType , ModelDeploymentName , ModelName ModelVersion |
PT1M | 아니요 |
Azure OpenAI - HTTP 요청 | Azure OpenAI 요청 일정 기간 동안 Azure OpenAI API에 대한 호출 수입니다. PTU, PTU 관리형 및 종량제 배포에 적용됩니다. API 요청을 분석하려면 필터를 추가하거나 ModelDeploymentName, ModelName, ModelVersion, StatusCode(성공, 클라이언트 서버, 서버 오류), StreamType(스트리밍 및 비 스트리밍 요청) 및 작업 차원으로 분할을 적용할 수 있습니다. |
AzureOpenAIRequests |
Count | 합계(Sum) | ApiName , OperationName , Region , StreamType , ModelDeploymentName , ModelName , ModelVersion StatusCode |
PT1M | 예 |
Azure OpenAI - HTTP 요청 | 응답 시간 스트리밍 요청에 권장되는 대기 시간(응답성) 측정입니다. PTU 및 PTU 관리형 배포에 적용됩니다. API 게이트웨이에서 측정한 대로 사용자가 프롬프트를 보낸 후 첫 번째 응답이 표시되는 데 걸린 시간으로 계산됩니다. 이 숫자는 프롬프트 크기가 증가하거나 캐시 적중 크기가 감소함에 따라 증가합니다. 응답 메트릭에 대한 시간을 분석하기 위해 필터를 추가하거나 ModelDeploymentName, ModelName 및 ModelVersion 차원으로 분할을 적용할 수 있습니다. 참고: 측정된 대기 시간은 동시 호출 및 전체 워크로드 패턴을 포함한 여러 요소에 크게 의존하므로 이 메트릭은 근사치입니다. 또한 클라이언트와 API 엔드포인트 사이에 있을 수 있는 클라이언트 쪽 대기 시간을 고려하지 않습니다. 최적의 대기 시간 추적을 위해서는 자체 로깅을 참조하세요. |
AzureOpenAITimeToResponse |
밀리초 | Minimum, Maximum, Average | ApiName , OperationName , Region , StreamType , ModelDeploymentName , ModelName , ModelVersion StatusCode |
PT1M | 예 |
슬롯 | 초기 계획 예측 도구 전체 보상 초기 계획 예측자 전체 보상입니다. |
BaselineEstimatorOverallReward |
Count | 평균 | Mode , RunId |
PT1M | 예 |
슬롯 | 초기 계획 추정기 슬롯 보상 슬롯별 기준 추정기 보상입니다. |
BaselineEstimatorSlotReward |
Count | 평균 | SlotId , SlotIndex , Mode RunId |
PT1M | 예 |
슬롯 | 초기 계획 임의 추정기 전체 보상 초기 계획 임의 추정기 전체 보상입니다. |
BaselineRandomEstimatorOverallReward |
Count | 평균 | Mode , RunId |
PT1M | 예 |
슬롯 | 초기 계획 임의 추정기 슬롯 보상 슬롯별 기준 임의 추정기 보상입니다. |
BaselineRandomEstimatorSlotReward |
Count | 평균 | SlotId , SlotIndex , Mode RunId |
PT1M | 예 |
예측 | 초기 계획 임의 이벤트 수 초기 계획 임의 이벤트 수에 대한 예측입니다. |
BaselineRandomEventCount |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
예측 | 초기 계획 임의 보상 기준 임의 보상에 대한 예측입니다. |
BaselineRandomReward |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 차단된 호출 요금 또는 할당량 한도를 초과한 호출 수입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
BlockedCalls |
Count | 합계(Sum) | ApiName , OperationName , Region RatelimitKey |
PT1M | 예 |
사용 | 유추 횟수 Carnegie Frontdoor 서비스의 유추 수 |
CarnegieInferenceCount |
Count | 합계(Sum) | Region , Modality , Category , Language , SeverityLevel UseCustomList |
PT1M | 예 |
사용 | 학습된 문자(사용되지 않음) 학습된 총 문자 수입니다. |
CharactersTrained |
Count | 합계(Sum) | ApiName , , OperationName Region |
PT1M | 예 |
사용 | 번역된 문자(사용되지 않음) 들어오는 텍스트 요청에 있는 문자의 총 수입니다. |
CharactersTranslated |
Count | 합계(Sum) | ApiName , , OperationName Region |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 클라이언트 오류 클라이언트 쪽 오류(HTTP 응답 코드 4xx)가 있는 호출 수입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
ClientErrors |
Count | 합계(Sum) | ApiName , OperationName , Region RatelimitKey |
PT1M | 예 |
사용 | Computer Vision 트랜잭션 Computer Vision 트랜잭션 수 |
ComputerVisionTransactions |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
ContentSafety - 사용량 | 이미지 조정에 대한 호출 수 이미지 조정에 대한 호출 수입니다. |
ContentSafetyImageAnalyzeRequestCount |
Count | 합계(Sum) | ApiVersion |
PT1M | 예 |
ContentSafety - 사용량 | 텍스트 조정에 대한 호출 수 텍스트 조정에 대한 호출 수입니다. |
ContentSafetyTextAnalyzeRequestCount |
Count | 합계(Sum) | ApiVersion |
PT1M | 예 |
기능 발생 | 컨텍스트 기능 발생 각 컨텍스트 기능이 표시되는 횟수입니다. |
ContextFeatureIdOccurrences |
Count | 합계(Sum) | FeatureId , , Mode RunId |
PT1M | 예 |
이벤트당 기능 | 이벤트당 컨텍스트 기능 이벤트당 컨텍스트 기능 수입니다. |
ContextFeaturesPerEvent |
Count | 평균 | Mode , RunId |
PT1M | 예 |
이벤트당 네임스페이스 | 이벤트당 컨텍스트 네임스페이스 이벤트당 컨텍스트 네임스페이스 수입니다. |
ContextNamespacesPerEvent |
Count | 평균 | Mode , RunId |
PT1M | 예 |
사용 | Custom Vision 학습 시간 Custom Vision 학습 시간 |
CustomVisionTrainingTime |
초 | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | Custom Vision 트랜잭션 Custom Vision 예측 트랜잭션 수 |
CustomVisionTransactions |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 데이터 입력 들어오는 데이터 크기(바이트)입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
DataIn |
바이트 | 합계(Sum) | ApiName , , OperationName Region |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 데이터 출력 나가는 데이터 크기(바이트)입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
DataOut |
바이트 | 합계(Sum) | ApiName , , OperationName Region |
PT1M | 예 |
사용 | 번역된 문서 문자 문서 번역 요청의 문자 수입니다. |
DocumentCharactersTranslated |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 번역된 문서 사용자 지정 문자 사용자 지정 문서 번역 요청의 문자 수입니다. |
DocumentCustomCharactersTranslated |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 얼굴 이미지 학습 학습된 이미지 수입니다. 학습된 이미지는 트랜잭션당 1,000개입니다. |
FaceImagesTrained |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 저장된 얼굴 저장된 얼굴의 일일 비례 배분 수입니다. 저장된 얼굴 수는 매일 보고됩니다. |
FacesStored |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 얼굴 트랜잭션 Face 서비스에 대한 API 호출 수 |
FaceTransactions |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
FeatureCardinality | 작업별 기능 카디널리티 작업 기반의 기능 카디널리티입니다. |
FeatureCardinality_Action |
Count | 평균 | FeatureId , , Mode RunId |
PT1M | 예 |
FeatureCardinality | 컨텍스트별 기능 카디널리티 컨텍스트 기반의 기능 카디널리티입니다. |
FeatureCardinality_Context |
Count | 평균 | FeatureId , , Mode RunId |
PT1M | 예 |
FeatureCardinality | 슬롯별 기능 카디널리티 슬롯 기반의 기능 카디널리티입니다. |
FeatureCardinality_Slot |
Count | 평균 | FeatureId , , Mode RunId |
PT1M | 예 |
Azure OpenAI - 사용량 | 처리된 FineTuned 학습 시간 OpenAI FineTuned 모델에서 처리된 학습 시간 수 |
FineTunedTrainingHours |
Count | 합계(Sum) | ApiName , ModelDeploymentName , FeatureName , UsageChannel Region |
PT1M | 예 |
Azure OpenAI - 사용량 | 생성된 완료 토큰 OpenAI 모델에서 생성된 토큰 수(출력)입니다. PTU, PTU 관리형 및 종량제 배포에 적용됩니다. 이 메트릭을 분석하려면 필터를 추가하거나 ModelDeploymentName 및 ModelName 차원으로 분할을 적용할 수 있습니다. |
GeneratedTokens |
Count | 합계(Sum) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | 예 |
사용 | 저장된 이미지 저장된 Custom Vision 이미지 수입니다. |
ImagesStored |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 대기 시간 대기 시간(밀리초)입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
Latency |
밀리초 | 평균 | ApiName , OperationName , Region RatelimitKey |
PT1M | 예 |
사용 | 학습된 이벤트 학습한 이벤트 수 |
LearnedEvents |
Count | 합계(Sum) | IsMatchBaseline , , Mode RunId |
PT1M | 예 |
사용 | LUIS 음성 요청 LUIS 음성 의도 변환 해석 요청 수 |
LUISSpeechRequests |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | LUIS 텍스트 요청 LUIS 텍스트 요청 수 |
LUISTextRequests |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 일치하는 보상 일치하는 보상 수 |
MatchedRewards |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
사용 | 활성화되지 않은 이벤트 건너뛴 이벤트 수입니다. |
NonActivatedEvents |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
슬롯 | 슬롯 이벤트당 슬롯 수입니다. |
NumberOfSlots |
Count | 평균 | Mode , RunId |
PT1M | 예 |
SpeechServices - 사용량 | 발표자 프로필 수 등록된 화자 프로필의 수입니다. 시간당 비례 배분됩니다. |
NumberofSpeakerProfiles |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 관찰된 보상 관찰된 보상 수입니다. |
ObservedRewards |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
사용 | 번역된 문서 동기화 문자 문서 번역(동기) 요청의 문자 수입니다. |
OneDocumentCharactersTranslated |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
슬롯 | 온라인 추정기 전체 보상 온라인 추정기 전체 보상. |
OnlineEstimatorOverallReward |
Count | 평균 | Mode , RunId |
PT1M | 예 |
슬롯 | 온라인 추정기 슬롯 보상 슬롯별 온라인 추정기 보상. |
OnlineEstimatorSlotReward |
Count | 평균 | SlotId , SlotIndex , Mode RunId |
PT1M | 예 |
예측 | 온라인 이벤트 수 온라인 이벤트 수에 대한 예측입니다. |
OnlineEventCount |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
예측 | 온라인 보상 온라인 보상에 대한 예측입니다. |
OnlineReward |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
사용 | 처리된 문자 Immersive Reader에 의해 처리된 문자 수입니다. |
ProcessedCharacters |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 처리된 상태 텍스트 레코드 처리된 상태 텍스트 레코드 수 |
ProcessedHealthTextRecords |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 처리된 이미지 처리된 이미지 수 |
ProcessedImages |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 처리된 페이지 처리된 페이지 수 |
ProcessedPages |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
Azure OpenAI - 사용량 | 처리된 프롬프트 토큰 OpenAI 모델에서 처리된 프롬프트 토큰(입력)의 수입니다. PTU, PTU 관리형 및 종량제 배포에 적용됩니다. 이 메트릭을 분석하려면 필터를 추가하거나 ModelDeploymentName 및 ModelName 차원으로 분할을 적용할 수 있습니다. |
ProcessedPromptTokens |
Count | 합계(Sum) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | 예 |
사용 | 처리된 텍스트 레코드 텍스트 레코드의 수입니다. |
ProcessedTextRecords |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | QA 텍스트 레코드 처리된 텍스트 레코드 수 |
QuestionAnsweringTextRecords |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
ContentSafety - 위험 및 안전 | 잠재적으로 악의적인 사용자 수 일정 기간 동안 검색된 잠재적으로 악의적인 사용자 수입니다. 필터를 추가하거나 ModelDeploymentName 차원으로 분할을 적용할 수 있습니다. |
RAIAbusiveUsersCount |
Count | 합계(Sum) | Region , ModelDeploymentName |
PT1M | 예 |
ContentSafety - 위험 및 안전 | 유해한 볼륨이 감지됨 일정 기간 동안 적용된 콘텐츠 필터에 의해 Azure OpenAI API에 대해 수행되고 유해(블록 모델 및 주석 달기 모드 모두)로 검색된 호출 수입니다. 필터를 추가하거나 ModelDeploymentName, ModelName 및 TextType 차원별로 분할을 적용할 수 있습니다. |
RAIHarmfulRequests |
Count | 합계(Sum) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName , TextType , Category Severity |
PT1M | 예 |
ContentSafety - 위험 및 안전 | 차단된 볼륨 일정 기간 동안 적용된 콘텐츠 필터에 의해 거부된 Azure OpenAI API에 대한 호출 수입니다. 필터를 추가하거나 ModelDeploymentName, ModelName 및 TextType 차원별로 분할을 적용할 수 있습니다. |
RAIRejectedRequests |
Count | 합계(Sum) | Region , ModelDeploymentName , ModelName , ModelVersion , ApiName , TextType Category |
PT1M | 예 |
ContentSafety - 위험 및 안전 | 안전 시스템 이벤트 위험 및 안전 모니터링에 대한 시스템 이벤트입니다. 필터를 추가하거나 EventType 차원으로 분할을 적용할 수 있습니다. |
RAISystemEvent |
Count | 평균 | Region , EventType |
PT1M | 예 |
ContentSafety - 위험 및 안전 | 안전 확인을 위해 전송된 총 볼륨 일정 기간 동안 적용된 콘텐츠 필터에 의해 검색된 Azure OpenAI API에 대한 호출 수입니다. 필터를 추가하거나 ModelDeploymentName, ModelName 차원별로 분할을 적용할 수 있습니다. |
RAITotalRequests |
Count | 합계(Sum) | Region , ModelDeploymentName , ModelName , ModelVersion ApiName |
PT1M | 예 |
Cognitive Services - HTTP 요청 | Ratelimit ratelimit 키의 현재 ratelimit입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
Ratelimit |
Count | 합계(Sum) | Region , RatelimitKey |
PT1M | 예 |
보상 | 이벤트당 평균 보상 이벤트당 평균 보상입니다. |
Reward |
Count | 평균 | BaselineAction , ChosenActionId , MatchesBaseline , NonDefaultReward , Mode RunId |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 서버 오류 서비스 내부 오류(HTTP 응답 코드 5xx)가 있는 호출 수입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
ServerErrors |
Count | 합계(Sum) | ApiName , OperationName , Region RatelimitKey |
PT1M | 예 |
기능 발생 | 슬롯 기능 발생 각 슬롯 기능이 표시되는 횟수입니다. |
SlotFeatureIdOccurrences |
Count | 합계(Sum) | FeatureId , , Mode RunId |
PT1M | 예 |
이벤트당 기능 | 이벤트당 슬롯 기능 이벤트당 슬롯 기능의 평균 수입니다. |
SlotFeaturesPerEvent |
Count | 평균 | Mode , RunId |
PT1M | 예 |
슬롯 | 슬롯 발생 각 슬롯이 나타나는 횟수입니다. |
SlotIdOccurrences |
Count | 합계(Sum) | SlotId , SlotIndex , Mode RunId |
PT1M | 예 |
이벤트당 네임스페이스 | 이벤트당 슬롯 네임스페이스 이벤트당 슬롯 네임스페이스의 평균 수입니다. |
SlotNamespacesPerEvent |
Count | 평균 | Mode , RunId |
PT1M | 예 |
보상 | 슬롯 보상 슬롯당 보상입니다. |
SlotReward |
Count | 평균 | BaselineActionId , ChosenActionId , MatchesBaseline , NonDefaultReward , SlotId , SlotIndex , Mode RunId |
PT1M | 예 |
SpeechServices - 사용량 | Speaker Recognition 트랜잭션 화자 인식 트랜잭션 수 |
SpeakerRecognitionTransactions |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
SpeechServices - 사용량 | 음성 모델 호스팅 시간 음성 모델 호스트 시간 수 |
SpeechModelHostingHours |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 음성 세션 기간(사용되지 않음) 음성 세션의 총 기간(초)입니다. |
SpeechSessionDuration |
초 | 합계(Sum) | ApiName , , OperationName Region |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 성공한 호출 성공한 호출 수입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
SuccessfulCalls |
Count | 합계(Sum) | ApiName , OperationName , Region RatelimitKey |
PT1M | 예 |
Cognitive Services - SLI | AvailabilityRate 다음 계산을 사용한 가용성 비율: (총 호출 - 서버 오류)/총 호출 수입니다. 서버 오류에는 HTTP 응답 >=500이 포함됩니다. Azure OpenAI 서비스에는 사용하지 마세요. |
SuccessRate |
Percent | Minimum, Maximum, Average | ApiName , OperationName , Region RatelimitKey |
PT1M | 아니요 |
SpeechServices - 사용량 | 합성 문자 문자 수입니다. |
SynthesizedCharacters |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 번역된 텍스트 문자 수신 텍스트 번역 요청의 문자 수입니다. |
TextCharactersTranslated |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 번역된 텍스트 사용자 지정 문자 수신 사용자 지정 텍스트 번역 요청의 문자 수입니다. |
TextCustomCharactersTranslated |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
사용 | 텍스트 학습 문자 텍스트 번역을 사용하여 학습된 문자 수입니다. |
TextTrainedCharacters |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
Azure OpenAI - 사용량 | 처리된 유추 토큰 OpenAI 모델에서 처리된 유추 토큰 수입니다. 프롬프트 토큰(입력)과 생성된 토큰(출력)으로 계산됩니다. PTU, PTU 관리형 및 종량제 배포에 적용됩니다. 이 메트릭을 분석하려면 필터를 추가하거나 ModelDeploymentName 및 ModelName 차원으로 분할을 적용할 수 있습니다. |
TokenTransaction |
Count | 합계(Sum) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 총 호출 수 총 호출 수. Azure OpenAI 서비스에는 사용하지 마세요. |
TotalCalls |
Count | 합계(Sum) | ApiName , OperationName , Region RatelimitKey |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 총 오류 오류 응답(HTTP 응답 코드 4xx 또는 5xx)이 있는 총 호출 수입니다. Azure OpenAI 서비스에는 사용하지 마세요. |
TotalErrors |
Count | 합계(Sum) | ApiName , OperationName , Region RatelimitKey |
PT1M | 예 |
사용 | 총 이벤트 이벤트 수입니다. |
TotalEvents |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
Cognitive Services - HTTP 요청 | 총 토큰 호출 수 총 토큰 호출 수입니다. |
TotalTokenCalls |
Count | 합계(Sum) | ApiName , , OperationName Region |
PT1M | 예 |
사용 | 총 트랜잭션(사용되지 않음) 총 트랜잭션 수입니다. |
TotalTransactions |
Count | 합계(Sum) | <없음> | PT1M | 예 |
예측 | 사용자 기준 이벤트 수 사용자 정의 기준 이벤트 수에 대한 예측입니다. |
UserBaselineEventCount |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
예측 | 사용자 기준 보상 사용자 정의 기준 보상에 대한 예측입니다. |
UserBaselineReward |
Count | 합계(Sum) | Mode , RunId |
PT1M | 예 |
SpeechServices - 사용량 | 비디오 초 합성 합성된 시간(초) |
VideoSecondsSynthesized |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
SpeechServices - 사용량 | 음성 모델 호스팅 시간 시간 수입니다. |
VoiceModelHostingHours |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
SpeechServices - 사용량 | 음성 모델 학습(분) 분 수입니다. |
VoiceModelTrainingMinutes |
Count | 합계(Sum) | ApiName , FeatureName , UsageChannel Region |
PT1M | 예 |
메트릭 차원
메트릭 차원에 대한 자세한 내용은 다차원 메트릭을 참조하세요.
이 서비스에는 메트릭과 관련된 다음과 같은 차원이 있습니다.
- ApiName
- FeatureName
- ModelDeploymentName
- ModelName
- ModelVersion
- OperationName
- 지역
- StatusCode
- StreamType
- UsageChannel
리소스 로그
이 섹션에는 이 서비스에 대해 모을 수 있는 리소스 로그 유형이 나열되어 있습니다. 이 섹션은 Azure Monitor에서 지원되는 모든 리소스 로그 범주 유형 목록에서 가져옵니다.
Microsoft.CognitiveServices/계정에 대해 지원되는 리소스 로그
범주 | 범주 표시 이름 | 로그 테이블 | 기본 로그 플랜 지원 | 수집 시간 변환 지원 | 예시 쿼리 | 내보낼 비용 |
---|---|---|---|---|---|---|
Audit |
감사 로그 | AzureDiagnostics 여러 Azure 리소스의 로그. |
아니요 | 아니요 | 아니요 | |
RequestResponse |
요청 및 응답 로그 | AzureDiagnostics 여러 Azure 리소스의 로그. |
아니요 | 아니요 | 아니요 | |
Trace |
추적 로그 | AzureDiagnostics 여러 Azure 리소스의 로그. |
아니요 | 아니요 | 아니요 |
Azure Monitor 로그 테이블
이 섹션은 이 서비스와 관련이 있고 Kusto 쿼리를 사용하는 Log Analytics의 쿼리에 사용할 수 있는 Azure Monitor 로그 테이블을 나열합니다. 테이블에는 리소스 로그 데이터가 포함되며 수집 및 라우팅되는 항목에 따라 더 많은 데이터가 포함될 수 있습니다.
Azure OpenAI microsoft.cognitiveservices/accounts
활동 로그
연결된 테이블에는 이 서비스의 활동 로그에 기록할 수 있는 작업이 나열되어 있습니다. 이 작업은 활동 로그에서 가능한 모든 리소스 공급자 작업의 하위 집합입니다.
활동 로그 항목의 스키마에 대한 자세한 내용은 활동 로그 스키마를 참조하세요.
관련 콘텐츠
- Azure OpenAI 모니터링에 대한 설명은 Azure OpenAI 모니터링을 참조하세요.
- Azure 리소스 모니터링에 대한 자세한 내용은 Azure Monitor를 사용한 Azure 리소스 모니터링을 참조하세요.