Azure Machine Learning 모니터링 데이터 참조
이 문서에는 이 서비스에 대한 모든 모니터링 참조 정보가 포함되어 있습니다.
Azure Machine Learning을 위해 수집할 수 있는 데이터 및 사용 방법에 대한 자세한 내용은 Machine Learning 모니터링을 참조하세요.
메트릭
이 섹션에는 이 서비스에 대해 자동으로 모은 플랫폼 메트릭이 모두 나열되어 있습니다. 이러한 메트릭은 Azure Monitor에서 지원되는 모든 플랫폼 메트릭의 전역 목록의 일부이기도 합니다.
메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.
이러한 메트릭에 대한 리소스 공급자는 Microsoft.MachineLearningServices/workspaces입니다.
메트릭 범주는 모델, 할당량, 리소스, 실행 및 트래픽입니다. 할당량 정보는 Machine Learning 컴퓨팅 전용입니다. 실행 은 작업 영역에 대한 학습 실행에 대한 정보를 제공합니다.
Microsoft.MachineLearningServices/작업 영역에 대해 지원되는 메트릭
다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
- 모든 테이블에 모든 열이 있는 것은 아닙니다.
- 일부 열은 페이지의 보기 영역 밖에 있을 수 있습니다. 사용 가능한 모든 열을 보려면 테이블 확장을 선택합니다.
테이블 제목
- 범주 - 메트릭 그룹 또는 분류입니다.
- 메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
- REST API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
- 단위 - 측정 단위입니다.
- 집계 - 기본 집계 형식입니다. 유효한 값은 평균(Avg), 최소(Min), 최대(Max), 합계(Sum), 개수입니다.
- 차원 - 메트릭에 사용할 수 있는 차원입니다.
- 시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어,
PT1M
은 메트릭이 1분마다,PT30M
은 30분마다,PT1H
는 1시간마다 샘플링됨을 나타냅니다. - DS 내보내기- 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부를 나타냅니다. 메트릭 내보내기에 대한 자세한 내용은 Azure Monitor의 진단 설정 생성을 참조하세요.
범주 | 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|---|
할당량 | Active Cores 활성 코어 수 |
Active Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 활성 노드 Acitve 노드 수입니다. 다음은 작업을 적극적으로 실행하는 노드입니다. |
Active Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
실행 | 요청된 실행 취소 이 작업 영역에 대해 취소가 요청된 실행 수. 실행에 대한 취소 요청을 받은 경우 개수가 업데이트됩니다. |
Cancel Requested Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 | 취소된 실행 이 작업 영역에 대해 취소된 실행 수입니다. 실행이 성공적으로 취소되면 개수가 업데이트됩니다. |
Cancelled Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 | 완료된 실행 이 작업 영역에 대해 성공적으로 완료된 실행 수입니다. 실행이 완료되고 출력이 수집되면 수가 업데이트 됩니다. |
Completed Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
리소스 | CpuCapacityMillicores CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다. |
CpuCapacityMillicores |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | CpuMemoryCapacityMegabytes CPU 노드의 최대 메모리 사용률(메가바이트)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryCapacityMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | CpuMemoryUtilizationMegabytes CPU 노드의 메모리 사용률(MB)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | CpuMemoryUtilizationPercentage CPU 노드의 메모리 사용률 백분율입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | CpuUtilization CPU 노드의 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuUtilization |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , NodeId ClusterName |
PT1M | 예 |
리소스 | CpuUtilizationMillicores CPU 노드의 사용률(밀리코어) 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationMillicores |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | CpuUtilizationPercentage CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | DiskAvailMegabytes 사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskAvailMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | DiskReadMegabytes 디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskReadMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | DiskUsedMegabytes 사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskUsedMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | DiskWriteMegabytes 디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskWriteMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
실행 | Errors 이 작업 영역의 실행 오류 수. 실행 시 오류가 발생할 때마다 개수가 업데이트됩니다. |
Errors |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
실행 | 실패한 실행 이 작업 영역에 대해 실패한 실행 수입니다. 실행이 실패하면 수가 업데이트 됩니다. |
Failed Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 | 실행 완료 이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 컬렉션이 아직 진행 중인 경우 개수가 업데이트됩니다. |
Finalizing Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
리소스 | GpuCapacityMilliGPU GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다. |
GpuCapacityMilliGPUs |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
리소스 | GpuEnergyJoules GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다. |
GpuEnergyJoules |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , rootRunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
리소스 | GpuMemoryCapacityMegabytes GPU 디바이스의 최대 메모리 용량(메가바이트)입니다. 용량은 1분 간격으로 집계됩니다. |
GpuMemoryCapacityMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
리소스 | GpuMemoryUtilization GPU 노드의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuMemoryUtilization |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , NodeId , DeviceId ClusterName |
PT1M | 예 |
리소스 | GpuMemoryUtilizationMegabytes GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
리소스 | GpuMemoryUtilizationPercentage GPU 디바이스의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
리소스 | GpuUtilization GPU 노드의 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuUtilization |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , NodeId , DeviceId ClusterName |
PT1M | 예 |
리소스 | GpuUtilizationMilliGPU 밀리 GPU의 GPU 디바이스 사용률입니다. 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationMilliGPUs |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
리소스 | GpuUtilizationPercentage GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
리소스 | IBReceiveMegabytes InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBReceiveMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
리소스 | IBTransmitMegabytes InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBTransmitMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
할당량 | 유휴 코어 유휴 코어 수 |
Idle Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 유휴 노드 유휴 노드 수. 유휴 노드는 어떤 작업도 실행하지 않지만 사용 가능한 경우 새 작업을 수락할 수 있는 노드입니다. |
Idle Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 코어 종료 종료 코어 수 |
Leaving Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 노드를 종료합니다. 나가는 노드 수입니다. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다. |
Leaving Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
모델 | 모델 배포 실패 이 작업 영역에서 실패한 모델 배포 수 |
Model Deploy Failed |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , StatusCode |
PT1M | 예 |
모델 | 모델 배포 시작 이 작업 영역에서 시작한 모델 배포 수 |
Model Deploy Started |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
모델 | 모델 배포 성공 이 작업 영역에서 성공한 모델 배포 수 |
Model Deploy Succeeded |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
모델 | 모델 등록 실패 이 작업 영역에서 실패한 모델 등록 수 |
Model Register Failed |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , StatusCode |
PT1M | 예 |
모델 | 모델 등록 성공 이 작업 영역에서 성공한 모델 등록 수 |
Model Register Succeeded |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
리소스 | NetworkInputMegabytes 수신된 네트워크 데이터(메가바이트)입니다. 메트릭은 1분 간격으로 집계됩니다. |
NetworkInputMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
리소스 | NetworkOutputMegabytes 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
NetworkOutputMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
실행 | 응답하지 않는 실행 이 작업 영역에 대해 응답하지 않는 실행 수입니다. 실행이 응답하지 않는 상태로 들어가면 개수가 업데이트됩니다. |
Not Responding Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 | 시작되지 않은 실행 이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 수가 업데이트됩니다. |
Not Started Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
할당량 | 선점된 코어 선점된 코어 수 |
Preempted Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 선점된 노드 선점된 노드 수입니다. 이러한 노드는 사용 가능한 노드 풀에서 제거되는 우선 순위가 낮은 노드입니다. |
Preempted Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
실행 | 실행 준비 이 작업 영역에 대해 준비 중인 실행 수. 실행 환경이 준비되는 동안 실행이 준비 상태로 들어가면 개수가 업데이트됩니다. |
Preparing Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 | 프로비전 실행 이 작업 영역에 대해 프로비전하는 실행 수입니다. 계산 대상 생성 또는 프로비저닝을 기다리는 동안 실행이 대기하는 경우 개수가 업데이트됩니다. |
Provisioning Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 | 대기 중 실행 이 작업 영역에 대해 대기 중인 실행 수입니다. 실행이 컴퓨팅 대상의 큐에서 대기할 때 수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기할 때 발생할 수 있습니다. |
Queued Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
할당량 | 할당량 사용률 사용된 할당량의 백분율 |
Quota Utilization Percentage |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName , VmFamilyName VmPriority |
PT1M | 예 |
실행 | 시작된 실행 이 작업 영역에 대해 실행 중인 실행 수. 실행이 필요한 리소스에서 실행되기 시작할 때 개수가 업데이트됩니다. |
Started Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 | 실행 시작 이 작업 영역에 대해 시작된 실행 수. 실행 ID와 같은 실행 및 실행 정보를 만들기 위한 요청이 채워진 후 개수가 업데이트됩니다. |
Starting Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
리소스 | StorageAPIFailureCount Azure Blob Storage API 호출 실패 횟수 |
StorageAPIFailureCount |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
리소스 | StorageAPISuccessCount Azure Blob Storage API 호출 성공 횟수 |
StorageAPISuccessCount |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
할당량 | 총 코어 수 총 코어 수 |
Total Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 총 노드 수 총 노드 수. 이 합계에는 일부 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 노드 종료가 포함됩니다. |
Total Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 사용할 수 없는 코어 사용할 수 없는 코어 수 |
Unusable Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 | 사용할 수 없는 노드 사용할 수 없는 노드 수입니다. 사용할 수 없는 노드는 확인할 수 없는 문제 때문에 작동하지 않는 노드입니다. Azure에서는 이러한 노드를 재활용합니다. |
Unusable Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
실행 | 경고 이 작업 영역의 실행 경고 수입니다. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다. |
Warnings |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints에 대해 지원되는 메트릭
다음 표에서는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
- 모든 테이블에 모든 열이 있는 것은 아닙니다.
- 일부 열은 페이지의 보기 영역 밖에 있을 수 있습니다. 사용 가능한 모든 열을 보려면 테이블 확장을 선택합니다.
테이블 제목
- 범주 - 메트릭 그룹 또는 분류입니다.
- 메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
- REST API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
- 단위 - 측정 단위입니다.
- 집계 - 기본 집계 형식입니다. 유효한 값은 평균(Avg), 최소(Min), 최대(Max), 합계(Sum), 개수입니다.
- 차원 - 메트릭에 사용할 수 있는 차원입니다.
- 시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어,
PT1M
은 메트릭이 1분마다,PT30M
은 30분마다,PT1H
는 1시간마다 샘플링됨을 나타냅니다. - DS 내보내기- 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부를 나타냅니다. 메트릭 내보내기에 대한 자세한 내용은 Azure Monitor의 진단 설정 생성을 참조하세요.
범주 | 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|---|
트래픽 | 활성 연결 클라이언트에서 활성화된 총 동시 TCP 연결 수입니다. |
ConnectionsActive |
Count | 평균 | <없음> | PT1M | 아니요 |
트래픽 | 분당 데이터 수집 오류 분당 삭제된 데이터 수집 이벤트 수입니다. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maximum, Average | deployment , , reason type |
PT1M | 아니요 |
트래픽 | 분당 데이터 수집 이벤트 분당 처리된 데이터 수집 이벤트 수입니다. |
DataCollectionEventsPerMinute |
Count | Minimum, Maximum, Average | deployment , type |
PT1M | 아니요 |
트래픽 | 네트워크 바이트 엔드포인트에 제공되는 초당 바이트입니다. |
NetworkBytes |
BytesPerSecond | 평균 | <없음> | PT1M | 아니요 |
트래픽 | 초당 새 연결 수 클라이언트에서 설정된 초당 새 TCP 연결의 평균 수입니다. |
NewConnectionsPerSecond |
초당 개수 | 평균 | <없음> | PT1M | 아니요 |
트래픽 | 요청 대기 시간 요청이 응답되는 데 걸리는 평균 전체 시간 간격(밀리초) |
RequestLatency |
밀리초 | 평균 | deployment |
PT1M | 예 |
트래픽 | 대기 시간 요청 P50 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P50 요청 대기 시간 |
RequestLatency_P50 |
밀리초 | 평균 | deployment |
PT1M | 예 |
트래픽 | 대기 시간 요청 P90 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P90 요청 대기 시간 |
RequestLatency_P90 |
밀리초 | 평균 | deployment |
PT1M | 예 |
트래픽 | 대기 시간 요청 P95 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P95 요청 대기 시간 |
RequestLatency_P95 |
밀리초 | 평균 | deployment |
PT1M | 예 |
트래픽 | 대기 시간 요청 P99 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P99 요청 대기 시간 |
RequestLatency_P99 |
밀리초 | 평균 | deployment |
PT1M | 예 |
트래픽 | 분당 요청 1분 이내에 온라인 엔드포인트로 전송된 요청 수 |
RequestsPerMinute |
Count | 평균 | deployment , statusCode , statusCodeClass modelStatusCode |
PT1M | 아니요 |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments에 대해 지원되는 메트릭
다음 표에서는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
- 모든 테이블에 모든 열이 있는 것은 아닙니다.
- 일부 열은 페이지의 보기 영역 밖에 있을 수 있습니다. 사용 가능한 모든 열을 보려면 테이블 확장을 선택합니다.
테이블 제목
- 범주 - 메트릭 그룹 또는 분류입니다.
- 메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
- REST API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
- 단위 - 측정 단위입니다.
- 집계 - 기본 집계 형식입니다. 유효한 값은 평균(Avg), 최소(Min), 최대(Max), 합계(Sum), 개수입니다.
- 차원 - 메트릭에 사용할 수 있는 차원입니다.
- 시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어,
PT1M
은 메트릭이 1분마다,PT30M
은 30분마다,PT1H
는 1시간마다 샘플링됨을 나타냅니다. - DS 내보내기- 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부를 나타냅니다. 메트릭 내보내기에 대한 자세한 내용은 Azure Monitor의 진단 설정 생성을 참조하세요.
범주 | 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|---|
리소스 | CPU 메모리 사용률 인스턴스의 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuMemoryUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
리소스 | CPU 사용률 인스턴스의 CPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
리소스 | 분당 데이터 수집 오류 분당 삭제된 데이터 수집 이벤트 수입니다. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maximum, Average | instanceId , , reason type |
PT1M | 아니요 |
리소스 | 분당 데이터 수집 이벤트 분당 처리된 데이터 수집 이벤트 수입니다. |
DataCollectionEventsPerMinute |
Count | Minimum, Maximum, Average | instanceId , type |
PT1M | 아니요 |
리소스 | 배포 용량 배포의 인스턴스 수입니다. |
DeploymentCapacity |
Count | Minimum, Maximum, Average | instanceId , State |
PT1M | 아니요 |
리소스 | 디스크 사용률 인스턴스의 디스크 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
DiskUtilization |
퍼센트 | Minimum, Maximum, Average | instanceId , disk |
PT1M | 예 |
리소스 | 줄 단위의 GPU 에너지 GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다. |
GpuEnergyJoules |
Count | Minimum, Maximum, Average | instanceId |
PT1M | 아니요 |
리소스 | GPU 메모리 사용률 인스턴스의 GPU 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuMemoryUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
리소스 | GPU 사용률 인스턴스의 GPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
트래픽 | 대기 시간 요청 P50 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P50 요청 대기 시간 |
RequestLatency_P50 |
밀리초 | 평균 | <없음> | PT1M | 예 |
트래픽 | 대기 시간 요청 P90 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P90 요청 대기 시간 |
RequestLatency_P90 |
밀리초 | 평균 | <없음> | PT1M | 예 |
트래픽 | 대기 시간 요청 P95 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P95 요청 대기 시간 |
RequestLatency_P95 |
밀리초 | 평균 | <없음> | PT1M | 예 |
트래픽 | 대기 시간 요청 P99 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P99 요청 대기 시간 |
RequestLatency_P99 |
밀리초 | 평균 | <없음> | PT1M | 예 |
트래픽 | 분당 요청 1분 이내에 온라인 배포로 전송된 요청 수 |
RequestsPerMinute |
Count | 평균 | envoy_response_code |
PT1M | 아니요 |
메트릭 차원
메트릭 차원에 대한 자세한 내용은 다차원 메트릭을 참조하세요.
이 서비스에는 메트릭과 관련된 다음과 같은 차원이 있습니다.
차원 | 설명 |
---|---|
클러스터 이름 | 컴퓨팅 클러스터 리소스의 이름입니다. 모든 할당량 메트릭에 사용할 수 있습니다. |
Vm 제품군 이름 | 클러스터에서 사용하는 VM 제품군의 이름입니다. 할당량 사용률 비율에 사용할 수 있습니다. |
Vm 우선 순위 | VM의 우선 순위입니다. 할당량 사용률 비율에 사용할 수 있습니다. |
CreatedTime | CpuUtilization 및 GpuUtilization에만 사용할 수 있습니다. |
DeviceId | 디바이스의 ID입니다(GPU). GpuUtilization에만 사용할 수 있습니다. |
NodeId | 작업이 실행 중인 노드의 ID입니다. CpuUtilization 및 GpuUtilization에만 사용할 수 있습니다. |
RunId | 실행/작업의 ID입니다. CpuUtilization 및 GpuUtilization에만 사용할 수 있습니다. |
ComputeType | 실행에서 사용한 컴퓨팅 형식입니다. 완료된 실행, 실패한 실행 및 시작 실행에만 사용할 수 있습니다. |
PipelineStepType | 실행에 사용되는 PipelineStep의 형식입니다. 완료된 실행, 실패한 실행 및 시작 실행에만 사용할 수 있습니다. |
PublishedPipelineId | 실행에 사용되는 게시된 파이프라인의 ID입니다. 완료된 실행, 실패한 실행 및 시작 실행에만 사용할 수 있습니다. |
RunType | 실행 형식입니다. 완료된 실행, 실패한 실행 및 시작 실행에만 사용할 수 있습니다. |
RunType 차원의 유효한 값은 다음과 같습니다.
값 | 설명 |
---|---|
실험 | 파이프라인이 실행되지 않습니다. |
PipelineRun | StepRun의 부모인 파이프라인 실행입니다. |
StepRun | 파이프라인 단계에 대한 실행입니다. |
ReusedStepRun | 이전 실행을 다시 사용하는 파이프라인 단계에 대한 실행입니다. |
리소스 로그
이 섹션에는 이 서비스에 대해 모을 수 있는 리소스 로그 유형이 나열되어 있습니다. 이 섹션은 Azure Monitor에서 지원되는 모든 리소스 로그 범주 유형 목록에서 가져옵니다.
Microsoft.MachineLearningServices/registries에 대해 지원되는 리소스 로그
범주 | 범주 표시 이름 | 로그 테이블 | 기본 로그 플랜 지원 | 수집 시간 변환 지원 | 예시 쿼리 | 내보낼 비용 |
---|---|---|---|---|---|---|
RegistryAssetReadEvent |
레지스트리 자산 읽기 이벤트 | 아니요 | 아니요 | 예 | ||
RegistryAssetWriteEvent |
레지스트리 자산 쓰기 이벤트 | AmlRegistryWriteEventsLog Azure ML 레지스트리 쓰기 이벤트 로그입니다. 각 액세스 이벤트에 대한 사용자 ID, 자산 이름 및 버전을 포함하여 레지스트리 데이터 액세스(데이터 평면)를 사용하여 쓰기 작업의 레코드를 유지합니다. |
아니요 | 아니요 | 쿼리 | 예 |
Microsoft.MachineLearningServices/workspaces에 대해 지원되는 리소스 로그
범주 | 범주 표시 이름 | 로그 테이블 | 기본 로그 플랜 지원 | 수집 시간 변환 지원 | 예시 쿼리 | 내보낼 비용 |
---|---|---|---|---|---|---|
AmlComputeClusterEvent |
AmlComputeClusterEvent | AmlComputeClusterEvent AmlCompute 클러스터 이벤트 |
예 | 예 | 쿼리 | 아니요 |
AmlComputeClusterNodeEvent |
AmlComputeClusterNodeEvent | 아니요 | 아니요 | 예 | ||
AmlComputeCpuGpuUtilization |
AmlComputeCpuGpuUtilization | AmlComputeCpuGpuUtilization Azure Machine Learning Services CPU 및 GPU 사용률 로그. |
예 | 예 | 쿼리 | 아니요 |
AmlComputeJobEvent |
AmlComputeJobEvent | AmlComputeJobEvent AmlCompute 작업 이벤트 |
예 | 예 | 쿼리 | 아니요 |
AmlRunStatusChangedEvent |
AmlRunStatusChangedEvent | AmlRunStatusChangedEvent Azure Machine Learning 서비스는 상태 이벤트 로그를 실행합니다. |
예 | 예 | 아니요 | |
ComputeInstanceEvent |
ComputeInstanceEvent | AmlComputeInstanceEvent ML 컴퓨팅 인스턴스에 액세스(읽기/쓰기)할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
DataLabelChangeEvent |
DataLabelChangeEvent | AmlDataLabelEvent 데이터 레이블이나 해당 프로젝트에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
DataLabelReadEvent |
DataLabelReadEvent | AmlDataLabelEvent 데이터 레이블이나 해당 프로젝트에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
DataSetChangeEvent |
DataSetChangeEvent | AmlDataSetEvent 등록되거나 등록되지 않은 ML 데이터 저장소에 액세스(읽기, 생성 또는 삭제)되는 경우의 이벤트입니다. |
예 | 예 | 쿼리 | 예 |
DataSetReadEvent |
DataSetReadEvent | AmlDataSetEvent 등록되거나 등록되지 않은 ML 데이터 저장소에 액세스(읽기, 생성 또는 삭제)되는 경우의 이벤트입니다. |
예 | 예 | 쿼리 | 예 |
DataStoreChangeEvent |
DataStoreChangeEvent | AmlDataStoreEvent ML 데이터 저장소에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
DataStoreReadEvent |
DataStoreReadEvent | AmlDataStoreEvent ML 데이터 저장소에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
DeploymentEventACI |
DeploymentEventACI | AmlDeploymentEvent ACI 또는 AKS에서 모델을 배포할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
DeploymentEventAKS |
DeploymentEventAKS | AmlDeploymentEvent ACI 또는 AKS에서 모델을 배포할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
DeploymentReadEvent |
DeploymentReadEvent | AmlDeploymentEvent ACI 또는 AKS에서 모델을 배포할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
EnvironmentChangeEvent |
EnvironmentChangeEvent | AmlEnvironmentEvent ML 환경에 액세스할 때 발생하는 이벤트입니다(읽기, 생성 또는 삭제). |
예 | 예 | 쿼리 | 예 |
EnvironmentReadEvent |
EnvironmentReadEvent | AmlEnvironmentEvent ML 환경에 액세스할 때 발생하는 이벤트입니다(읽기, 생성 또는 삭제). |
예 | 예 | 쿼리 | 예 |
InferencingOperationACI |
InferencingOperationACI | AmlInferencingEvent AKS 또는 ACI 컴퓨팅 형식에 대한 유추 또는 관련 작업의 이벤트입니다. |
예 | 예 | 예 | |
InferencingOperationAKS |
InferencingOperationAKS | AmlInferencingEvent AKS 또는 ACI 컴퓨팅 형식에 대한 유추 또는 관련 작업의 이벤트입니다. |
예 | 예 | 예 | |
ModelsActionEvent |
ModelsActionEvent | AmlModelsEvent ML 모델에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. 모델 및 자산의 패키징이 빌드할 준비가 된 패키지로 발생할 때 이벤트를 인큐베이션합니다. |
예 | 예 | 쿼리 | 예 |
ModelsChangeEvent |
ModelsChangeEvent | AmlModelsEvent ML 모델에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. 모델 및 자산의 패키징이 빌드할 준비가 된 패키지로 발생할 때 이벤트를 인큐베이션합니다. |
예 | 예 | 쿼리 | 예 |
ModelsReadEvent |
ModelsReadEvent | AmlModelsEvent ML 모델에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. 모델 및 자산의 패키징이 빌드할 준비가 된 패키지로 발생할 때 이벤트를 인큐베이션합니다. |
예 | 예 | 쿼리 | 예 |
PipelineChangeEvent |
PipelineChangeEvent | AmlPipelineEvent ML 파이프라인 초안 또는 엔드포인트 또는 모듈에 액세스할 때 발생하는 이벤트입니다(읽기, 생성 또는 삭제). |
예 | 예 | 예 | |
PipelineReadEvent |
PipelineReadEvent | AmlPipelineEvent ML 파이프라인 초안 또는 엔드포인트 또는 모듈에 액세스할 때 발생하는 이벤트입니다(읽기, 생성 또는 삭제). |
예 | 예 | 예 | |
RunEvent |
RunEvent | AmlRunEvent ML 실험에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. |
예 | 예 | 예 | |
RunReadEvent |
RunReadEvent | AmlRunEvent ML 실험에 액세스(읽기, 생성 또는 삭제)할 때 발생하는 이벤트입니다. |
예 | 예 | 예 |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints에 대해 지원되는 리소스 로그
범주 | 범주 표시 이름 | 로그 테이블 | 기본 로그 플랜 지원 | 수집 시간 변환 지원 | 예시 쿼리 | 내보낼 비용 |
---|---|---|---|---|---|---|
AmlOnlineEndpointConsoleLog |
AmlOnlineEndpointConsoleLog | AmlOnlineEndpointConsoleLog Azure ML 온라인 엔드포인트 콘솔 로그. 사용자 컨테이너의 콘솔 로그 출력을 제공합니다. |
예 | 예 | 쿼리 | 예 |
AmlOnlineEndpointEventLog |
AmlOnlineEndpointEventLog | AmlOnlineEndpointEventLog Azure ML 온라인 엔드포인트 이벤트 로그. 유추 서버 컨테이너의 수명 주기와 관련된 이벤트 로그를 제공합니다. |
아니요 | 아니요 | 쿼리 | 예 |
AmlOnlineEndpointTrafficLog |
AmlOnlineEndpointTrafficLog | AmlOnlineEndpointTrafficLog AzureML(기계 학습) 온라인 엔드포인트에 대한 트래픽 로그입니다. 이 테이블을 사용하여 온라인 엔드포인트에 대한 요청의 자세한 정보를 확인할 수 있습니다. 예를 들어 요청 기간, 요청 실패 이유 등을 확인하는 데 사용할 수 있습니다. |
아니요 | 아니요 | 쿼리 | 예 |
Azure Monitor 로그 테이블
이 섹션은 이 서비스와 관련이 있고 Kusto 쿼리를 사용하는 Log Analytics의 쿼리에 사용할 수 있는 Azure Monitor 로그 테이블을 나열합니다. 테이블에는 리소스 로그 데이터가 포함되며 수집 및 라우팅되는 항목에 따라 더 많은 데이터가 포함될 수 있습니다.
Machine Learning
Microsoft.MachineLearningServices/workspaces
- AzureActivity
- AMLOnlineEndpointConsoleLog
- AMLOnlineEndpointTrafficLog
- AMLOnlineEndpointEventLog
- AzureMetrics
- AMLComputeClusterEvent
- AMLComputeClusterNodeEvent
- AMLComputeJobEvent
- AMLRunStatusChangedEvent
- AMLComputeCpuGpuUtilization
- AMLComputeInstanceEvent
- AMLDataLabelEvent
- AMLDataSetEvent
- AMLDataStoreEvent
- AMLDeploymentEvent
- AMLEnvironmentEvent
- AMLInferencingEvent
- AMLModelsEvent
- AMLPipelineEvent
- AMLRunEvent
Microsoft.MachineLearningServices/registries
활동 로그
연결된 테이블에는 이 서비스의 활동 로그에 기록할 수 있는 작업이 나열되어 있습니다. 이 작업은 활동 로그에서 가능한 모든 리소스 공급자 작업의 하위 집합입니다.
활동 로그 항목의 스키마에 대한 자세한 내용은 활동 로그 스키마를 참조하세요.
다음 표에서는 활동 로그에서 만들 수 있는 Machine Learning과 관련된 일부 작업을 나열합니다. Microsoft.MachineLearningServices 작업의 전체 목록은 Microsoft.MachineLearningServices 리소스 공급자 작업을 참조 하세요.
연산 | 설명 |
---|---|
Machine Learning 작업 영역을 만들거나 업데이트합니다. | 작업 영역을 만들거나 업데이트함 |
CheckComputeNameAvailability | 컴퓨팅 이름이 이미 사용 중인지 확인 |
컴퓨팅 리소스를 만들거나 업데이트합니다. | 컴퓨팅 리소스를 만들거나 업데이트함 |
컴퓨팅 리소스를 삭제합니다. | 컴퓨팅 리소스가 삭제되었습니다. |
비밀 나열 | Machine Learning 작업 영역에 대해 나열된 비밀 작업 |
로그 스키마
Azure Machine Learning은 다음 스키마를 사용합니다.
AmlComputeJobEvent 테이블
속성 | 설명 |
---|---|
TimeGenerated | 로그 항목이 생성된 시간 |
OperationName | 로그 이벤트와 연결된 작업의 이름 |
범주 | 로그 이벤트의 이름 |
JobId | 제출된 작업의 ID |
ExperimentId | 실험의 ID |
ExperimentName | 실험의 이름 |
CustomerSubscriptionId | 실험 및 작업이 제출된 SubscriptionId |
WorkspaceName | 기계 학습 작업 영역의 이름 |
ClusterName | 클러스터의 이름 |
ProvisioningState | 작업 제출 상태 |
ResourceGroupName | 리소스 그룹의 이름 |
JobName | 작업 이름 |
ClusterId | 클러스터의 ID |
EventType | 작업 이벤트의 형식입니다. 예: JobSubmitted, JobRunning, JobFailed, JobSucceeded |
ExecutionState | 작업의 상태입니다(Run). 예를 들어 대기 중, 실행 중, 성공, 실패 |
ErrorDetails | 작업 오류 세부 정보 |
CreationApiVersion | 작업을 만드는 데 사용되는 API 버전 |
ClusterResourceGroupName | 클러스터의 리소스 그룹 이름 |
TFWorkerCount | TF 작업자의 수 |
TFParameterServerCount | TF 매개 변수 서버 수 |
ToolType | 사용된 도구의 유형 |
RunInContainer | 컨테이너 내에서 작업을 실행해야 하는지를 설명하는 플래그 |
JobErrorMessage | 작업 오류의 자세한 메시지 |
NodeId | 작업이 실행 중인 노드의 ID |
AmlComputeClusterEvent 테이블
속성 | 설명 |
---|---|
TimeGenerated | 로그 항목이 생성된 시간 |
OperationName | 로그 이벤트와 연결된 작업의 이름 |
범주 | 로그 이벤트의 이름 |
ProvisioningState | 클러스터의 프로비전 상태 |
ClusterName | 클러스터의 이름 |
ClusterType | 클러스터의 유형 |
생성자 | 클러스터를 만든 사용자 |
CoreCount | 클러스터의 코어 수 |
VmSize | 클러스터의 Vm 크기 |
VmPriority | 클러스터 전용/LowPriority 내에서 만든 노드의 우선 순위 |
ScalingType | 클러스터 크기 조정 수동/자동 유형 |
InitialNodeCount | 클러스터의 초기 노드 수 |
MinimumNodeCount | 클러스터의 최소 노드 수 |
MaximumNodeCount | 클러스터의 최대 노드 수 |
NodeDeallocationOption | 노드 할당을 취소하는 방법 |
게시자 | 클러스터 유형의 게시자 |
제안 | 클러스터가 만들어지는 제품 |
Sku | 클러스터 내에서 만든 노드/VM의 SKU |
버전 | 노드/VM이 생성되는 동안 사용된 이미지의 버전 |
SubnetId | 클러스터의 SubnetId |
AllocationState | 클러스터 할당 상태 |
CurrentNodeCount | 클러스터의 현재 노드 수 |
TargetNodeCount | 스케일 업/다운하는 동안 클러스터의 대상 노드 수 |
EventType | 클러스터를 만드는 동안 발생하는 이벤트의 유형입니다. |
NodeIdleTimeSecondsBeforeScaleDown | 클러스터가 스케일 다운되기까지 유휴 시간(초) |
PreemptedNodeCount | 클러스터의 선점된 노드 수 |
IsResizeGrow | 클러스터가 확장 중임을 나타내는 플래그 |
VmFamilyName | 클러스터 내에서 만들 수 있는 노드의 VM 제품군 이름 |
LeavingNodeCount | 클러스터의 노드 수 종료 |
UnusableNodeCount | 클러스터의 사용 불가 노드 수 |
IdleNodeCount | 클러스터의 유휴 상태인 노드 수 |
RunningNodeCount | 클러스터의 실행 중인 노드 수 |
PreparingNodeCount | 클러스터의 노드 수 준비 |
QuotaAllocated | 클러스터에 할당된 할당량 |
QuotaUtilized | 클러스터의 사용 할당량 |
AllocationStateTransitionTime | 한 상태에서 다른 상태로 전환 시간 |
ClusterErrorCodes | 클러스터를 만들거나 스케일링하는 동안 수신된 오류 코드 |
CreationApiVersion | 클러스터를 만드는 동안 사용되는 API 버전 |
AmlComputeInstanceEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlComputeInstanceEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
CorrelationId | 해당하는 경우 관련 이벤트 집합을 그룹화하기 위해 사용되는 GUID입니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlComputeInstanceName | "로그 항목과 연결된 컴퓨팅 인스턴스의 이름입니다. |
AmlDataLabelEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlDataLabelEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
CorrelationId | 해당하는 경우 관련 이벤트 집합을 그룹화하기 위해 사용되는 GUID입니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlProjectId | Azure Machine Learning 프로젝트의 고유 식별자입니다. |
AmlProjectName | Azure Machine Learning 프로젝트의 이름입니다. |
AmlLabelNames | 프로젝트에 대해 만들어진 레이블 클래스 이름입니다. |
AmlDataStoreName | 프로젝트의 데이터가 저장되는 데이터 저장소의 이름입니다. |
AmlDataSetEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlDataSetEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
AmlWorkspaceId | Azure Machine Learning 작업 영역의 GUID 및 고유 ID입니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlDatasetId | Azure Machine Learning 데이터 집합의 ID입니다. |
AmlDatasetName | Azure Machine Learning 데이터 집합의 이름입니다. |
AmlDataStoreEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlDataStoreEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
AmlWorkspaceId | Azure Machine Learning 작업 영역의 GUID 및 고유 ID입니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlDatastoreName | Azure Machine Learning 데이터 저장소의 이름입니다. |
AmlDeploymentEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlDeploymentEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlServiceName | Azure Machine Learning Service의 이름입니다. |
AmlInferencingEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlInferencingEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlServiceName | Azure Machine Learning Service의 이름입니다. |
AmlModelsEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlModelsEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
ResultSignature | 이벤트의 HTTP 상태 코드입니다. 일반적인 값에는 200, 201, 202 등이 포함됩니다. |
AmlModelName | Azure Machine Learning 모델의 이름입니다. |
AmlPipelineEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlPipelineEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
AmlWorkspaceId | Azure Machine Learning 작업 영역의 GUID 및 고유 ID입니다. |
AmlWorkspaceId | Azure Machine Learning 작업 영역의 이름입니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlModuleId | 모듈의 GUID 및 고유 ID입니다. |
AmlModelName | Azure Machine Learning 모델의 이름입니다. |
AmlPipelineId | Azure Machine Learning 파이프라인의 ID입니다. |
AmlParentPipelineId | 부모 Azure Machine Learning 파이프라인(복제의 경우)의 ID입니다. |
AmlPipelineDraftId | Azure Machine Learning 파이프라인 초안의 ID입니다. |
AmlPipelineDraftName | Azure Machine Learning 파이프라인 초안의 이름입니다. |
AmlPipelineEndpointId | Azure Machine Learning 파이프라인 엔드포인트의 ID입니다. |
AmlPipelineEndpointName | Azure Machine Learning 파이프라인 엔드포인트의 이름입니다. |
AmlRunEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlRunEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
ResultType | 이벤트의 상태입니다. 일반적인 값에는 Started, In Progress, Succeeded, Failed, Active 및 Resolved가 포함됩니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
AmlWorkspaceId | Azure Machine Learning 작업 영역의 GUID 및 고유 ID입니다. |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
RunId | 실행의 고유 ID입니다. |
AmlEnvironmentEvent 테이블
속성 | 설명 |
---|---|
Type | 로그 이벤트의 이름, AmlEnvironmentEvent |
TimeGenerated | 로그 항목이 생성된 시간(UTC) |
수준 | 이벤트의 심각도 수준입니다. 정보, 경고, 오류 또는 위험 중 하나여야 합니다. |
OperationName | 로그 항목과 연결된 작업의 이름 |
ID | 작업을 수행한 사용자 또는 애플리케이션의 ID입니다. |
AadTenantId | 작업이 제출된 Microsoft Entra 테넌트 ID입니다. |
AmlEnvironmentName | Azure Machine Learning 환경 구성의 이름입니다. |
AmlEnvironmentVersion | Azure Machine Learning 환경 구성 버전의 이름입니다. |
AMLOnlineEndpointTrafficLog 테이블(미리 보기)
속성 | 설명 |
---|---|
메서드 | 클라이언트에서 요청한 메서드. |
Path | 클라이언트에서 요청한 경로. |
SubscriptionId | 온라인 엔드포인트의 기계 학습 구독 ID. |
Azure Machine LearningWorkspaceId | 온라인 엔드포인트의 기계 학습 작업 영역 ID. |
Azure Machine LearningWorkspaceName | 온라인 엔드포인트의 기계 학습 작업 영역 이름입니다. |
EndpointName | 온라인 엔드포인트의 이름. |
DeploymentName | 온라인 배포의 이름. |
프로토콜 | 요청의 프로토콜. |
ResponseCode | 클라이언트에 반환된 최종 응답 코드. |
ResponseCodeReason | 클라이언트에 반환된 최종 응답 코드 이유. |
ModelStatusCode | 모델의 응답 상태 코드. |
ModelStatusReason | 모델의 응답 상태 설명. |
RequestPayloadSize | 클라이언트에서 받은 총 바이트 수. |
ResponsePayloadSize | 클라이언트로 다시 전송된 총 바이트 수. |
UserAgent | 주석을 포함하지만 최대 70자로 잘린 요청의 사용자 에이전트 헤더입니다. |
XRequestId | 내부 추적을 위해 Azure Machine Learning에서 생성한 요청 ID. |
XMSClientRequestId | 클라이언트가 생성한 추적 ID. |
TotalDurationMs | 요청 시작 시간부터 클라이언트로 다시 전송된 마지막 응답 바이트까지의 기간(밀리초). 클라이언트 연결이 끊어진 경우 시작 시간부터 클라이언트 연결 끊기 시간까지 측정합니다. |
RequestDurationMs | 요청 시작 시간부터 클라이언트에서 받은 요청의 마지막 바이트까지의 기간(밀리초). |
ResponseDurationMs | 요청 시작 시간부터 모델에서 읽은 첫 번째 응답 바이트까지의 기간(밀리초). |
RequestThrottlingDelayMs | 네트워크 제한으로 인한 요청 데이터 전송 지연 시간(밀리초). |
ResponseThrottlingDelayMs | 네트워크 제한으로 인한 응답 데이터 전송 지연 시간(밀리초). |
이 로그에 대한 자세한 내용은 온라인 엔드포인트 모니터링을 참조하세요.
AMLOnlineEndpointConsoleLog
속성 | 설명 |
---|---|
TimeGenerated | 로그가 생성된 시간의 타임스탬프(UTC)입니다. |
OperationName | 로그 레코드와 연결된 작업입니다. |
InstanceId | 이 로그 레코드를 생성한 인스턴스의 ID입니다. |
DeploymentName | 로그 레코드와 연결된 배포의 이름입니다. |
ContainerName | 로그가 생성된 컨테이너의 이름. |
메시지 | 로그 콘텐츠입니다. |
이 로그에 대한 자세한 내용은 온라인 엔드포인트 모니터링을 참조하세요.
AmlOnlineEndpointEventLog(미리 보기)
속성 | 설명 |
---|---|
TimeGenerated | 로그가 생성된 시간의 타임스탬프(UTC)입니다. |
OperationName | 로그 레코드와 연결된 작업입니다. |
InstanceId | 이 로그 레코드를 생성한 인스턴스의 ID입니다. |
DeploymentName | 로그 레코드와 연결된 배포의 이름입니다. |
이름 | 이벤트의 이름입니다. |
메시지 | 이벤트 내용. |
이 로그에 대한 자세한 내용은 온라인 엔드포인트 모니터링을 참조하세요.
관련 콘텐츠
- Machine Learning 모니터링에 대한 설명은 Machine Learning 모니터링을 참조하세요.
- Azure 리소스 모니터링에 대한 자세한 내용은 Azure Monitor를 사용한 Azure 리소스 모니터링을 참조하세요.