Microsoft.MachineLearningServices/작업 영역에 대해 지원되는 메트릭
다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
테이블 제목
메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 형식입니다. 유효한 값: 평균, 최소값, 최대값, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어, PT1M
은 메트릭이 1분마다, PT30M
은 30분마다, PT1H
는 1시간마다 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다.
메트릭을 내보내는 방법에 대한 자세한 내용은 - 데이터 수집 규칙을 사용하여 메트릭 내보내기 및 Azure Monitor에서 진단 설정 만들기를 참조하세요.
메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.
지원되는 로그 목록은 지원되는 로그 범주 - Microsoft.MachineLearningServices/workspaces를 참조 하세요.
범주: 모델
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
모델 배포 실패 이 작업 영역에서 실패한 모델 배포 수 |
Model Deploy Failed |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , StatusCode |
PT1M | 예 |
모델 배포 시작 이 작업 영역에서 시작한 모델 배포 수 |
Model Deploy Started |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
모델 배포 성공 이 작업 영역에서 성공한 모델 배포 수 |
Model Deploy Succeeded |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
모델 등록 실패 이 작업 영역에서 실패한 모델 등록 수 |
Model Register Failed |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , StatusCode |
PT1M | 예 |
모델 등록 성공 이 작업 영역에서 성공한 모델 등록 수 |
Model Register Succeeded |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
범주: 할당량
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
Active Cores 활성 코어 수 |
Active Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
활성 노드 Acitve 노드 수입니다. 다음은 작업을 적극적으로 실행하는 노드입니다. |
Active Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
유휴 코어 유휴 코어 수 |
Idle Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
유휴 노드 유휴 노드 수. 유휴 노드는 어떤 작업도 실행하지 않지만 사용 가능한 경우 새 작업을 수락할 수 있는 노드입니다. |
Idle Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
코어 종료 종료 코어 수 |
Leaving Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
노드를 종료합니다. 나가는 노드 수입니다. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다. |
Leaving Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
선점된 코어 선점된 코어 수 |
Preempted Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
선점된 노드 선점된 노드 수입니다. 이러한 노드는 사용 가능한 노드 풀에서 제거되는 우선 순위가 낮은 노드입니다. |
Preempted Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
할당량 사용률 사용된 할당량의 백분율 |
Quota Utilization Percentage |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName , VmFamilyName VmPriority |
PT1M | 예 |
총 코어 수 총 코어 수 |
Total Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
총 노드 수 총 노드 수. 이 합계에는 일부 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 노드 종료가 포함됩니다. |
Total Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
사용할 수 없는 코어 사용할 수 없는 코어 수 |
Unusable Cores |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
사용할 수 없는 노드 사용할 수 없는 노드 수입니다. 사용할 수 없는 노드는 확인할 수 없는 문제 때문에 작동하지 않는 노드입니다. Azure에서는 이러한 노드를 재활용합니다. |
Unusable Nodes |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , ClusterName |
PT1M | 예 |
범주: 리소스
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
CpuCapacityMillicores CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다. |
CpuCapacityMillicores |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
CpuMemoryCapacityMegabytes CPU 노드의 최대 메모리 사용률(메가바이트)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryCapacityMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
CpuMemoryUtilizationMegabytes CPU 노드의 메모리 사용률(MB)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
CpuMemoryUtilizationPercentage CPU 노드의 메모리 사용률 백분율입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
CpuUtilization CPU 노드의 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuUtilization |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , NodeId ClusterName |
PT1M | 예 |
CpuUtilizationMillicores CPU 노드의 사용률(밀리코어) 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationMillicores |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
CpuUtilizationPercentage CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
DiskAvailMegabytes 사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskAvailMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
DiskReadMegabytes 디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskReadMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
DiskUsedMegabytes 사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskUsedMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
DiskWriteMegabytes 디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskWriteMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
GpuCapacityMilliGPU GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다. |
GpuCapacityMilliGPUs |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuEnergyJoules GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다. |
GpuEnergyJoules |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , rootRunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuMemoryCapacityMegabytes GPU 디바이스의 최대 메모리 용량(메가바이트)입니다. 용량은 1분 간격으로 집계됩니다. |
GpuMemoryCapacityMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuMemoryUtilization GPU 노드의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuMemoryUtilization |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , NodeId , DeviceId ClusterName |
PT1M | 예 |
GpuMemoryUtilizationMegabytes GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuMemoryUtilizationPercentage GPU 디바이스의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuUtilization GPU 노드의 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuUtilization |
Count | 평균, 최대, 최소, 합계(Sum) | Scenario , runId , NodeId , DeviceId ClusterName |
PT1M | 예 |
GpuUtilizationMilliGPU 밀리 GPU의 GPU 디바이스 사용률입니다. 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationMilliGPUs |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
GpuUtilizationPercentage GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationPercentage |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , DeviceId ComputeName |
PT1M | 예 |
IBReceiveMegabytes InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBReceiveMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
IBTransmitMegabytes InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBTransmitMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
NetworkInputMegabytes 수신된 네트워크 데이터(메가바이트)입니다. 메트릭은 1분 간격으로 집계됩니다. |
NetworkInputMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
NetworkOutputMegabytes 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
NetworkOutputMegabytes |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , InstanceId , ComputeName DeviceId |
PT1M | 예 |
StorageAPIFailureCount Azure Blob Storage API 호출 실패 횟수 |
StorageAPIFailureCount |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
StorageAPISuccessCount Azure Blob Storage API 호출 성공 횟수 |
StorageAPISuccessCount |
Count | 평균, 최대, 최소, 합계(Sum) | RunId , , InstanceId ComputeName |
PT1M | 예 |
범주: 실행
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
요청된 실행 취소 이 작업 영역에 대해 취소가 요청된 실행 수. 실행에 대한 취소 요청을 받은 경우 개수가 업데이트됩니다. |
Cancel Requested Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
취소된 실행 이 작업 영역에 대해 취소된 실행 수입니다. 실행이 성공적으로 취소되면 개수가 업데이트됩니다. |
Cancelled Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
완료된 실행 이 작업 영역에 대해 성공적으로 완료된 실행 수입니다. 실행이 완료되고 출력이 수집되면 수가 업데이트 됩니다. |
Completed Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
Errors 이 작업 영역의 실행 오류 수. 실행 시 오류가 발생할 때마다 개수가 업데이트됩니다. |
Errors |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
실패한 실행 이 작업 영역에 대해 실패한 실행 수입니다. 실행이 실패하면 수가 업데이트 됩니다. |
Failed Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 완료 이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 컬렉션이 아직 진행 중인 경우 개수가 업데이트됩니다. |
Finalizing Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
응답하지 않는 실행 이 작업 영역에 대해 응답하지 않는 실행 수입니다. 실행이 응답하지 않는 상태로 들어가면 개수가 업데이트됩니다. |
Not Responding Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
시작되지 않은 실행 이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 수가 업데이트됩니다. |
Not Started Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 준비 이 작업 영역에 대해 준비 중인 실행 수. 실행 환경이 준비되는 동안 실행이 준비 상태로 들어가면 개수가 업데이트됩니다. |
Preparing Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
프로비전 실행 이 작업 영역에 대해 프로비전하는 실행 수입니다. 계산 대상 생성 또는 프로비저닝을 기다리는 동안 실행이 대기하는 경우 개수가 업데이트됩니다. |
Provisioning Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
대기 중 실행 이 작업 영역에 대해 대기 중인 실행 수입니다. 실행이 컴퓨팅 대상의 큐에서 대기할 때 수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기할 때 발생할 수 있습니다. |
Queued Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
시작된 실행 이 작업 영역에 대해 실행 중인 실행 수. 실행이 필요한 리소스에서 실행되기 시작할 때 개수가 업데이트됩니다. |
Started Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
실행 시작 이 작업 영역에 대해 시작된 실행 수. 실행 ID와 같은 실행 및 실행 정보를 만들기 위한 요청이 채워진 후 개수가 업데이트됩니다. |
Starting Runs |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType ExperimentName |
PT1M | 예 |
경고 이 작업 영역의 실행 경고 수입니다. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다. |
Warnings |
Count | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |