다음을 통해 공유


Microsoft.MachineLearningServices/작업 영역에 대해 지원되는 메트릭

다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.

테이블 제목

메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 형식입니다. 유효한 값: 평균, 최소값, 최대값, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어, PT1M은 메트릭이 1분마다, PT30M은 30분마다, PT1H는 1시간마다 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다.

메트릭을 내보내는 방법에 대한 자세한 내용은 - 데이터 수집 규칙을 사용하여 메트릭 내보내기 및 Azure Monitor에서 진단 설정 만들기를 참조하세요.

메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.

지원되는 로그 목록은 지원되는 로그 범주 - Microsoft.MachineLearningServices/workspaces를 참조 하세요.

범주: 모델

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
모델 배포 실패

이 작업 영역에서 실패한 모델 배포 수
Model Deploy Failed Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, StatusCode PT1M
모델 배포 시작

이 작업 영역에서 시작한 모델 배포 수
Model Deploy Started Count 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
모델 배포 성공

이 작업 영역에서 성공한 모델 배포 수
Model Deploy Succeeded Count 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
모델 등록 실패

이 작업 영역에서 실패한 모델 등록 수
Model Register Failed Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, StatusCode PT1M
모델 등록 성공

이 작업 영역에서 성공한 모델 등록 수
Model Register Succeeded Count 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M

범주: 할당량

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
Active Cores

활성 코어 수
Active Cores Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
활성 노드

Acitve 노드 수입니다. 다음은 작업을 적극적으로 실행하는 노드입니다.
Active Nodes Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
유휴 코어

유휴 코어 수
Idle Cores Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
유휴 노드

유휴 노드 수. 유휴 노드는 어떤 작업도 실행하지 않지만 사용 가능한 경우 새 작업을 수락할 수 있는 노드입니다.
Idle Nodes Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
코어 종료

종료 코어 수
Leaving Cores Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
노드를 종료합니다.

나가는 노드 수입니다. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다.
Leaving Nodes Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
선점된 코어

선점된 코어 수
Preempted Cores Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
선점된 노드

선점된 노드 수입니다. 이러한 노드는 사용 가능한 노드 풀에서 제거되는 우선 순위가 낮은 노드입니다.
Preempted Nodes Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
할당량 사용률

사용된 할당량의 백분율
Quota Utilization Percentage Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName, VmFamilyNameVmPriority PT1M
총 코어 수

총 코어 수
Total Cores Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
총 노드 수

총 노드 수. 이 합계에는 일부 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 노드 종료가 포함됩니다.
Total Nodes Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
사용할 수 없는 코어

사용할 수 없는 코어 수
Unusable Cores Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
사용할 수 없는 노드

사용할 수 없는 노드 수입니다. 사용할 수 없는 노드는 확인할 수 없는 문제 때문에 작동하지 않는 노드입니다. Azure에서는 이러한 노드를 재활용합니다.
Unusable Nodes Count 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M

범주: 리소스

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
CpuCapacityMillicores

CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다.
CpuCapacityMillicores Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuMemoryCapacityMegabytes

CPU 노드의 최대 메모리 사용률(메가바이트)입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryCapacityMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuMemoryUtilizationMegabytes

CPU 노드의 메모리 사용률(MB)입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuMemoryUtilizationPercentage

CPU 노드의 메모리 사용률 백분율입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationPercentage Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuUtilization

CPU 노드의 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다.
CpuUtilization Count 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeIdClusterName PT1M
CpuUtilizationMillicores

CPU 노드의 사용률(밀리코어) 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationMillicores Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuUtilizationPercentage

CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationPercentage Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskAvailMegabytes

사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskAvailMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskReadMegabytes

디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskReadMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskUsedMegabytes

사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskUsedMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskWriteMegabytes

디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskWriteMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
GpuCapacityMilliGPU

GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다.
GpuCapacityMilliGPUs Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuEnergyJoules

GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다.
GpuEnergyJoules Count 평균, 최대, 최소, 합계(Sum) Scenario, runId, rootRunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryCapacityMegabytes

GPU 디바이스의 최대 메모리 용량(메가바이트)입니다. 용량은 1분 간격으로 집계됩니다.
GpuMemoryCapacityMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryUtilization

GPU 노드의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다.
GpuMemoryUtilization Count 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M
GpuMemoryUtilizationMegabytes

GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryUtilizationPercentage

GPU 디바이스의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationPercentage Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuUtilization

GPU 노드의 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
GpuUtilization Count 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M
GpuUtilizationMilliGPU

밀리 GPU의 GPU 디바이스 사용률입니다. 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationMilliGPUs Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuUtilizationPercentage

GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationPercentage Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
IBReceiveMegabytes

InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBReceiveMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
IBTransmitMegabytes

InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBTransmitMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
NetworkInputMegabytes

수신된 네트워크 데이터(메가바이트)입니다. 메트릭은 1분 간격으로 집계됩니다.
NetworkInputMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
NetworkOutputMegabytes

발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
NetworkOutputMegabytes Count 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
StorageAPIFailureCount

Azure Blob Storage API 호출 실패 횟수
StorageAPIFailureCount Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
StorageAPISuccessCount

Azure Blob Storage API 호출 성공 횟수
StorageAPISuccessCount Count 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M

범주: 실행

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
요청된 실행 취소

이 작업 영역에 대해 취소가 요청된 실행 수. 실행에 대한 취소 요청을 받은 경우 개수가 업데이트됩니다.
Cancel Requested Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
취소된 실행

이 작업 영역에 대해 취소된 실행 수입니다. 실행이 성공적으로 취소되면 개수가 업데이트됩니다.
Cancelled Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
완료된 실행

이 작업 영역에 대해 성공적으로 완료된 실행 수입니다. 실행이 완료되고 출력이 수집되면 수가 업데이트 됩니다.
Completed Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
Errors

이 작업 영역의 실행 오류 수. 실행 시 오류가 발생할 때마다 개수가 업데이트됩니다.
Errors Count 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
실패한 실행

이 작업 영역에 대해 실패한 실행 수입니다. 실행이 실패하면 수가 업데이트 됩니다.
Failed Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
실행 완료

이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 컬렉션이 아직 진행 중인 경우 개수가 업데이트됩니다.
Finalizing Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
응답하지 않는 실행

이 작업 영역에 대해 응답하지 않는 실행 수입니다. 실행이 응답하지 않는 상태로 들어가면 개수가 업데이트됩니다.
Not Responding Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
시작되지 않은 실행

이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 수가 업데이트됩니다.
Not Started Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
실행 준비

이 작업 영역에 대해 준비 중인 실행 수. 실행 환경이 준비되는 동안 실행이 준비 상태로 들어가면 개수가 업데이트됩니다.
Preparing Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
프로비전 실행

이 작업 영역에 대해 프로비전하는 실행 수입니다. 계산 대상 생성 또는 프로비저닝을 기다리는 동안 실행이 대기하는 경우 개수가 업데이트됩니다.
Provisioning Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
대기 중 실행

이 작업 영역에 대해 대기 중인 실행 수입니다. 실행이 컴퓨팅 대상의 큐에서 대기할 때 수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기할 때 발생할 수 있습니다.
Queued Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
시작된 실행

이 작업 영역에 대해 실행 중인 실행 수. 실행이 필요한 리소스에서 실행되기 시작할 때 개수가 업데이트됩니다.
Started Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
실행 시작

이 작업 영역에 대해 시작된 실행 수. 실행 ID와 같은 실행 및 실행 정보를 만들기 위한 요청이 채워진 후 개수가 업데이트됩니다.
Starting Runs Count 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
경고

이 작업 영역의 실행 경고 수입니다. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다.
Warnings Count 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M

다음 단계