다음을 통해 공유


Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments에 대해 지원되는 메트릭

다음 표에서는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.

테이블 제목

메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 형식입니다. 유효한 값: 평균, 최소값, 최대값, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어, PT1M은 메트릭이 1분마다, PT30M은 30분마다, PT1H는 1시간마다 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다.

메트릭을 내보내는 방법에 대한 자세한 내용은 - 데이터 수집 규칙을 사용하여 메트릭 내보내기 및 Azure Monitor에서 진단 설정 만들기를 참조하세요.

메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.

범주: 리소스

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
CPU 메모리 사용률

인스턴스의 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
CpuMemoryUtilizationPercentage 퍼센트 Minimum, Maximum, Average instanceId PT1M
CPU 사용률

인스턴스의 CPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
CpuUtilizationPercentage 퍼센트 Minimum, Maximum, Average instanceId PT1M
분당 데이터 수집 오류

분당 삭제된 데이터 수집 이벤트 수입니다.
DataCollectionErrorsPerMinute Count Minimum, Maximum, Average instanceId, , reasontype PT1M 아니요
분당 데이터 수집 이벤트

분당 처리된 데이터 수집 이벤트 수입니다.
DataCollectionEventsPerMinute Count Minimum, Maximum, Average instanceId, type PT1M 아니요
배포 용량

배포의 인스턴스 수입니다.
DeploymentCapacity Count Minimum, Maximum, Average instanceId, State PT1M 아니요
디스크 사용률

인스턴스의 디스크 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
DiskUtilization 퍼센트 Minimum, Maximum, Average instanceId, disk PT1M
줄 단위의 GPU 에너지

GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다.
GpuEnergyJoules Count Minimum, Maximum, Average instanceId PT1M 아니요
GPU 메모리 사용률

인스턴스의 GPU 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
GpuMemoryUtilizationPercentage 퍼센트 Minimum, Maximum, Average instanceId PT1M
GPU 사용률

인스턴스의 GPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
GpuUtilizationPercentage 퍼센트 Minimum, Maximum, Average instanceId PT1M

범주: 트래픽

메트릭 REST API의 이름 단위 집계 차원 시간 조직 DS 내보내기
대기 시간 요청 P50

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P50 요청 대기 시간
RequestLatency_P50 밀리초 평균 <없음> PT1M
대기 시간 요청 P90

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P90 요청 대기 시간
RequestLatency_P90 밀리초 평균 <없음> PT1M
대기 시간 요청 P95

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P95 요청 대기 시간
RequestLatency_P95 밀리초 평균 <없음> PT1M
대기 시간 요청 P99

선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P99 요청 대기 시간
RequestLatency_P99 밀리초 평균 <없음> PT1M
분당 요청

1분 이내에 온라인 배포로 전송된 요청 수
RequestsPerMinute Count 평균 envoy_response_code PT1M 아니요

다음 단계