Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments에 대해 지원되는 메트릭
다음 표에서는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
테이블 제목
메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 형식입니다. 유효한 값: 평균, 최소값, 최대값, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어, PT1M
은 메트릭이 1분마다, PT30M
은 30분마다, PT1H
는 1시간마다 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다.
메트릭을 내보내는 방법에 대한 자세한 내용은 - 데이터 수집 규칙을 사용하여 메트릭 내보내기 및 Azure Monitor에서 진단 설정 만들기를 참조하세요.
메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.
범주: 리소스
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
CPU 메모리 사용률 인스턴스의 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuMemoryUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
CPU 사용률 인스턴스의 CPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
분당 데이터 수집 오류 분당 삭제된 데이터 수집 이벤트 수입니다. |
DataCollectionErrorsPerMinute |
Count | Minimum, Maximum, Average | instanceId , , reason type |
PT1M | 아니요 |
분당 데이터 수집 이벤트 분당 처리된 데이터 수집 이벤트 수입니다. |
DataCollectionEventsPerMinute |
Count | Minimum, Maximum, Average | instanceId , type |
PT1M | 아니요 |
배포 용량 배포의 인스턴스 수입니다. |
DeploymentCapacity |
Count | Minimum, Maximum, Average | instanceId , State |
PT1M | 아니요 |
디스크 사용률 인스턴스의 디스크 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
DiskUtilization |
퍼센트 | Minimum, Maximum, Average | instanceId , disk |
PT1M | 예 |
줄 단위의 GPU 에너지 GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다. |
GpuEnergyJoules |
Count | Minimum, Maximum, Average | instanceId |
PT1M | 아니요 |
GPU 메모리 사용률 인스턴스의 GPU 메모리 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuMemoryUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
GPU 사용률 인스턴스의 GPU 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuUtilizationPercentage |
퍼센트 | Minimum, Maximum, Average | instanceId |
PT1M | 예 |
범주: 트래픽
메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
---|---|---|---|---|---|---|
대기 시간 요청 P50 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P50 요청 대기 시간 |
RequestLatency_P50 |
밀리초 | 평균 | <없음> | PT1M | 예 |
대기 시간 요청 P90 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P90 요청 대기 시간 |
RequestLatency_P90 |
밀리초 | 평균 | <없음> | PT1M | 예 |
대기 시간 요청 P95 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P95 요청 대기 시간 |
RequestLatency_P95 |
밀리초 | 평균 | <없음> | PT1M | 예 |
대기 시간 요청 P99 선택한 기간 동안 수집된 모든 요청 대기 시간 값으로 집계된 평균 P99 요청 대기 시간 |
RequestLatency_P99 |
밀리초 | 평균 | <없음> | PT1M | 예 |
분당 요청 1분 이내에 온라인 배포로 전송된 요청 수 |
RequestsPerMinute |
Count | 평균 | envoy_response_code |
PT1M | 아니요 |