Condividi tramite


Metriche supportate per Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

La tabella seguente elenca le metriche disponibili per il tipo di risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Intestazioni di tabella

Metrica: nome visualizzato della metrica come visualizzato nella portale di Azure.
Nome nell'API REST : nome della metrica, come indicato nell'API REST.
Unità: Unità di misura.
Aggregazione: tipo di aggregazione predefinito. Valori validi: Average, Minimum, Maximum, Total, Count.
Dimensioni - Dimensioni disponibili per la metrica.
Intervalli di tempo - Intervalli in cui viene campionata la metrica. Ad esempio, PT1M indica che la metrica viene campionata ogni minuto, PT30M ogni 30 minuti, PT1H ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite le impostazioni di diagnostica.

Per informazioni sull'esportazione delle metriche, vedere - Esportazione delle metriche usando le regole di raccolta dati e Creare impostazioni di diagnostica in Monitoraggio di Azure.

Per informazioni sulla conservazione delle metriche, vedere Informazioni generali sulle metriche del Monitoraggio di Azure.

Categoria: Risorsa

Metric Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Percentuale utilizzo memoria CPU

Percentuale di utilizzo della memoria in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.
CpuMemoryUtilizationPercentage Percentuale Minimo, Massimo, Medio instanceId PT1M
Percentuale utilizzo CPU

Percentuale di utilizzo della CPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.
CpuUtilizationPercentage Percentuale Minimo, Massimo, Medio instanceId PT1M
Errori di raccolta dati al minuto

Numero di eventi di raccolta dati eliminati al minuto.
DataCollectionErrorsPerMinute Conteggio Minimo, Massimo, Medio instanceId, reason, type PT1M No
Eventi di raccolta dati al minuto

Numero di eventi di raccolta dati elaborati al minuto.
DataCollectionEventsPerMinute Conteggio Minimo, Massimo, Medio instanceId, type PT1M No
Capacità di distribuzione

Numero di istanze nella distribuzione.
DeploymentCapacity Conteggio Minimo, Massimo, Medio instanceId, State PT1M No
Utilizzo del disco

Percentuale di utilizzo del disco in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.
DiskUtilization Percentuale Minimo, Massimo, Medio instanceId, disk PT1M
Energia GPU in Joules

Energia dell'intervallo in Joules in un nodo GPU. L'energia viene segnalata a intervalli di un minuto.
GpuEnergyJoules Conteggio Minimo, Massimo, Medio instanceId PT1M No
Percentuale utilizzo memoria GPU

Percentuale di utilizzo della memoria GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.
GpuMemoryUtilizationPercentage Percentuale Minimo, Massimo, Medio instanceId PT1M
Percentuale utilizzo GPU

Percentuale di utilizzo della GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.
GpuUtilizationPercentage Percentuale Minimo, Massimo, Medio instanceId PT1M

Categoria: Traffico

Metric Nome nell'API REST Unità Aggregazione Dimensioni Intervalli di tempo Esportazione DS
Latenza delle richieste P50

Latenza media della richiesta P50 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato
RequestLatency_P50 Millisecondi Media <none> PT1M
Latenza delle richieste P90

Latenza media della richiesta P90 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato
RequestLatency_P90 Millisecondi Media <none> PT1M
Latenza delle richieste P95

Latenza media della richiesta P95 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato
RequestLatency_P95 Millisecondi Media <none> PT1M
Latenza delle richieste P99

Latenza media della richiesta P99 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato
RequestLatency_P99 Millisecondi Media <none> PT1M
Richieste al minuto

Numero di richieste inviate alla distribuzione online entro un minuto
RequestsPerMinute Conteggio Media envoy_response_code PT1M No

Passaggi successivi