Metriche supportate per Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
La tabella seguente elenca le metriche disponibili per il tipo di risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Intestazioni di tabella
Metrica: nome visualizzato della metrica come visualizzato nella portale di Azure.
Nome nell'API REST : nome della metrica, come indicato nell'API REST.
Unità: Unità di misura.
Aggregazione: tipo di aggregazione predefinito. Valori validi: Average, Minimum, Maximum, Total, Count.
Dimensioni - Dimensioni disponibili per la metrica.
Intervalli di tempo - Intervalli in cui viene campionata la metrica. Ad esempio, PT1M
indica che la metrica viene campionata ogni minuto, PT30M
ogni 30 minuti, PT1H
ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite le impostazioni di diagnostica.
Per informazioni sull'esportazione delle metriche, vedere - Esportazione delle metriche usando le regole di raccolta dati e Creare impostazioni di diagnostica in Monitoraggio di Azure.
Per informazioni sulla conservazione delle metriche, vedere Informazioni generali sulle metriche del Monitoraggio di Azure.
Categoria: Risorsa
Metric | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Percentuale utilizzo memoria CPU Percentuale di utilizzo della memoria in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
CpuMemoryUtilizationPercentage |
Percentuale | Minimo, Massimo, Medio | instanceId |
PT1M | Sì |
Percentuale utilizzo CPU Percentuale di utilizzo della CPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
CpuUtilizationPercentage |
Percentuale | Minimo, Massimo, Medio | instanceId |
PT1M | Sì |
Errori di raccolta dati al minuto Numero di eventi di raccolta dati eliminati al minuto. |
DataCollectionErrorsPerMinute |
Conteggio | Minimo, Massimo, Medio | instanceId , reason , type |
PT1M | No |
Eventi di raccolta dati al minuto Numero di eventi di raccolta dati elaborati al minuto. |
DataCollectionEventsPerMinute |
Conteggio | Minimo, Massimo, Medio | instanceId , type |
PT1M | No |
Capacità di distribuzione Numero di istanze nella distribuzione. |
DeploymentCapacity |
Conteggio | Minimo, Massimo, Medio | instanceId , State |
PT1M | No |
Utilizzo del disco Percentuale di utilizzo del disco in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
DiskUtilization |
Percentuale | Minimo, Massimo, Medio | instanceId , disk |
PT1M | Sì |
Energia GPU in Joules Energia dell'intervallo in Joules in un nodo GPU. L'energia viene segnalata a intervalli di un minuto. |
GpuEnergyJoules |
Conteggio | Minimo, Massimo, Medio | instanceId |
PT1M | No |
Percentuale utilizzo memoria GPU Percentuale di utilizzo della memoria GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
GpuMemoryUtilizationPercentage |
Percentuale | Minimo, Massimo, Medio | instanceId |
PT1M | Sì |
Percentuale utilizzo GPU Percentuale di utilizzo della GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
GpuUtilizationPercentage |
Percentuale | Minimo, Massimo, Medio | instanceId |
PT1M | Sì |
Categoria: Traffico
Metric | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|
Latenza delle richieste P50 Latenza media della richiesta P50 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P50 |
Millisecondi | Media | <none> | PT1M | Sì |
Latenza delle richieste P90 Latenza media della richiesta P90 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P90 |
Millisecondi | Media | <none> | PT1M | Sì |
Latenza delle richieste P95 Latenza media della richiesta P95 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P95 |
Millisecondi | Media | <none> | PT1M | Sì |
Latenza delle richieste P99 Latenza media della richiesta P99 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P99 |
Millisecondi | Media | <none> | PT1M | Sì |
Richieste al minuto Numero di richieste inviate alla distribuzione online entro un minuto |
RequestsPerMinute |
Conteggio | Media | envoy_response_code |
PT1M | No |