Schema YAML dell'interfaccia della riga di comando (v2) per la pianificazione del monitoraggio dei modelli (anteprima)
SI APPLICA A: estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)
La sintassi YAML descritta in dettaglio in questo documento si basa sullo schema JSON per la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. Il funzionamento di questa sintassi è garantito solo con la versione più recente dell'estensione dell'interfaccia della riga di comando di Machine Learning v2. Lo schema JSON completo può essere visualizzato in https://azuremlschemas.azureedge.net/latest/monitorSchedule.schema.json. È possibile trovare gli schemi per le versioni di estensione precedenti in https://azuremlschemasprod.azureedge.net/.
Sintassi YAML
Chiave | Type | Descrizione | Valori consentiti |
---|---|---|---|
$schema |
string | Schema YAML. | |
name |
string | Obbligatorio. Nome della pianificazione. | |
description |
string | Descrizione della pianificazione. | |
tags |
oggetto | Dizionario di tag per la pianificazione. | |
trigger |
oggetto | Obbligatorio. Configurazione del trigger per definire la regola quando attivare il processo. Uno di RecurrenceTrigger o CronTrigger è obbligatorio. |
|
create_monitor |
oggetto | Obbligatorio. Definizione del monitoraggio che verrà attivato da una pianificazione. MonitorDefinition è obbligatorio. |
Configurazione trigger
Trigger di ricorrenza
Chiave | Type | Descrizione | Valori consentiti |
---|---|---|---|
type |
string | Obbligatorio. Specifica il tipo di pianificazione. | recurrence |
frequency |
string | Obbligatorio. Specifica l'unità di tempo che descrive la frequenza con cui viene attivata la pianificazione. | minute , hour , day , week month |
interval |
integer | Obbligatorio. Specifica l'intervallo in cui viene attivata la pianificazione. | |
start_time |
string | Descrive la data e l'ora di inizio con il fuso orario. Se start_time viene omesso, il primo processo verrà eseguito immediatamente e i processi futuri verranno attivati in base alla pianificazione, dicendo start_time che sarà uguale all'ora di creazione del processo. Se l'ora di inizio è passata, il primo processo verrà eseguito al successivo runtime calcolato. |
|
end_time |
string | Descrive la data e l'ora di fine con il fuso orario. Se end_time viene omesso, la pianificazione continuerà a essere eseguita fino a quando non viene disabilitata in modo esplicito. |
|
timezone |
string | Specifica il fuso orario della ricorrenza. Se omesso, per impostazione predefinita è UTC. | Vedere l'appendice per i valori del fuso orario |
pattern |
oggetto | Specifica il modello della ricorrenza. Se il criterio viene omesso, i processi verranno attivati in base alla logica di start_time, frequenza e intervallo. |
Pianificazione ricorrenza
La pianificazione ricorrenza definisce il criterio di ricorrenza, contenente hours
, minutes
e weekdays
.
- Quando la frequenza è
day
, il criterio può specificarehours
eminutes
. - Quando la frequenza è
week
emonth
, il criterio può specificarehours
,minutes
eweekdays
.
Chiave | Type | Valori consentiti |
---|---|---|
hours |
integer o matrice di integer | 0-23 |
minutes |
integer o matrice di integer | 0-59 |
week_days |
stringa o matrice di stringhe | monday , tuesday , wednesday , thursday friday , , saturday sunday |
CronTrigger
Chiave | Type | Descrizione | Valori consentiti |
---|---|---|---|
type |
string | Obbligatorio. Specifica il tipo di pianificazione. | cron |
expression |
string | Obbligatorio. Specifica l'espressione cron per definire come attivare i processi. Expression usa un'espressione crontab standard per esprimere una pianificazione ricorrente. Una singola espressione è costituita da cinque campi delimitati da spazi:MINUTES HOURS DAYS MONTHS DAYS-OF-WEEK |
|
start_time |
string | Descrive la data e l'ora di inizio con il fuso orario. Se start_time viene omesso, il primo processo verrà eseguito immediatamente e i processi futuri verranno attivati in base alla pianificazione, dicendo start_time sarà uguale all'ora di creazione del processo. Se l'ora di inizio è passata, il primo processo verrà eseguito al successivo runtime calcolato. | |
end_time |
string | Descrive la data e l'ora di fine con il fuso orario. Se end_time viene omesso, la pianificazione continuerà a essere eseguita fino a quando non viene disabilitata in modo esplicito. | |
timezone |
string | Specifica il fuso orario della ricorrenza. Se omesso, per impostazione predefinita è UTC. | Vedere l'appendice per i valori del fuso orario |
Monitorare la definizione
Chiave | Type | Descrizione | Valori consentiti | Default value |
---|---|---|---|---|
compute |
Object | Obbligatorio. Descrizione delle risorse di calcolo per il pool di Spark per eseguire il processo di monitoraggio. | ||
compute.instance_type |
Stringa | Obbligatorio. Tipo di istanza di calcolo da usare per il pool di Spark. | 'standard_e4s_v3', 'standard_e8s_v3', 'standard_e16s_v3', 'standard_e32s_v3', 'standard_e64s_v3' | n/d |
compute.runtime_version |
String | Facoltativo. Definisce la versione del runtime di Spark. | 3.3 |
3.3 |
monitoring_target |
Object | Asset o asset di Azure Machine Learning associati al monitoraggio del modello. | ||
monitoring_target.ml_task |
String | Attività di Machine Learning per il modello. | I valori consentiti sono: classification , regression , question_answering |
|
monitoring_target.endpoint_deployment_id |
String | Facoltativo. ID endpoint/distribuzione di Azure Machine Learning associato nel formato azureml:myEndpointName:myDeploymentName . Questo campo è obbligatorio se l'endpoint o la distribuzione ha abilitato la raccolta dei dati del modello da usare per il monitoraggio del modello. |
||
monitoring_target.model_id |
String | Facoltativo. ID modello associato per il monitoraggio del modello. | ||
monitoring_signals |
Object | Dizionario dei segnali di monitoraggio da includere. La chiave è un nome per il segnale di monitoraggio nel contesto del monitoraggio e il valore è un oggetto contenente una specifica del segnale di monitoraggio. Facoltativo per il monitoraggio del modello di base che usa i dati di produzione precedenti recenti come baseline di confronto e dispone di 3 segnali di monitoraggio: deriva dei dati, deviazione della stima e qualità dei dati. | ||
alert_notification |
Stringa o oggetto | Descrizione dei destinatari delle notifiche di avviso. | È consentita una delle due destinazioni di avviso: Stringa azmonitoring o Oggetto emails contenente una matrice di destinatari di posta elettronica |
|
alert_notification.emails |
Object | Elenco di indirizzi di posta elettronica per ricevere la notifica di avviso. |
Segnali di monitoraggio
Deriva dei dati
Man mano che i dati usati per eseguire il training del modello si evolvono nell'ambiente di produzione, la distribuzione dei dati può cambiare, causando una mancata corrispondenza tra i dati di training e i dati reali usati dal modello per la stima. La deriva dei dati è un fenomeno che si verifica nell'apprendimento automatico quando le proprietà statistiche dei dati di input usati per eseguire il training della modifica del modello nel tempo.
Chiave | Type | Descrizione | Valori consentiti | Valore predefinito |
---|---|---|---|---|
type |
Stringa | Obbligatorio. Tipo di segnale di monitoraggio. Il componente di elaborazione dei segnali predefiniti viene caricato automaticamente in base all'oggetto type specificato qui. |
data_drift |
data_drift |
production_data |
Oggetto | Facoltativo. Descrizione dei dati di produzione da analizzare per il segnale di monitoraggio. | ||
production_data.input_data |
Oggetto | Facoltativo. Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
production_data.data_context |
String | Il contesto dei dati fa riferimento ai dati di produzione del modello e può essere l'input del modello o gli output del modello | model_inputs |
|
production_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare production_data.data_window.lookback_window_offset le proprietà e production_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare production_data.data_window.window_start le proprietà e production_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
production_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se production_data.data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
reference_data |
Oggetto | Facoltativo. I dati di produzione precedenti recenti vengono usati come dati di base del confronto, se non specificati. È consigliabile usare i dati di training come baseline di confronto. | ||
reference_data.input_data |
Object | Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
reference_data.data_context |
String | Il contesto dei dati fa riferimento al contesto usato in precedenza dal set di dati | model_inputs , training , test validation |
|
reference_data.data_column_names.target_column |
Oggetto | Facoltativo. Se è dati reference_data di training, questa proprietà è necessaria per il monitoraggio delle principali funzionalità N per la deriva dei dati. |
||
reference_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare reference_data.data_window.lookback_window_offset le proprietà e reference_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare reference_data.data_window.window_start le proprietà e reference_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
reference_data_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se reference_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
features |
Oggetto | Facoltativo. Funzionalità di destinazione da monitorare per la deriva dei dati. Alcuni modelli potrebbero avere centinaia o migliaia di funzionalità, è sempre consigliabile specificare le funzionalità interessate per il monitoraggio. | Uno dei valori seguenti: elenco di nomi di funzionalità, features.top_n_feature_importance , o all_features |
Il valore predefinito features.top_n_feature_importance = 10 è training , in production_data.data_context caso contrario, il valore predefinito èall_features |
alert_enabled |
Booleano | Attivare/disattivare la notifica di avviso per il segnale di monitoraggio. True oppure False |
||
metric_thresholds |
Object | Elenco delle proprietà delle metriche e delle soglie per il segnale di monitoraggio. Quando viene superata la soglia e alert_enabled è true , l'utente riceverà una notifica di avviso. |
||
metric_thresholds.numerical |
Oggetto | Facoltativo. L'elenco di metriche e soglie in key:value formato è key il nome della metrica, value ovvero la soglia. |
Nomi numerici consentiti delle metriche: jensen_shannon_distance , normalized_wasserstein_distance , population_stability_index , two_sample_kolmogorov_smirnov_test |
|
metric_thresholds.categorical |
Oggetto | Facoltativo. Elenco di metriche e soglie nel formato 'key:value', 'key' è il nome della metrica, 'value' è la soglia. | Nomi di metrica categorica consentiti: jensen_shannon_distance , chi_squared_test , population_stability_index |
Deriva della stima
La deviazione della stima tiene traccia delle modifiche nella distribuzione degli output di stima di un modello confrontandoli con dati di convalida o test etichettati o recenti dati di produzione precedenti.
Chiave | Type | Descrizione | Valori consentiti | Valore predefinito |
---|---|---|---|---|
type |
Stringa | Obbligatorio. Tipo di segnale di monitoraggio. Il componente di elaborazione dei segnali predefiniti viene caricato automaticamente in base all'oggetto type specificato qui. |
prediction_drift |
prediction_drift |
production_data |
Oggetto | Facoltativo. Descrizione dei dati di produzione da analizzare per il segnale di monitoraggio. | ||
production_data.input_data |
Oggetto | Facoltativo. Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
production_data.data_context |
String | Il contesto dei dati fa riferimento ai dati di produzione del modello e può essere l'input del modello o gli output del modello | model_outputs |
|
production_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare production_data.data_window.lookback_window_offset le proprietà e production_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare production_data.data_window.window_start le proprietà e production_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
production_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se production_data.data.input_data.type è uri_folder . Per altre informazioni sulla specifica del componente di pre-elaborazione, vedere Specifica del componente di pre-elaborazione. |
||
reference_data |
Oggetto | Facoltativo. I dati di produzione precedenti recenti vengono usati come dati di base del confronto, se non specificati. È consigliabile usare i dati di training come baseline di confronto. | ||
reference_data.input_data |
Object | Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
reference_data.data_context |
String | Il contesto dei dati fa riferimento al contesto usato in precedenza dal set di dati | model_inputs , training , test validation |
|
reference_data.data_column_names.target_column |
Oggetto | Facoltativo. Se l'reference_data è dati di training, questa proprietà è necessaria per il monitoraggio delle principali N funzionalità per la deriva dei dati. | ||
reference_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare reference_data.data_window.lookback_window_offset le proprietà e reference_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare reference_data.data_window.window_start le proprietà e reference_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
reference_data_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se reference_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
features |
Oggetto | Facoltativo. Funzionalità di destinazione da monitorare per la deriva dei dati. Alcuni modelli potrebbero avere centinaia o migliaia di funzionalità, è sempre consigliabile specificare le funzionalità interessate per il monitoraggio. | Uno dei valori seguenti: elenco di nomi di funzionalità, features.top_n_feature_importance , o all_features |
Il valore predefinito features.top_n_feature_importance = 10 è training , in production_data.data_context caso contrario, il valore predefinito èall_features |
alert_enabled |
Booleano | Attivare/disattivare la notifica di avviso per il segnale di monitoraggio. True oppure False |
||
metric_thresholds |
Object | Elenco delle proprietà delle metriche e delle soglie per il segnale di monitoraggio. Quando viene superata la soglia e alert_enabled è true , l'utente riceverà una notifica di avviso. |
||
metric_thresholds.numerical |
Oggetto | Facoltativo. Elenco di metriche e soglie nel formato 'key:value', 'key' è il nome della metrica, 'value' è la soglia. | Nomi numerici consentiti delle metriche: jensen_shannon_distance , normalized_wasserstein_distance , population_stability_index , two_sample_kolmogorov_smirnov_test |
|
metric_thresholds.categorical |
Oggetto | Facoltativo. Elenco di metriche e soglie nel formato 'key:value', 'key' è il nome della metrica, 'value' è la soglia. | Nomi di metrica categorica consentiti: jensen_shannon_distance , chi_squared_test , population_stability_index |
Qualità dei dati
Il segnale di qualità dei dati tiene traccia dei problemi di qualità dei dati nell'ambiente di produzione confrontando i dati di training o i dati di produzione precedenti recenti.
Chiave | Type | Descrizione | Valori consentiti | Valore predefinito |
---|---|---|---|---|
type |
Stringa | Obbligatorio. Tipo di segnale di monitoraggio. Il componente predefinito di elaborazione dei segnali di monitoraggio viene caricato automaticamente in base all'oggetto type specificato qui |
data_quality |
data_quality |
production_data |
Oggetto | Facoltativo. Descrizione dei dati di produzione da analizzare per il segnale di monitoraggio. | ||
production_data.input_data |
Oggetto | Facoltativo. Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
production_data.data_context |
String | Il contesto dei dati fa riferimento ai dati di produzione del modello e può essere l'input del modello o gli output del modello | model_inputs , model_outputs |
|
production_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare production_data.data_window.lookback_window_offset le proprietà e production_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare production_data.data_window.window_start le proprietà e production_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
production_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se production_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
reference_data |
Oggetto | Facoltativo. I dati di produzione precedenti recenti vengono usati come dati di base del confronto, se non specificati. È consigliabile usare i dati di training come baseline di confronto. | ||
reference_data.input_data |
Object | Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
reference_data.data_context |
String | Il contesto dei dati fa riferimento al contesto usato in precedenza dal set di dati | model_inputs , model_outputs , training , test validation |
|
reference_data.data_column_names.target_column |
Oggetto | Facoltativo. Se l'reference_data è dati di training, questa proprietà è necessaria per il monitoraggio delle principali N funzionalità per la deriva dei dati. | ||
reference_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare reference_data.data_window.lookback_window_offset le proprietà e reference_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare reference_data.data_window.window_start le proprietà e reference_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
reference_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se reference_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
features |
Oggetto | Facoltativo. Funzionalità di destinazione da monitorare per la qualità dei dati. Alcuni modelli potrebbero avere centinaia o migliaia di funzionalità. È sempre consigliabile specificare le funzionalità interessate per il monitoraggio. | Uno dei valori seguenti: elenco di nomi di funzionalità, features.top_n_feature_importance , o all_features |
L'impostazione predefinita è features.top_n_feature_importance = 10 se reference_data.data_context è training , in caso contrario il valore predefinito è all_features |
alert_enabled |
Booleano | Attivare/disattivare la notifica di avviso per il segnale di monitoraggio. True oppure False |
||
metric_thresholds |
Object | Elenco delle proprietà delle metriche e delle soglie per il segnale di monitoraggio. Quando viene superata la soglia e alert_enabled è true , l'utente riceverà una notifica di avviso. |
||
metric_thresholds.numerical |
Object | L'elenco facoltativo di metriche e soglie in key:value formato è key il nome della metrica, value ovvero la soglia. |
Nomi numerici consentiti delle metriche: data_type_error_rate , null_value_rate , out_of_bounds_rate |
|
metric_thresholds.categorical |
Object | L'elenco facoltativo di metriche e soglie in key:value formato è key il nome della metrica, value ovvero la soglia. |
Nomi di metrica categorica consentiti: data_type_error_rate , null_value_rate , out_of_bounds_rate |
Deriva dell'attribuzione delle caratteristiche (anteprima)
L'attribuzione di funzionalità di un modello può cambiare nel tempo a causa delle modifiche nella distribuzione dei dati, delle modifiche nelle relazioni tra le funzionalità o delle modifiche apportate al problema sottostante risolto. La deriva dell'attribuzione delle funzionalità è un fenomeno che si verifica nei modelli di Machine Learning quando l'importanza o il contributo delle funzionalità all'output della stima cambia nel tempo.
Chiave | Type | Descrizione | Valori consentiti | Valore predefinito |
---|---|---|---|---|
type |
Stringa | Obbligatorio. Tipo di segnale di monitoraggio. Il componente predefinito di elaborazione dei segnali di monitoraggio viene caricato automaticamente in base all'oggetto type specificato qui |
feature_attribution_drift |
feature_attribution_drift |
production_data |
Array | Facoltativo, per impostazione predefinita, per i dati raccolti associati all'endpoint di Azure Machine Learning, se non viene specificato. production_data è un elenco di set di dati e dei metadati associati, che deve includere sia gli input del modello che i dati di output del modello. Può trattarsi di un singolo set di dati con input e output del modello oppure di due set di dati separati contenenti un input del modello e un output del modello. |
||
production_data.input_data |
Oggetto | Facoltativo. Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
production_data.input_data.data_column_names |
Object | Nome colonna di correlazione e nomi delle colonne di stima in key:value formato, necessari per l'unione dei dati. |
Le chiavi consentite sono: correlation_id , target_column |
|
production_data.data_context |
String | Contesto dei dati. Fa riferimento ai dati di input del modello di produzione. | model_inputs , model_outputs , model_inputs_outputs |
|
production_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare production_data.data_window.lookback_window_offset le proprietà e production_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare production_data.data_window.window_start le proprietà e production_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
production_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se production_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
production_data.data_window_size |
String | Facoltativo. Dimensioni della finestra dati in giorni con formato ISO8601, ad esempio P7D . Si tratta della finestra dei dati di produzione da calcolare per i problemi di qualità dei dati. |
Per impostazione predefinita, le dimensioni della finestra dati sono l'ultimo periodo di monitoraggio. | |
reference_data |
Oggetto | Facoltativo. I dati di produzione precedenti recenti vengono usati come dati di base del confronto, se non specificati. È consigliabile usare i dati di training come baseline di confronto. | ||
reference_data.input_data |
Object | Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
reference_data.data_context |
String | Il contesto dei dati fa riferimento al contesto usato in precedenza dal set di dati. Fro la deriva dell'attribuzione delle funzionalità, sono consentiti solo i training dati. |
training |
|
reference_data.data_column_names.target_column |
Stringa | Obbligatorio. | ||
reference_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare reference_data.data_window.lookback_window_offset le proprietà e reference_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare reference_data.data_window.window_start le proprietà e reference_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
reference_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se reference_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
alert_enabled |
Booleano | Attivare/disattivare la notifica di avviso per il segnale di monitoraggio. True oppure False |
||
metric_thresholds |
Object | Nome della metrica e soglia per derivazione delle funzionalità nel key:value formato, dove key è il nome della metrica e value è la soglia. Quando la soglia viene superata e alert_enabled è attiva, l'utente riceverà una notifica di avviso. |
Nome della metrica consentito: normalized_discounted_cumulative_gain |
Segnale di monitoraggio personalizzato
Segnale di monitoraggio personalizzato tramite un componente personalizzato di Azure Machine Learning.
Chiave | Type | Descrizione | Valori consentiti | Valore predefinito |
---|---|---|---|---|
type |
Stringa | Obbligatorio. Tipo di segnale di monitoraggio. Il componente di elaborazione dei segnali predefiniti viene caricato automaticamente in base all'oggetto type specificato qui. |
custom |
custom |
component_id |
Stringa | Obbligatorio. ID componente di Azure Machine Learning corrispondente al segnale personalizzato. Ad esempio: azureml:mycustomcomponent:1 |
||
input_data |
Oggetto | Facoltativo. Descrizione dei dati di input da analizzare dal segnale di monitoraggio, vedere specifica dei dati di input del processo. | ||
input_data.<data_name>.data_context |
String | Il contesto dei dati fa riferimento ai dati di produzione del modello e può essere l'input del modello o gli output del modello | model_inputs |
|
input_data.<data_name>.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare input_data.<data_name>.data_window.lookback_window_offset le proprietà e input_data.<data_name>.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare input_data.<data_name>.data_window.window_start le proprietà e input_data.<data_name>.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
input_data.<data_name>.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se input_data.<data_name>.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
alert_enabled |
Booleano | Attivare/disattivare la notifica di avviso per il segnale di monitoraggio. True oppure False |
||
metric_thresholds.metric_name |
Object | Nome della metrica personalizzata. | ||
threshold |
Object | Soglia accettabile per la metrica personalizzata. |
Prestazioni modello (anteprima)
Le prestazioni del modello tengono traccia delle prestazioni obiettivo dell'output di un modello nell'ambiente di produzione confrontandolo con i dati di verità di base raccolti.
Chiave | Type | Descrizione | Valori consentiti | Valore predefinito |
---|---|---|---|---|
type |
Stringa | Obbligatorio. Tipo di segnale di monitoraggio. Il componente predefinito di elaborazione dei segnali di monitoraggio viene caricato automaticamente in base all'oggetto type specificato qui |
model_performance |
model_performance |
production_data |
Array | Facoltativo, per impostazione predefinita, per i dati raccolti associati all'endpoint di Azure Machine Learning, se non viene specificato. production_data è un elenco di set di dati e dei metadati associati, che deve includere sia gli input del modello che i dati di output del modello. Può trattarsi di un singolo set di dati con input e output del modello oppure di due set di dati separati contenenti un input del modello e un output del modello. |
||
production_data.input_data |
Oggetto | Facoltativo. Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
production_data.input_data.data_column_names |
Object | Nome colonna di correlazione e nomi delle colonne di stima in key:value formato, necessari per l'unione dei dati. |
Le chiavi consentite sono: correlation_id , target_column |
|
production_data.data_context |
String | Contesto dei dati. Fa riferimento ai dati di input del modello di produzione. | model_inputs , model_outputs , model_inputs_outputs |
|
production_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare production_data.data_window.lookback_window_offset le proprietà e production_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare production_data.data_window.window_start le proprietà e production_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
production_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se production_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
production_data.data_window_size |
String | Facoltativo. Dimensioni della finestra dati in giorni con formato ISO8601, ad esempio P7D . Si tratta della finestra dei dati di produzione da calcolare per i problemi di qualità dei dati. |
Per impostazione predefinita, le dimensioni della finestra dati sono l'ultimo periodo di monitoraggio. | |
reference_data |
Oggetto | Facoltativo. I dati di produzione precedenti recenti vengono usati come dati di base del confronto, se non specificati. È consigliabile usare i dati di training come baseline di confronto. | ||
reference_data.input_data |
Object | Descrizione dell'origine dati di input, vedere Specifica dei dati di input del processo. | ||
reference_data.data_context |
String | Il contesto dei dati fa riferimento al contesto usato in precedenza dal set di dati. Fro la deriva dell'attribuzione delle funzionalità, sono consentiti solo i training dati. |
training |
|
reference_data.data_column_names.target_column |
Stringa | Obbligatorio. | ||
reference_data.data_window |
Oggetto | Facoltativo. Finestra dati dei dati di riferimento da usare come dati di base di confronto. | Consenti solo finestra dati in sequenza o finestra dati fissa. Per usare la finestra dei dati in sequenza, specificare reference_data.data_window.lookback_window_offset le proprietà e reference_data.data_window.lookback_window_size . Per l'uso di finestre dati fisse, specificare reference_data.data_window.window_start le proprietà e reference_data.data_window.window_end . Tutti i valori delle proprietà devono essere in formato ISO8601. |
|
reference_data.pre_processing_component |
String | ID componente nel formato di azureml:myPreprocessing@latest per un componente registrato. Questa operazione è obbligatoria se reference_data.input_data.type è uri_folder , vedere specifica del componente di pre-elaborazione. |
||
alert_enabled |
Booleano | Attivare/disattivare la notifica di avviso per il segnale di monitoraggio. True oppure False |
||
metric_thresholds.classification |
Object | L'elenco facoltativo di metriche e soglie in key:value formato è key il nome della metrica, value ovvero la soglia. |
Nomi delle metriche consentiti classification : accuracy , precision , recall |
|
metric_thresholds.regression |
Object | L'elenco facoltativo di metriche e soglie in key:value formato è key il nome della metrica, value ovvero la soglia. |
Nomi delle metriche consentiti regression : mae , mse , rmse |
Osservazioni:
Il az ml schedule
comando può essere usato per la gestione dei modelli di Azure Machine Learning.
Esempi
Gli esempi dell'interfaccia della riga di comando di monitoraggio sono disponibili nel repository GitHub di esempi. Un paio sono i seguenti:
YAML: monitor istanza predefinita
SI APPLICA A: estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)
# out-of-box-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: credit_default_model_monitoring
display_name: Credit default model monitoring
description: Credit default model monitoring setup with minimal configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute: # specify a spark compute for monitoring job
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification # model task type: [classification, regression, question_answering]
endpoint_deployment_id: azureml:credit-default:main # azureml endpoint deployment id
alert_notification: # emails to get alerts
emails:
- abc@example.com
- def@example.com
YAML: Monitoraggio avanzato
SI APPLICA A: estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)
# advanced-model-monitoring.yaml
$schema: http://azureml/sdk-2-0/Schedule.json
name: fraud_detection_model_monitoring
display_name: Fraud detection model monitoring
description: Fraud detection model monitoring with advanced configurations
trigger:
# perform model monitoring activity daily at 3:15am
type: recurrence
frequency: day #can be minute, hour, day, week, month
interval: 1 # #every day
schedule:
hours: 3 # at 3am
minutes: 15 # at 15 mins after 3am
create_monitor:
compute:
instance_type: standard_e4s_v3
runtime_version: "3.3"
monitoring_target:
ml_task: classification
endpoint_deployment_id: azureml:credit-default:main
monitoring_signals:
advanced_data_drift: # monitoring signal name, any user defined name works
type: data_drift
# reference_dataset is optional. By default referece_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1 # use training data as comparison reference dataset
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
features:
top_n_feature_importance: 10 # monitor drift for top 10 features
alert_enabled: true
metric_thresholds:
numerical:
jensen_shannon_distance: 0.01
categorical:
pearsons_chi_squared_test: 0.02
advanced_data_quality:
type: data_quality
# reference_dataset is optional. By default reference_dataset is the production inference data associated with Azure Machine Learning online endpoint
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
features: # monitor data quality for 3 individual features only
- SEX
- EDUCATION
alert_enabled: true
metric_thresholds:
numerical:
null_value_rate: 0.05
categorical:
out_of_bounds_rate: 0.03
feature_attribution_drift_signal:
type: feature_attribution_drift
# production_data: is not required input here
# Please ensure Azure Machine Learning online endpoint is enabled to collected both model_inputs and model_outputs data
# Azure Machine Learning model monitoring will automatically join both model_inputs and model_outputs data and used it for computation
reference_data:
input_data:
path: azureml:credit-reference:1
type: mltable
data_context: training
data_column_names:
target_column: DEFAULT_NEXT_MONTH
alert_enabled: true
metric_thresholds:
normalized_discounted_cumulative_gain: 0.9
alert_notification:
emails:
- abc@example.com
- def@example.com
Appendice
FusoOrario
La pianificazione corrente supporta i fusi orari seguenti. La chiave può essere usata direttamente in Python SDK, mentre il valore può essere usato nel processo YAML. La tabella è organizzata in base all'ora UTC (Coordinated Universal Time).
UTC | Chiave | valore |
---|---|---|
UTC -12.00 | DATELINE_STANDARD_TIME | "Ora solare dataline" |
UTC -11.00 | UTC_11 | "UTC-11" |
UTC - 10.00 | ALEUTIAN_STANDARD_TIME | Ora solare Aleutine |
UTC - 10.00 | HAWAIIAN_STANDARD_TIME | "Ora solare hawaii" |
UTC -09:30 | MARQUESAS_STANDARD_TIME | "Marquesas Standard Time" |
UTC -09:00 | ALASKAN_STANDARD_TIME | "Alaskan Standard Time" |
UTC -09:00 | UTC_09 | "UTC-09" |
UTC -08:00 | PACIFIC_STANDARD_TIME_MEXICO | "Pacific Standard Time (Messico)" |
UTC -08:00 | UTC_08 | "UTC-08" |
UTC -08:00 | PACIFIC_STANDARD_TIME | "Ora solare pacifico" |
UTC -07.00 | US_MOUNTAIN_STANDARD_TIME | "Us Mountain Standard Time" |
UTC -07.00 | MOUNTAIN_STANDARD_TIME_MEXICO | "Ora solare montagna (Messico)" |
UTC -07.00 | MOUNTAIN_STANDARD_TIME | "Ora solare montagna" |
UTC -06.00 | CENTRAL_AMERICA_STANDARD_TIME | "Ora solare america centrale" |
UTC -06.00 | CENTRAL_STANDARD_TIME | "Ora solare centrale" |
UTC -06.00 | EASTER_ISLAND_STANDARD_TIME | "Ora solare dell'Isola di Pasqua" |
UTC -06.00 | CENTRAL_STANDARD_TIME_MEXICO | "Ora solare centrale (Messico)" |
UTC -06.00 | CANADA_CENTRAL_STANDARD_TIME | "Ora solare centrale canada" |
UTC -05:00 | SA_PACIFIC_STANDARD_TIME | "SA Pacific Standard Time" |
UTC -05:00 | EASTERN_STANDARD_TIME_MEXICO | "Ora solare orientale (Messico)" |
UTC -05:00 | EASTERN_STANDARD_TIME | "Ora solare orientale" |
UTC -05:00 | HAITI_STANDARD_TIME | "Ora solare haitiana" |
UTC -05:00 | CUBA_STANDARD_TIME | "Ora solare cuba" |
UTC -05:00 | US_EASTERN_STANDARD_TIME | "Ora solare orientale degli Stati Uniti" |
UTC -05:00 | TURKS_AND_CAICOS_STANDARD_TIME | "Turks And Caicos Standard Time" |
UTC -04.00 | PARAGUAY_STANDARD_TIME | "Orario solare del Paraguay" |
UTC -04.00 | ATLANTIC_STANDARD_TIME | "Ora solare atlantica" |
UTC -04.00 | VENEZUELA_STANDARD_TIME | "Ora solare Venezuela" |
UTC -04.00 | CENTRAL_BRAZILIAN_STANDARD_TIME | "Orario solare brasiliano centrale" |
UTC -04.00 | SA_WESTERN_STANDARD_TIME | "SA Western Standard Time" |
UTC -04.00 | PACIFIC_SA_STANDARD_TIME | "Pacific SA Standard Time" |
UTC -03:30 | NEWFOUNDLAND_STANDARD_TIME | "Newfoundland Standard Time" |
UTC -03:00 | TOCANTINS_STANDARD_TIME | "Tocantins Standard Time" |
UTC -03:00 | E_SOUTH_AMERICAN_STANDARD_TIME | "E. Ora solare dell'America del Sud" |
UTC -03:00 | SA_EASTERN_STANDARD_TIME | "Sa Eastern Standard Time" |
UTC -03:00 | ARGENTINA_STANDARD_TIME | "Ora solare argentina" |
UTC -03:00 | GREENLAND_STANDARD_TIME | "Ora solare della Groenlandia" |
UTC -03:00 | MONTEVIDEO_STANDARD_TIME | "Ora solare di Buttono" |
UTC -03:00 | SAINT_PIERRE_STANDARD_TIME | "Saint Pierre Standard Time" |
UTC -03:00 | BAHIA_STANDARD_TIM | "Ora solare Di Normale" |
UTC -02:00 | UTC_02 | "UTC-02" |
UTC -02:00 | MID_ATLANTIC_STANDARD_TIME | "Ora solare medio Atlantico" |
UTC -01:00 | AZORES_STANDARD_TIME | "Ora solare a livello di ora solare" |
UTC -01:00 | CAPE_VERDE_STANDARD_TIME | "Cape Verde Standard Time" |
UTC | UTC | UTC |
UTC +00:00 | GMT_STANDARD_TIME | "Gmt Standard Time" |
UTC +00:00 | GREENWICH_STANDARD_TIME | "Ora solare di Greenwich" |
UTC +01:00 | MOROCCO_STANDARD_TIME | "Ora solare marocco" |
UTC +01:00 | W_EUROPE_STANDARD_TIME | "W. Ora solare europa" |
UTC +01:00 | CENTRAL_EUROPE_STANDARD_TIME | "Ora solare europa centrale" |
UTC +01:00 | ROMANCE_STANDARD_TIME | "Tempo solare romanticismo" |
UTC +01:00 | CENTRAL_EUROPEAN_STANDARD_TIME | "Ora solare europea centrale" |
UTC +01:00 | W_CENTRAL_AFRICA_STANDARD_TIME | "W. Ora solare dell'Africa centrale" |
UTC +02:00 | NAMIBIA_STANDARD_TIME | "Namibia Standard Time" |
UTC +02:00 | JORDAN_STANDARD_TIME | "Ora solare Giordania" |
UTC +02:00 | GTB_STANDARD_TIME | "GTB Standard Time" |
UTC +02:00 | MIDDLE_EAST_STANDARD_TIME | "Ora solare medio oriente" |
UTC +02:00 | EGYPT_STANDARD_TIME | "Ora solare Egitto" |
UTC +02:00 | E_EUROPE_STANDARD_TIME | "E. Ora solare europa" |
UTC +02:00 | SYRIA_STANDARD_TIME | "Ora solare siria" |
UTC +02:00 | WEST_BANK_STANDARD_TIME | "Ora solare della Banca occidentale" |
UTC +02:00 | SOUTH_AFRICA_STANDARD_TIME | "Ora solare sudafricana" |
UTC +02:00 | FLE_STANDARD_TIME | "FLE Standard Time" |
UTC +02:00 | ISRAEL_STANDARD_TIME | "Ora solare israele" |
UTC +02:00 | KALININGRAD_STANDARD_TIME | "Ora solare Di Normale" |
UTC +02:00 | LIBYA_STANDARD_TIME | "L'ora solare della Libia" |
UTC +03:00 | TÜRKIYE_STANDARD_TIME | "Türkiye Standard Time" |
UTC +03:00 | ARABIC_STANDARD_TIME | "Ora solare araba" |
UTC +03:00 | ARAB_STANDARD_TIME | "Ora solare araba" |
UTC +03:00 | BELARUS_STANDARD_TIME | "Ora solare bielorussa" |
UTC +03:00 | RUSSIAN_STANDARD_TIME | "Ora solare russa" |
UTC +03:00 | E_AFRICA_STANDARD_TIME | "E. Ora solare africa" |
UTC +03:30 | IRAN_STANDARD_TIME | "Ora solare Iran" |
UTC +04:00 | ARABIAN_STANDARD_TIME | "Ora solare araba" |
UTC +04:00 | ASTRAKHAN_STANDARD_TIME | "Astrakhan Standard Time" |
UTC +04:00 | AZERBAIJAN_STANDARD_TIME | "Ora solare azero" |
UTC +04:00 | RUSSIA_TIME_ZONE_3 | "Fuso orario Russia 3" |
UTC +04:00 | MAURITIUS_STANDARD_TIME | "Ora solare di Mauritius" |
UTC +04:00 | GEORGIAN_STANDARD_TIME | "Ora solare georgiana" |
UTC +04:00 | CAUCASUS_STANDARD_TIME | "Tempo solare caucasico" |
UTC +04:30 | AFGHANISTAN_STANDARD_TIME | "Tempo solare afghanistan" |
UTC +05:00 | WEST_ASIA_STANDARD_TIME | "Ora solare asia occidentale" |
UTC +05:00 | EKATERINBURG_STANDARD_TIME | "Ekaterinburg Standard Time" |
UTC +05:00 | PAKISTAN_STANDARD_TIME | "Ora solare pakistana" |
UTC +05:30 | INDIA_STANDARD_TIME | "Ora solare India" |
UTC +05:30 | SRI_LANKA_STANDARD_TIME | "Ora solare sri lanka" |
UTC +05:45 | NEPAL_STANDARD_TIME | "Tempo solare nepalese" |
UTC +06:00 | CENTRAL_ASIA_STANDARD_TIME | "Ora solare asia centrale" |
UTC +06:00 | BANGLADESH_STANDARD_TIME | "Ora solare del Bangladesh" |
UTC +06:30 | MYANMAR_STANDARD_TIME | "Ora solare Myanmar" |
UTC +07.00 | N_CENTRAL_ASIA_STANDARD_TIME | "N. Ora solare asia centrale" |
UTC +07.00 | SE_ASIA_STANDARD_TIME | "SE Asia Standard Time" |
UTC +07.00 | ALTAI_STANDARD_TIME | "Altai Standard Time" |
UTC +07.00 | W_MONGOLIA_STANDARD_TIME | "W. Mongolia Standard Time" |
UTC +07.00 | NORTH_ASIA_STANDARD_TIME | "Ora solare asia settentrionale" |
UTC +07.00 | TOMSK_STANDARD_TIME | "Ora solare Tomsk" |
UTC +08:00 | CHINA_STANDARD_TIME | "Ora solare cina" |
UTC +08:00 | NORTH_ASIA_EAST_STANDARD_TIME | "Ora solare asia settentrionale" |
UTC +08:00 | SINGAPORE_STANDARD_TIME | "Ora solare singapore" |
UTC +08:00 | W_AUSTRALIA_STANDARD_TIME | "W. Ora solare australia" |
UTC +08:00 | TAIPEI_STANDARD_TIME | "Ora solare di Taiwan" |
UTC +08:00 | ULAANBAATAR_STANDARD_TIME | "Ora solare Ulaanbaatar" |
UTC +08:45 | AUS_CENTRAL_W_STANDARD_TIME | "Aus Central W. Standard Time" |
UTC +09:00 | NORTH_KOREA_STANDARD_TIME | "Ora solare corea del Nord" |
UTC +09:00 | TRANSBAIKAL_STANDARD_TIME | "Ora solare transbaikal" |
UTC +09:00 | TOKYO_STANDARD_TIME | "Ora solare tokyo" |
UTC +09:00 | KOREA_STANDARD_TIME | "Ora solare corea" |
UTC +09:00 | YAKUTSK_STANDARD_TIME | "Ora solare di Yakuzk" |
UTC +09:30 | CEN_AUSTRALIA_STANDARD_TIME | "Cen. Ora solare australia" |
UTC +09:30 | AUS_CENTRAL_STANDARD_TIME | "Ora solare centrale AUS" |
UTC +10:00 | E_AUSTRALIAN_STANDARD_TIME | "E. Ora solare australia" |
UTC +10:00 | AUS_EASTERN_STANDARD_TIME | "Ora solare orientale AUS" |
UTC +10:00 | WEST_PACIFIC_STANDARD_TIME | "Ora solare pacifico occidentale" |
UTC +10:00 | TASMANIA_STANDARD_TIME | "Ora solare della Australia" |
UTC +10:00 | VLADIVOSTOK_STANDARD_TIME | "Ora solare Di Clusterk" |
UTC +10:30 | LORD_HOWE_STANDARD_TIME | "Lord Howe Standard Time" |
UTC +11:00 | BOUGAINVILLE_STANDARD_TIME | "Bougainville Standard Time" |
UTC +11:00 | RUSSIA_TIME_ZONE_10 | "Fuso orario Russia 10" |
UTC +11:00 | MAGADAN_STANDARD_TIME | "Magadan Standard Time" |
UTC +11:00 | NORFOLK_STANDARD_TIME | "L'ora solare di Norfolk" |
UTC +11:00 | SAKHALIN_STANDARD_TIME | "Sakhalin Standard Time" |
UTC +11:00 | CENTRAL_PACIFIC_STANDARD_TIME | "Ora solare pacifico centrale" |
UTC +12:00 | RUSSIA_TIME_ZONE_11 | "Fuso orario Russia 11" |
UTC +12:00 | NEW_ZEALAND_STANDARD_TIME | "Ora solare nuova Zelanda" |
UTC +12:00 | UTC_12 | "UTC +12" |
UTC +12:00 | FIJI_STANDARD_TIME | "Tempo solare Figi" |
UTC +12:00 | KAMCHATKA_STANDARD_TIME | "Kamchatka Standard Time" |
UTC +12:45 | CHATHAM_ISLANDS_STANDARD_TIME | "Ora solare delle Isole Chatham" |
UTC +13:00 | TONGA__STANDARD_TIME | "Ora solare tonga" |
UTC +13:00 | SAMOA_STANDARD_TIME | "Ora solare Samoa" |
UTC +14.00 | LINE_ISLANDS_STANDARD_TIME | "Ora solare delle isole di linea" |