Condividi tramite


automl Pacchetto

Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2.

Le aree principali includono la gestione delle attività AutoML.

Classi

ClassificationJob

Configurazione per il processo di classificazione AutoML.

Inizializzare una nuova attività di classificazione AutoML.

ColumnTransformer

Impostazioni del trasformatore di colonna.

ForecastingJob

Configurazione per l'attività di previsione AutoML.

Inizializzare una nuova attività Di previsione AutoML.

ForecastingSettings

Impostazioni di previsione per un processo AutoML.

ImageClassificationJob

Configurazione per il processo di classificazione delle immagini multiclasse AutoML.

Inizializzare un nuovo processo di classificazione immagini multiclasse AutoML.

ImageClassificationMultilabelJob

Configurazione per il processo di classificazione delle immagini con più etichette AutoML.

Inizializzare un nuovo processo di classificazione delle immagini con più etichette AutoML.

ImageClassificationSearchSpace

Cerca spazio per le attività Classificazione immagini AutoML e Classificazione immagini multi-etichetta.

ImageInstanceSegmentationJob

Configurazione per il processo di segmentazione dell'istanza dell'immagine AutoML.

Inizializzare un nuovo processo di segmentazione dell'istanza dell'immagine AutoML.

ImageLimitSettings

Limitare le impostazioni per i verticali delle immagini AutoML.

ImageLimitSettings è una classe che contiene i parametri seguenti: max_concurrent_trials, max_trials e timeout_minutes.

Si tratta di un metodo di configurazione facoltativo per configurare i parametri dei limiti, ad esempio i timeout e così via.

Nota

Il numero di esecuzioni simultanee è limitato dalle risorse disponibili nella destinazione di calcolo specificata.

Assicurarsi che la destinazione di calcolo disponga delle risorse disponibili per la concorrenza desiderata.

Suggerimento

È consigliabile associare max_concurrent_trials conteggio con il numero di nodi nel cluster.

Ad esempio, se si dispone di un cluster con 4 nodi, impostare max_concurrent_trials su 4.

Esempio di utilizzo

Configurazione di ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Inizializzare un oggetto ImageLimitSettings.

Costruttore per ImageLimitSettings per i verticali dell'immagine AutoML.

ImageModelSettingsClassification

Impostazioni del modello per le attività di classificazione delle immagini AutoML.

ImageModelSettingsObjectDetection

Impostazioni del modello per l'attività Rilevamento oggetti immagine AutoML.

ImageObjectDetectionJob

Configurazione per il processo rilevamento oggetti immagine AutoML.

Inizializzare un nuovo processo di rilevamento oggetti immagine AutoML.

ImageObjectDetectionSearchSpace

Cerca spazio per le attività di rilevamento oggetti immagine autoML e segmentazione dell'istanza dell'immagine.

ImageSweepSettings

Impostazioni di sweep per tutti i verticali dell'immagine AutoML.

NlpFeaturizationSettings

Impostazioni di definizione delle caratteristiche per tutti i verticali NLP di AutoML.

NlpFixedParameters

Oggetto per ospitare parametri fissi per i processi NLP.

NlpLimitSettings

Limitare le impostazioni per tutti i verticali NLP di AutoML.

NlpSearchSpace

Cerca spazio per le attività NLP autoML.

NlpSweepSettings

Impostazioni di sweep per tutte le attività NLP di AutoML.

RegressionJob

Configurazione per il processo di regressione AutoML.

Inizializzare una nuova attività di regressione AutoML.

SearchSpace

Classe SearchSpace per i verticali AutoML.

StackEnsembleSettings

Impostazione avanzata per personalizzare l'esecuzione di StackEnsemble.

TabularFeaturizationSettings

Impostazioni di definizione delle caratteristiche per un processo AutoML.

TabularLimitSettings

Limitare le impostazioni per le verticali di una tabella AutoML.

TextClassificationJob

Configurazione per il processo di classificazione del testo AutoML.

Inizializza una nuova attività Classificazione testo AutoML.

TextClassificationMultilabelJob

Configurazione per processo multietichetà di classificazione testo AutoML.

Inizializza una nuova attività Classificazione testo AutoML Multilabel.

TextNerJob

Configurazione per il processo NER di testo AutoML.

Inizializza una nuova attività Text NER autoML.

TrainingSettings

Classe TrainingSettings per Azure Machine Learning.

Classe TrainingSettings per Azure Machine Learning.

Enumerazioni

BlockedTransformers

Enumerazione per tutti i modelli di classificazione supportati da AutoML.

ClassificationModels

Enumerazione per tutti i modelli di classificazione supportati da AutoML.

ClassificationMultilabelPrimaryMetrics

Metriche primarie per le attività multi-etichetta di classificazione.

ClassificationPrimaryMetrics

Metriche principali per le attività di classificazione.

FeaturizationMode

Modalità di definizione delle caratteristiche: determina la modalità di definizione delle caratteristiche dei dati.

ForecastHorizonMode

Enumerazione per determinare la modalità di selezione dell'orizzonte di previsione.

ForecastingModels

Enumerazione per tutti i modelli di previsione supportati da AutoML.

ForecastingPrimaryMetrics

Metriche principali per l'attività Previsione.

InstanceSegmentationPrimaryMetrics

Metriche primarie per le attività InstanceSegmentation.

LearningRateScheduler

Enumerazione dell'utilità di pianificazione della frequenza di apprendimento.

LogTrainingMetrics

Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2.

Le aree principali includono la gestione delle attività AutoML.

LogValidationLoss

Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2.

Le aree principali includono la gestione delle attività AutoML.

NCrossValidationsMode

Determina il modo in cui viene determinato il valore delle convalide incrociate.

ObjectDetectionPrimaryMetrics

Metriche primarie per l'attività Image ObjectDetection.

RegressionModels

Enumerazione per tutti i modelli di regressione supportati da AutoML.

RegressionPrimaryMetrics

Metriche primarie per l'attività regressione.

SamplingAlgorithmType

Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2.

Le aree principali includono la gestione delle attività AutoML.

ShortSeriesHandlingConfiguration

Parametro che definisce la modalità di gestione di serie temporali brevi da parte di AutoML.

StochasticOptimizer

Ottimizzatore stocastico per i modelli di immagine.

TargetAggregationFunction

Funzione di aggregazione di destinazione.

TargetLagsMode

Modalità di selezione dei lag di destinazione.

TargetRollingWindowSizeMode

Modalità di ridimensionamento delle finestre in sequenza di destinazione.

UseStl

Configurare la scomposizione STL della colonna di destinazione della serie temporale.

ValidationMetricType

Metodo di calcolo delle metriche da usare per le metriche di convalida nelle attività di immagine.

Funzioni

classification

Funzione per creare un processo di classificazione.

Un processo di classificazione viene usato per eseguire il training di un modello che stima meglio la classe di un esempio di dati. Vari modelli vengono sottoposti a training usando i dati di training. Il modello con prestazioni ottimali sui dati di convalida in base alla metrica primaria viene selezionato come modello finale.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna etichetta (facoltativamente una colonna pesi di esempio).

target_column_name
str

Nome della colonna dell'etichetta. Questo parametro è applicabile ai training_dataparametri e test_datavalidation_data

primary_metric

Metrica ottimizzata da Machine Learning automatizzato per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa essere ottimizzato. Per altre informazioni sul modo in cui vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valori accettabili: accuratezza, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Impostazione predefinita per l'accuratezza

enable_model_explainability
bool

Indica se abilitare la spiegazione del modello AutoML migliore alla fine di tutte le iterazioni di training di AutoML. Il valore predefinito è none. Per altre informazioni, vedere Interpretabilità: spiegazioni dei modelli in Machine Learning automatizzato.

weight_column_name
str

Nome della colonna peso campione. Machine Learning automatizzato supporta una colonna ponderata come input, causando l'aumento o la riduzione delle righe nei dati. Se i dati di input provengono da un pandas. È possibile usare invece i dataframe che non hanno nomi di colonna, gli indici di colonna possono essere espressi come numeri interi.

Questo parametro è applicabile ai training_data parametri e validation_data

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che la colonna etichetta (facoltativamente una colonna pesi di esempio).

Il valore predefinito è Nessuno

validation_data_size
float

Frazione dei dati da mantenere per la convalida quando i dati di convalida utente non sono specificati. Deve essere compreso tra 0,0 e 1,0 non inclusi.

Specificare validation_data per fornire i dati di convalida, in caso contrario impostare n_cross_validations o validation_data_size estrarre i dati di convalida dai dati di training specificati. Per la riduzione della convalida incrociata personalizzata, usare cv_split_column_names.

Per altre informazioni, vedere Configurare le divisioni dei dati e la convalida incrociata in Machine Learning automatizzato.

Il valore predefinito è Nessuno

n_cross_validations
Union[str, int]

Numero di convalida incrociate da eseguire quando i dati di convalida utente non sono specificati.

Specificare validation_data per fornire dati di convalida, in caso contrario impostati n_cross_validations o validation_data_size per estrarre i dati di convalida dai dati di training specificati. Per la piega incrociata personalizzata, usare cv_split_column_names.

Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.

Impostazione predefinita none

cv_split_column_names
List[str]

Elenco dei nomi delle colonne che contengono la suddivisione tra convalida incrociata personalizzata. Ognuna delle colonne di divisione CV rappresenta una divisione cv in cui ogni riga è contrassegnata 1 per il training o 0 per la convalida.

Impostazione predefinita none

test_data
Input

La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. I dati di test da usare per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.

Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data_size training del modello. I dati di test devono contenere entrambe le funzionalità e la colonna etichetta. Se test_data viene specificato, è necessario specificare il target_column_name parametro.

Impostazione predefinita none

test_data_size
float

La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. Frazione dei dati di training da tenere per i dati di test per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.

Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo. Se test_data_size viene specificato allo stesso tempo di validation_data_size, i dati di test vengono suddivisi da training_data prima della suddivisione dei dati di convalida. Ad esempio, se validation_data_size=0.1test_data_size=0.1 e i dati di training originali hanno 1000 righe, i dati di test avranno 100 righe, i dati di convalida conterranno 90 righe e i dati di training avranno 810 righe.

Per le attività basate sulla regressione, viene usato il campionamento casuale. Per le attività di classificazione, viene usato il campionamento stratificato. La previsione non supporta attualmente la specifica di un set di dati di test usando una suddivisione di training/test.

Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data training del modello.

Impostazione predefinita none

Restituisce

Oggetto processo che può essere inviato a un calcolo di Azure ML per l'esecuzione.

Tipo restituito

forecasting

Funzione per creare un processo di previsione.

Un'attività di previsione viene usata per stimare i valori di destinazione per un periodo di tempo futuro in base ai dati cronologici. Vari modelli vengono sottoposti a training usando i dati di training. Il modello con prestazioni ottimali sui dati di convalida in base alla metrica primaria viene selezionato come modello finale.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e una colonna di etichetta (facoltativamente una colonna di pesi di esempio).

target_column_name
str

Nome della colonna etichetta. Questo parametro è applicabile ai training_datavalidation_data parametri e test_data

primary_metric

La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valori accettabili: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error Defaults to normalized_root_mean_squared_error

enable_model_explainability
bool

Se abilitare la spiegazione del modello AutoML migliore alla fine di tutte le iterazioni di training autoML. Il valore predefinito è none. Per altre informazioni, vedere Interpretazione: spiegazioni dei modelli in Machine Learning automatizzato.

weight_column_name
str

Nome della colonna di peso di esempio. Machine Learning automatizzato supporta una colonna ponderata come input, causando il peso o la riduzione delle righe nei dati. Se i dati di input provengono da un pandas. DataFrame che non dispone di nomi di colonna, gli indici di colonna possono essere usati invece come interi.

Questo parametro è applicabile a training_data e validation_data parametri

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e la colonna etichetta (facoltativamente una colonna di pesi di esempio).

Impostazione predefinita none

validation_data_size
float

Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.

Specificare validation_data per fornire dati di convalida, in caso contrario impostati n_cross_validations o validation_data_size per estrarre i dati di convalida dai dati di training specificati. Per la piega incrociata personalizzata, usare cv_split_column_names.

Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.

Impostazione predefinita none

n_cross_validations
Union[str, int]

Numero di convalida incrociate da eseguire quando i dati di convalida utente non sono specificati.

Specificare validation_data per fornire dati di convalida, in caso contrario impostati n_cross_validations o validation_data_size per estrarre i dati di convalida dai dati di training specificati. Per la piega incrociata personalizzata, usare cv_split_column_names.

Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.

Impostazione predefinita none

cv_split_column_names
List[str]

Elenco dei nomi delle colonne che contengono la suddivisione tra convalida incrociata personalizzata. Ognuna delle colonne di divisione CV rappresenta una divisione cv in cui ogni riga è contrassegnata 1 per il training o 0 per la convalida.

Impostazione predefinita none

test_data
Input

La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. I dati di test da usare per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.

Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data_size training del modello. I dati di test devono contenere entrambe le funzionalità e la colonna etichetta. Se test_data viene specificato, è necessario specificare il target_column_name parametro.

Impostazione predefinita none

test_data_size
float

La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. Frazione dei dati di training da tenere per i dati di test per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.

Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo. Se test_data_size viene specificato allo stesso tempo di validation_data_size, i dati di test vengono suddivisi da training_data prima della suddivisione dei dati di convalida. Ad esempio, se validation_data_size=0.1test_data_size=0.1 e i dati di training originali hanno 1000 righe, i dati di test avranno 100 righe, i dati di convalida conterranno 90 righe e i dati di training avranno 810 righe.

Per le attività basate sulla regressione, viene usato il campionamento casuale. Per le attività di classificazione, viene usato il campionamento stratificato. La previsione non supporta attualmente la specifica di un set di dati di test usando una suddivisione di training/test.

Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data training del modello.

Impostazione predefinita none

forecasting_settings
ForecastingSettings

Impostazioni per l'attività di previsione

Restituisce

Oggetto processo che può essere inviato a un calcolo di Azure ML per l'esecuzione.

Tipo restituito

image_classification

Crea un oggetto per il processo di classificazione multiclasse AutoML Image.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento.

target_column_name
str

Nome della colonna etichetta. Questo parametro è applicabile a training_data e validation_data parametri.

primary_metric

La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valori accettabili: accuratezza, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Impostazione predefinita per l'accuratezza.

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento.

validation_data_size
float

Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.

Specificare validation_data per fornire dati di convalida, in caso contrario impostare validation_data_size per estrarre i dati di convalida dai dati di training specificati.

Impostazione predefinita su .2

kwargs
dict

Dizionario di parametri di configurazione aggiuntivi.

Restituisce

Oggetto processo di classificazione delle immagini che può essere inviato a un calcolo di Azure ML per l'esecuzione.

Tipo restituito

image_classification_multilabel

Crea un oggetto per il processo di classificazione a più etichette autoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento.

target_column_name
str

Nome della colonna etichetta. Questo parametro è applicabile a training_data e validation_data parametri.

primary_metric

La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valori accettabili: accuratezza, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted e Iou Defaults to Iou.

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento.

validation_data_size
float

Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.

Specificare validation_data per fornire dati di convalida, in caso contrario impostare validation_data_size per estrarre i dati di convalida dai dati di training specificati.

Impostazione predefinita su .2

kwargs
dict

Dizionario di parametri di configurazione aggiuntivi.

Restituisce

Oggetto processo di classificazione multi-etichetta dell'immagine che può essere inviato a un calcolo di Azure ML per l'esecuzione.

Tipo restituito

image_instance_segmentation

Crea un oggetto per il processo di segmentazione dell'istanza dell'immagine AutoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento.

target_column_name
str

Nome della colonna etichetta. Questo parametro è applicabile a training_data e validation_data parametri.

primary_metric

La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valori accettabili: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento.

validation_data_size
float

Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.

Specificare validation_data per fornire dati di convalida, in caso contrario impostare validation_data_size per estrarre i dati di convalida dai dati di training specificati.

Impostazione predefinita su .2

kwargs
dict

Dizionario di parametri di configurazione aggiuntivi.

Restituisce

Processo di segmentazione dell'istanza di immagine

Tipo restituito

image_object_detection

Crea un oggetto per il processo di rilevamento oggetti immagine AutoML.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento.

target_column_name
str

Nome della colonna etichetta. Questo parametro è applicabile a training_data e validation_data parametri.

primary_metric

La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valori accettabili: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento.

validation_data_size
float

Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.

Specificare validation_data per fornire dati di convalida, in caso contrario impostare validation_data_size per estrarre i dati di convalida dai dati di training specificati.

Impostazione predefinita su .2

kwargs
dict

Dizionario di parametri di configurazione aggiuntivi.

Restituisce

Oggetto processo di rilevamento oggetti immagine che può essere inviato a un calcolo di Azure ML per l'esecuzione.

Tipo restituito

regression

Funzione per creare un processo di regressione.

Un processo di regressione viene usato per eseguire il training di un modello per stimare i valori continui di una variabile di destinazione da un set di dati. Viene eseguito il training di vari modelli usando i dati di training. Il modello con le migliori prestazioni sui dati di convalida in base alla metrica primaria viene selezionato come modello finale.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e una colonna di etichetta (facoltativamente una colonna di pesi di esempio).

target_column_name
str

Nome della colonna etichetta. Questo parametro è applicabile ai training_datavalidation_data parametri e test_data

primary_metric

La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valori accettabili: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Impostazione predefinita per normalized_root_mean_squared_error

enable_model_explainability
bool

Se abilitare la spiegazione del modello AutoML migliore alla fine di tutte le iterazioni di training autoML. Il valore predefinito è none. Per altre informazioni, vedere Interpretazione: spiegazioni dei modelli in Machine Learning automatizzato.

weight_column_name
str

Nome della colonna di peso di esempio. Machine Learning automatizzato supporta una colonna ponderata come input, causando il peso o la riduzione delle righe nei dati. Se i dati di input provengono da un pandas. DataFrame che non dispone di nomi di colonna, gli indici di colonna possono essere usati invece come interi.

Questo parametro è applicabile a training_data e validation_data parametri

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e la colonna etichetta (facoltativamente una colonna di pesi di esempio).

Impostazione predefinita none

validation_data_size
float

Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.

Specificare validation_data per fornire dati di convalida, in caso contrario impostati n_cross_validations o validation_data_size per estrarre i dati di convalida dai dati di training specificati. Per la piega incrociata personalizzata, usare cv_split_column_names.

Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.

Impostazione predefinita none

n_cross_validations
Union[str, int]

Numero di convalida incrociate da eseguire quando i dati di convalida utente non sono specificati.

Specificare validation_data per fornire dati di convalida, in caso contrario impostati n_cross_validations o validation_data_size per estrarre i dati di convalida dai dati di training specificati. Per la piega incrociata personalizzata, usare cv_split_column_names.

Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.

Impostazione predefinita none

cv_split_column_names
List[str]

Elenco dei nomi delle colonne che contengono la suddivisione tra convalida incrociata personalizzata. Ognuna delle colonne di divisione CV rappresenta una divisione cv in cui ogni riga è contrassegnata 1 per il training o 0 per la convalida.

Impostazione predefinita none

test_data
Input

La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. I dati di test da usare per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.

Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data_size training del modello. I dati di test devono contenere entrambe le funzionalità e la colonna etichetta. Se test_data viene specificato, è necessario specificare il target_column_name parametro.

Impostazione predefinita none

test_data_size
float

La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. Frazione dei dati di training da tenere per i dati di test per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.

Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo. Se test_data_size viene specificato allo stesso tempo di validation_data_size, i dati di test vengono suddivisi da training_data prima della suddivisione dei dati di convalida. Ad esempio, se validation_data_size=0.1test_data_size=0.1 e i dati di training originali hanno 1000 righe, i dati di test avranno 100 righe, i dati di convalida conterranno 90 righe e i dati di training avranno 810 righe.

Per le attività basate sulla regressione, viene usato il campionamento casuale. Per le attività di classificazione, viene usato il campionamento stratificato. La previsione non supporta attualmente la specifica di un set di dati di test usando una suddivisione di training/test.

Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data training del modello.

Impostazione predefinita none

Restituisce

Oggetto processo che può essere inviato a un calcolo di Azure ML per l'esecuzione.

Tipo restituito

text_classification

Funzione per creare un oggetto TextClassificationJob.

Un processo di classificazione del testo viene usato per eseguire il training di un modello in grado di stimare la classe/categoria di dati di testo. I dati di training di input devono includere una colonna di destinazione che classifica il testo in una sola classe.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.

target_column_name
str

Nome della colonna di destinazione.

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Metrica primaria per l'attività. Valori accettabili: accuratezza, AUC_weighted, precision_score_weighted

log_verbosity
str

Livello di dettaglio del log.

kwargs
dict

Dizionario di parametri di configurazione aggiuntivi.

Restituisce

Oggetto TextClassificationJob.

Tipo restituito

text_classification_multilabel

Funzione per creare un oggetto TextClassificationMultilabelJob.

Per eseguire il training di un modello in grado di stimare le classi o le categorie di un dati di testo, viene usato un processo con classificazione di testo. I dati di training di input devono includere una colonna di destinazione che classifica il testo in classe(es). Per altre informazioni sul formato dei dati con etichetta multipla, vedere: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.

target_column_name
str

Nome della colonna di destinazione.

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.

primary_metric
str

Metrica primaria per l'attività. Valori accettabili: accuratezza

log_verbosity
str

Livello di dettaglio del log.

kwargs
dict

Dizionario di parametri di configurazione aggiuntivi.

Restituisce

Oggetto TextClassificationMultilabelJob.

Tipo restituito

text_ner

Funzione per creare un textNerJob.

Un processo di riconoscimento delle entità denominato testo viene usato per eseguire il training di un modello in grado di stimare le entità denominate nel testo. I dati di training di input devono essere un file di testo in formato CoNLL. Per altre informazioni sul formato dei dati di text NER, vedere: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parametri

training_data
Input

Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.

validation_data
Input

Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.

primary_metric
str

Metrica primaria per l'attività. Valori accettabili: accuratezza

log_verbosity
str

Livello di dettaglio del log.

kwargs
dict

Dizionario di parametri di configurazione aggiuntivi.

Restituisce

Oggetto TextNerJob.

Tipo restituito