automl Pacchetto
Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2.
Le aree principali includono la gestione delle attività AutoML.
Classi
ClassificationJob |
Configurazione per il processo di classificazione AutoML. Inizializzare una nuova attività di classificazione AutoML. |
ColumnTransformer |
Impostazioni del trasformatore di colonna. |
ForecastingJob |
Configurazione per l'attività di previsione AutoML. Inizializzare una nuova attività Di previsione AutoML. |
ForecastingSettings |
Impostazioni di previsione per un processo AutoML. |
ImageClassificationJob |
Configurazione per il processo di classificazione delle immagini multiclasse AutoML. Inizializzare un nuovo processo di classificazione immagini multiclasse AutoML. |
ImageClassificationMultilabelJob |
Configurazione per il processo di classificazione delle immagini con più etichette AutoML. Inizializzare un nuovo processo di classificazione delle immagini con più etichette AutoML. |
ImageClassificationSearchSpace |
Cerca spazio per le attività Classificazione immagini AutoML e Classificazione immagini multi-etichetta. |
ImageInstanceSegmentationJob |
Configurazione per il processo di segmentazione dell'istanza dell'immagine AutoML. Inizializzare un nuovo processo di segmentazione dell'istanza dell'immagine AutoML. |
ImageLimitSettings |
Limitare le impostazioni per i verticali delle immagini AutoML. ImageLimitSettings è una classe che contiene i parametri seguenti: max_concurrent_trials, max_trials e timeout_minutes. Si tratta di un metodo di configurazione facoltativo per configurare i parametri dei limiti, ad esempio i timeout e così via. Nota Il numero di esecuzioni simultanee è limitato dalle risorse disponibili nella destinazione di calcolo specificata. Assicurarsi che la destinazione di calcolo disponga delle risorse disponibili per la concorrenza desiderata. Suggerimento È consigliabile associare max_concurrent_trials conteggio con il numero di nodi nel cluster. Ad esempio, se si dispone di un cluster con 4 nodi, impostare max_concurrent_trials su 4. Esempio di utilizzo Configurazione di ImageLimitSettings
Inizializzare un oggetto ImageLimitSettings. Costruttore per ImageLimitSettings per i verticali dell'immagine AutoML. |
ImageModelSettingsClassification |
Impostazioni del modello per le attività di classificazione delle immagini AutoML. |
ImageModelSettingsObjectDetection |
Impostazioni del modello per l'attività Rilevamento oggetti immagine AutoML. |
ImageObjectDetectionJob |
Configurazione per il processo rilevamento oggetti immagine AutoML. Inizializzare un nuovo processo di rilevamento oggetti immagine AutoML. |
ImageObjectDetectionSearchSpace |
Cerca spazio per le attività di rilevamento oggetti immagine autoML e segmentazione dell'istanza dell'immagine. |
ImageSweepSettings |
Impostazioni di sweep per tutti i verticali dell'immagine AutoML. |
NlpFeaturizationSettings |
Impostazioni di definizione delle caratteristiche per tutti i verticali NLP di AutoML. |
NlpFixedParameters |
Oggetto per ospitare parametri fissi per i processi NLP. |
NlpLimitSettings |
Limitare le impostazioni per tutti i verticali NLP di AutoML. |
NlpSearchSpace |
Cerca spazio per le attività NLP autoML. |
NlpSweepSettings |
Impostazioni di sweep per tutte le attività NLP di AutoML. |
RegressionJob |
Configurazione per il processo di regressione AutoML. Inizializzare una nuova attività di regressione AutoML. |
SearchSpace |
Classe SearchSpace per i verticali AutoML. |
StackEnsembleSettings |
Impostazione avanzata per personalizzare l'esecuzione di StackEnsemble. |
TabularFeaturizationSettings |
Impostazioni di definizione delle caratteristiche per un processo AutoML. |
TabularLimitSettings |
Limitare le impostazioni per le verticali di una tabella AutoML. |
TextClassificationJob |
Configurazione per il processo di classificazione del testo AutoML. Inizializza una nuova attività Classificazione testo AutoML. |
TextClassificationMultilabelJob |
Configurazione per processo multietichetà di classificazione testo AutoML. Inizializza una nuova attività Classificazione testo AutoML Multilabel. |
TextNerJob |
Configurazione per il processo NER di testo AutoML. Inizializza una nuova attività Text NER autoML. |
TrainingSettings |
Classe TrainingSettings per Azure Machine Learning. Classe TrainingSettings per Azure Machine Learning. |
Enumerazioni
BlockedTransformers |
Enumerazione per tutti i modelli di classificazione supportati da AutoML. |
ClassificationModels |
Enumerazione per tutti i modelli di classificazione supportati da AutoML. |
ClassificationMultilabelPrimaryMetrics |
Metriche primarie per le attività multi-etichetta di classificazione. |
ClassificationPrimaryMetrics |
Metriche principali per le attività di classificazione. |
FeaturizationMode |
Modalità di definizione delle caratteristiche: determina la modalità di definizione delle caratteristiche dei dati. |
ForecastHorizonMode |
Enumerazione per determinare la modalità di selezione dell'orizzonte di previsione. |
ForecastingModels |
Enumerazione per tutti i modelli di previsione supportati da AutoML. |
ForecastingPrimaryMetrics |
Metriche principali per l'attività Previsione. |
InstanceSegmentationPrimaryMetrics |
Metriche primarie per le attività InstanceSegmentation. |
LearningRateScheduler |
Enumerazione dell'utilità di pianificazione della frequenza di apprendimento. |
LogTrainingMetrics |
Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2. Le aree principali includono la gestione delle attività AutoML. |
LogValidationLoss |
Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2. Le aree principali includono la gestione delle attività AutoML. |
NCrossValidationsMode |
Determina il modo in cui viene determinato il valore delle convalide incrociate. |
ObjectDetectionPrimaryMetrics |
Metriche primarie per l'attività Image ObjectDetection. |
RegressionModels |
Enumerazione per tutti i modelli di regressione supportati da AutoML. |
RegressionPrimaryMetrics |
Metriche primarie per l'attività regressione. |
SamplingAlgorithmType |
Contiene classi di Machine Learning automatizzate per Azure Machine Learning SDKv2. Le aree principali includono la gestione delle attività AutoML. |
ShortSeriesHandlingConfiguration |
Parametro che definisce la modalità di gestione di serie temporali brevi da parte di AutoML. |
StochasticOptimizer |
Ottimizzatore stocastico per i modelli di immagine. |
TargetAggregationFunction |
Funzione di aggregazione di destinazione. |
TargetLagsMode |
Modalità di selezione dei lag di destinazione. |
TargetRollingWindowSizeMode |
Modalità di ridimensionamento delle finestre in sequenza di destinazione. |
UseStl |
Configurare la scomposizione STL della colonna di destinazione della serie temporale. |
ValidationMetricType |
Metodo di calcolo delle metriche da usare per le metriche di convalida nelle attività di immagine. |
Funzioni
classification
Funzione per creare un processo di classificazione.
Un processo di classificazione viene usato per eseguire il training di un modello che stima meglio la classe di un esempio di dati. Vari modelli vengono sottoposti a training usando i dati di training. Il modello con prestazioni ottimali sui dati di convalida in base alla metrica primaria viene selezionato come modello finale.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna etichetta (facoltativamente una colonna pesi di esempio).
- target_column_name
- str
Nome della colonna dell'etichetta.
Questo parametro è applicabile ai training_data
parametri e test_data
validation_data
- primary_metric
Metrica ottimizzata da Machine Learning automatizzato per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa essere ottimizzato. Per altre informazioni sul modo in cui vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valori accettabili: accuratezza, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Impostazione predefinita per l'accuratezza
- enable_model_explainability
- bool
Indica se abilitare la spiegazione del modello AutoML migliore alla fine di tutte le iterazioni di training di AutoML. Il valore predefinito è none. Per altre informazioni, vedere Interpretabilità: spiegazioni dei modelli in Machine Learning automatizzato.
- weight_column_name
- str
Nome della colonna peso campione. Machine Learning automatizzato supporta una colonna ponderata come input, causando l'aumento o la riduzione delle righe nei dati. Se i dati di input provengono da un pandas. È possibile usare invece i dataframe che non hanno nomi di colonna, gli indici di colonna possono essere espressi come numeri interi.
Questo parametro è applicabile ai training_data
parametri e validation_data
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che la colonna etichetta (facoltativamente una colonna pesi di esempio).
Il valore predefinito è Nessuno
- validation_data_size
- float
Frazione dei dati da mantenere per la convalida quando i dati di convalida utente non sono specificati. Deve essere compreso tra 0,0 e 1,0 non inclusi.
Specificare validation_data
per fornire i dati di convalida, in caso contrario impostare n_cross_validations
o validation_data_size
estrarre i dati di convalida dai dati di training specificati.
Per la riduzione della convalida incrociata personalizzata, usare cv_split_column_names
.
Per altre informazioni, vedere Configurare le divisioni dei dati e la convalida incrociata in Machine Learning automatizzato.
Il valore predefinito è Nessuno
Numero di convalida incrociate da eseguire quando i dati di convalida utente non sono specificati.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostati n_cross_validations
o validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Per la piega incrociata personalizzata, usare cv_split_column_names
.
Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.
Impostazione predefinita none
Elenco dei nomi delle colonne che contengono la suddivisione tra convalida incrociata personalizzata. Ognuna delle colonne di divisione CV rappresenta una divisione cv in cui ogni riga è contrassegnata 1 per il training o 0 per la convalida.
Impostazione predefinita none
- test_data
- Input
La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. I dati di test da usare per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.
Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data_size
training del modello.
I dati di test devono contenere entrambe le funzionalità e la colonna etichetta.
Se test_data
viene specificato, è necessario specificare il target_column_name
parametro.
Impostazione predefinita none
- test_data_size
- float
La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. Frazione dei dati di training da tenere per i dati di test per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.
Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Se test_data_size
viene specificato allo stesso tempo di validation_data_size
, i dati di test vengono suddivisi da training_data
prima della suddivisione dei dati di convalida.
Ad esempio, se validation_data_size=0.1
test_data_size=0.1
e i dati di training originali hanno 1000 righe, i dati di test avranno 100 righe, i dati di convalida conterranno 90 righe e i dati di training avranno 810 righe.
Per le attività basate sulla regressione, viene usato il campionamento casuale. Per le attività di classificazione, viene usato il campionamento stratificato. La previsione non supporta attualmente la specifica di un set di dati di test usando una suddivisione di training/test.
Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data
training del modello.
Impostazione predefinita none
Restituisce
Oggetto processo che può essere inviato a un calcolo di Azure ML per l'esecuzione.
Tipo restituito
forecasting
Funzione per creare un processo di previsione.
Un'attività di previsione viene usata per stimare i valori di destinazione per un periodo di tempo futuro in base ai dati cronologici. Vari modelli vengono sottoposti a training usando i dati di training. Il modello con prestazioni ottimali sui dati di convalida in base alla metrica primaria viene selezionato come modello finale.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e una colonna di etichetta (facoltativamente una colonna di pesi di esempio).
- target_column_name
- str
Nome della colonna etichetta.
Questo parametro è applicabile ai training_data
validation_data
parametri e test_data
- primary_metric
La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valori accettabili: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error Defaults to normalized_root_mean_squared_error
- enable_model_explainability
- bool
Se abilitare la spiegazione del modello AutoML migliore alla fine di tutte le iterazioni di training autoML. Il valore predefinito è none. Per altre informazioni, vedere Interpretazione: spiegazioni dei modelli in Machine Learning automatizzato.
- weight_column_name
- str
Nome della colonna di peso di esempio. Machine Learning automatizzato supporta una colonna ponderata come input, causando il peso o la riduzione delle righe nei dati. Se i dati di input provengono da un pandas. DataFrame che non dispone di nomi di colonna, gli indici di colonna possono essere usati invece come interi.
Questo parametro è applicabile a training_data
e validation_data
parametri
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e la colonna etichetta (facoltativamente una colonna di pesi di esempio).
Impostazione predefinita none
- validation_data_size
- float
Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostati n_cross_validations
o validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Per la piega incrociata personalizzata, usare cv_split_column_names
.
Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.
Impostazione predefinita none
Numero di convalida incrociate da eseguire quando i dati di convalida utente non sono specificati.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostati n_cross_validations
o validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Per la piega incrociata personalizzata, usare cv_split_column_names
.
Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.
Impostazione predefinita none
Elenco dei nomi delle colonne che contengono la suddivisione tra convalida incrociata personalizzata. Ognuna delle colonne di divisione CV rappresenta una divisione cv in cui ogni riga è contrassegnata 1 per il training o 0 per la convalida.
Impostazione predefinita none
- test_data
- Input
La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. I dati di test da usare per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.
Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data_size
training del modello.
I dati di test devono contenere entrambe le funzionalità e la colonna etichetta.
Se test_data
viene specificato, è necessario specificare il target_column_name
parametro.
Impostazione predefinita none
- test_data_size
- float
La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. Frazione dei dati di training da tenere per i dati di test per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.
Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Se test_data_size
viene specificato allo stesso tempo di validation_data_size
, i dati di test vengono suddivisi da training_data
prima della suddivisione dei dati di convalida.
Ad esempio, se validation_data_size=0.1
test_data_size=0.1
e i dati di training originali hanno 1000 righe, i dati di test avranno 100 righe, i dati di convalida conterranno 90 righe e i dati di training avranno 810 righe.
Per le attività basate sulla regressione, viene usato il campionamento casuale. Per le attività di classificazione, viene usato il campionamento stratificato. La previsione non supporta attualmente la specifica di un set di dati di test usando una suddivisione di training/test.
Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data
training del modello.
Impostazione predefinita none
- forecasting_settings
- ForecastingSettings
Impostazioni per l'attività di previsione
Restituisce
Oggetto processo che può essere inviato a un calcolo di Azure ML per l'esecuzione.
Tipo restituito
image_classification
Crea un oggetto per il processo di classificazione multiclasse AutoML Image.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento.
- target_column_name
- str
Nome della colonna etichetta.
Questo parametro è applicabile a training_data
e validation_data
parametri.
- primary_metric
La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valori accettabili: accuratezza, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Impostazione predefinita per l'accuratezza.
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento.
- validation_data_size
- float
Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostare validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Impostazione predefinita su .2
- kwargs
- dict
Dizionario di parametri di configurazione aggiuntivi.
Restituisce
Oggetto processo di classificazione delle immagini che può essere inviato a un calcolo di Azure ML per l'esecuzione.
Tipo restituito
image_classification_multilabel
Crea un oggetto per il processo di classificazione a più etichette autoML.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento.
- target_column_name
- str
Nome della colonna etichetta.
Questo parametro è applicabile a training_data
e validation_data
parametri.
- primary_metric
La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valori accettabili: accuratezza, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted e Iou Defaults to Iou.
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento.
- validation_data_size
- float
Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostare validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Impostazione predefinita su .2
- kwargs
- dict
Dizionario di parametri di configurazione aggiuntivi.
Restituisce
Oggetto processo di classificazione multi-etichetta dell'immagine che può essere inviato a un calcolo di Azure ML per l'esecuzione.
Tipo restituito
image_instance_segmentation
Crea un oggetto per il processo di segmentazione dell'istanza dell'immagine AutoML.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento.
- target_column_name
- str
Nome della colonna etichetta.
Questo parametro è applicabile a training_data
e validation_data
parametri.
- primary_metric
La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valori accettabili: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento.
- validation_data_size
- float
Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostare validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Impostazione predefinita su .2
- kwargs
- dict
Dizionario di parametri di configurazione aggiuntivi.
Restituisce
Processo di segmentazione dell'istanza di immagine
Tipo restituito
image_object_detection
Crea un oggetto per il processo di rilevamento oggetti immagine AutoML.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento.
- target_column_name
- str
Nome della colonna etichetta.
Questo parametro è applicabile a training_data
e validation_data
parametri.
- primary_metric
La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valori accettabili: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento.
- validation_data_size
- float
Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostare validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Impostazione predefinita su .2
- kwargs
- dict
Dizionario di parametri di configurazione aggiuntivi.
Restituisce
Oggetto processo di rilevamento oggetti immagine che può essere inviato a un calcolo di Azure ML per l'esecuzione.
Tipo restituito
regression
Funzione per creare un processo di regressione.
Un processo di regressione viene usato per eseguire il training di un modello per stimare i valori continui di una variabile di destinazione da un set di dati. Viene eseguito il training di vari modelli usando i dati di training. Il modello con le migliori prestazioni sui dati di convalida in base alla metrica primaria viene selezionato come modello finale.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e una colonna di etichetta (facoltativamente una colonna di pesi di esempio).
- target_column_name
- str
Nome della colonna etichetta.
Questo parametro è applicabile ai training_data
validation_data
parametri e test_data
- primary_metric
La metrica di Machine Learning automatizzata ottimizza per la selezione del modello. Machine Learning automatizzato raccoglie più metriche di quanto possa ottimizzare. Per altre informazioni su come vengono calcolate le metriche, vedere https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valori accettabili: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Impostazione predefinita per normalized_root_mean_squared_error
- enable_model_explainability
- bool
Se abilitare la spiegazione del modello AutoML migliore alla fine di tutte le iterazioni di training autoML. Il valore predefinito è none. Per altre informazioni, vedere Interpretazione: spiegazioni dei modelli in Machine Learning automatizzato.
- weight_column_name
- str
Nome della colonna di peso di esempio. Machine Learning automatizzato supporta una colonna ponderata come input, causando il peso o la riduzione delle righe nei dati. Se i dati di input provengono da un pandas. DataFrame che non dispone di nomi di colonna, gli indici di colonna possono essere usati invece come interi.
Questo parametro è applicabile a training_data
e validation_data
parametri
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento. Deve contenere entrambe le funzionalità di training e la colonna etichetta (facoltativamente una colonna di pesi di esempio).
Impostazione predefinita none
- validation_data_size
- float
Frazione dei dati da tenere per la convalida quando i dati di convalida utente non sono specificati. Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostati n_cross_validations
o validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Per la piega incrociata personalizzata, usare cv_split_column_names
.
Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.
Impostazione predefinita none
Numero di convalida incrociate da eseguire quando i dati di convalida utente non sono specificati.
Specificare validation_data
per fornire dati di convalida, in caso contrario impostati n_cross_validations
o validation_data_size
per estrarre i dati di convalida dai dati di training specificati.
Per la piega incrociata personalizzata, usare cv_split_column_names
.
Per altre informazioni, vedere Configurare le suddivisioni dei dati e la convalida incrociata in Machine Learning automatizzato.
Impostazione predefinita none
Elenco dei nomi delle colonne che contengono la suddivisione tra convalida incrociata personalizzata. Ognuna delle colonne di divisione CV rappresenta una divisione cv in cui ogni riga è contrassegnata 1 per il training o 0 per la convalida.
Impostazione predefinita none
- test_data
- Input
La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. I dati di test da usare per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.
Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data_size
training del modello.
I dati di test devono contenere entrambe le funzionalità e la colonna etichetta.
Se test_data
viene specificato, è necessario specificare il target_column_name
parametro.
Impostazione predefinita none
- test_data_size
- float
La funzionalità Test modello usando set di dati di test o suddivisioni dei dati di test è una funzionalità nello stato di anteprima e può cambiare in qualsiasi momento. Frazione dei dati di training da tenere per i dati di test per un'esecuzione di test che verrà avviata automaticamente dopo il completamento del training del modello. L'esecuzione del test otterrà stime usando il modello migliore e calcola le metriche fornite da queste stime.
Ciò deve essere compreso tra 0,0 e 1,0 non inclusivo.
Se test_data_size
viene specificato allo stesso tempo di validation_data_size
, i dati di test vengono suddivisi da training_data
prima della suddivisione dei dati di convalida.
Ad esempio, se validation_data_size=0.1
test_data_size=0.1
e i dati di training originali hanno 1000 righe, i dati di test avranno 100 righe, i dati di convalida conterranno 90 righe e i dati di training avranno 810 righe.
Per le attività basate sulla regressione, viene usato il campionamento casuale. Per le attività di classificazione, viene usato il campionamento stratificato. La previsione non supporta attualmente la specifica di un set di dati di test usando una suddivisione di training/test.
Se questo parametro o il parametro non vengono specificati, non verrà eseguita automaticamente alcuna esecuzione di test dopo il completamento del test_data
training del modello.
Impostazione predefinita none
Restituisce
Oggetto processo che può essere inviato a un calcolo di Azure ML per l'esecuzione.
Tipo restituito
text_classification
Funzione per creare un oggetto TextClassificationJob.
Un processo di classificazione del testo viene usato per eseguire il training di un modello in grado di stimare la classe/categoria di dati di testo. I dati di training di input devono includere una colonna di destinazione che classifica il testo in una sola classe.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.
- target_column_name
- str
Nome della colonna di destinazione.
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Metrica primaria per l'attività. Valori accettabili: accuratezza, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Livello di dettaglio del log.
- kwargs
- dict
Dizionario di parametri di configurazione aggiuntivi.
Restituisce
Oggetto TextClassificationJob.
Tipo restituito
text_classification_multilabel
Funzione per creare un oggetto TextClassificationMultilabelJob.
Per eseguire il training di un modello in grado di stimare le classi o le categorie di un dati di testo, viene usato un processo con classificazione di testo. I dati di training di input devono includere una colonna di destinazione che classifica il testo in classe(es). Per altre informazioni sul formato dei dati con etichetta multipla, vedere: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.
- target_column_name
- str
Nome della colonna di destinazione.
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.
- primary_metric
- str
Metrica primaria per l'attività. Valori accettabili: accuratezza
- log_verbosity
- str
Livello di dettaglio del log.
- kwargs
- dict
Dizionario di parametri di configurazione aggiuntivi.
Restituisce
Oggetto TextClassificationMultilabelJob.
Tipo restituito
text_ner
Funzione per creare un textNerJob.
Un processo di riconoscimento delle entità denominato testo viene usato per eseguire il training di un modello in grado di stimare le entità denominate nel testo. I dati di training di input devono essere un file di testo in formato CoNLL. Per altre informazioni sul formato dei dati di text NER, vedere: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parametri
- training_data
- Input
Dati di training da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.
- validation_data
- Input
Dati di convalida da usare all'interno dell'esperimento. Deve contenere sia le funzionalità di training che una colonna di destinazione.
- primary_metric
- str
Metrica primaria per l'attività. Valori accettabili: accuratezza
- log_verbosity
- str
Livello di dettaglio del log.
- kwargs
- dict
Dizionario di parametri di configurazione aggiuntivi.
Restituisce
Oggetto TextNerJob.
Tipo restituito
Azure SDK for Python