Eseguire il training di modelli di regressione con l'API Python AutoML
Questo articolo illustra come eseguire il training di un modello con AutoML usando l'API Python AutoML. Per altre informazioni, vedere Informazioni di riferimento sull'API Python di AutoML.
L'API fornisce funzioni per avviare la classificazione, regressione e previsione di esecuzioni di AutoML. Ogni chiamata di funzione istruisce un set di modelli e genera un notebook di prova per ogni modello.
Consulta i Requisiti per gli esperimenti AutoML.
Configurare un esperimento usando l'API AutoML
I passaggi seguenti descrivono in genere come set un esperimento AutoML usando l'API:
Creare un notebook e collegarlo a un cluster che esegue Databricks Runtime ML.
Identifica quali table vuoi usare dall'origine dati esistente o carica un file di dati in DBFS e crea un table.
Per avviare un'esecuzione di AutoML, usare la funzione
automl.regress()
,automl.classify()
oautoml.forecast()
e passare il table, insieme a qualsiasi altro parametersdi addestramento. Per visualizzare tutte le funzioni e parameters, vedere riferimento dell'API Python di AutoML.Nota
La
automl.forecast()
funzione è disponibile solo per la previsione nel calcolo classico.Ad esempio:
# Regression example summary = automl.regress(dataset=train_pdf, target_col="col_to_predict") # Classification example summary = automl.classification(dataset=train_pdf, target_col="col_to_predict") # Forecasting example summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
All'avvio dell'esecuzione AutoML, nella console viene visualizzato un URL dell'esperimento MLflow. Usare questo URL per monitorare lo stato dell'esecuzione. Refresh l'esperimento MLflow per visualizzare le prove non appena vengono completate.
Al termine dell'esecuzione di AutoML:
- Usare i collegamenti nel riepilogo dell'output per passare all'esperimento MLflow o al notebook che ha generato i risultati migliori.
- Usare il collegamento al notebook di esplorazione dei dati per ottenere informazioni dettagliate sui dati passati a AutoML. È anche possibile collegare questo notebook allo stesso cluster ed eseguirlo di nuovo per riprodurre i risultati o eseguire ulteriori analisi dei dati.
- Usare l'oggetto di riepilogo restituito dalla chiamata AutoML per esplorare altri dettagli sulle versioni di valutazione o caricare un modello sottoposto a training da una determinata versione di prova. Altre informazioni sull'oggetto AutoMLSummary.
- Clonare qualsiasi notebook generato dalle versioni di valutazione ed eseguirlo di nuovo collegandolo allo stesso cluster per riprodurre i risultati. È anche possibile apportare modifiche necessarie, eseguirle nuovamente per eseguire il training di modelli aggiuntivi e registrarle nello stesso esperimento.
Importare un notebook
Per importare un notebook salvato come artefatto MLflow, usare databricks.automl.import_notebook
l’API Python. Per altre informazioni, consultare il notebook sull’importazione
Registrare e implementare un modello
È possibile registrare e distribuire un modello addestrato con AutoML esattamente come qualsiasi modello registrato nel registro dei modelli di MLflow; vedere Log, load e register MLflow models.
Nessun modulo rinominato pandas.core.indexes.numeric
Quando si gestisce un modello compilato usando AutoML con Model Serving, è possibile get l'errore: No module named pandas.core.indexes.numeric
.
Ciò è dovuto a una versione incompatibile pandas
tra AutoML e l'ambiente endpoint di gestione del modello. Per risolvere l'errore:
- Scaricare lo script add-pandas-dependency.py.
Lo script modifica il
requirements.txt
econda.yaml
per il modello registrato in modo da includere l’appropriatapandas
versione di dipendenza:pandas==1.5.3
. - Modificare lo script per includere il
run_id
dell'esecuzione di MLflow where è stato registrato il modello. - Registrare nuovamente il modello nel Registro di sistema del modello MLflow.
- Provare a gestire la nuova versione del modello MLflow.
Esempio di notebook
Il seguente notebook illustra come eseguire la regressione con AutoML.
Notebook di esempio di regressione AutoML
Passaggi successivi
Informazioni di riferimento sulle API Python autoML.