Condividi tramite


Eseguire il training di modelli di regressione con l'API Python AutoML

Questo articolo illustra come eseguire il training di un modello con AutoML usando l'API Python AutoML. Per altre informazioni, vedere Informazioni di riferimento sull'API Python di AutoML.

L'API fornisce funzioni per avviare la classificazione, regressione e previsione di esecuzioni di AutoML. Ogni chiamata di funzione istruisce un set di modelli e genera un notebook di prova per ogni modello.

Consulta i Requisiti per gli esperimenti AutoML.

Configurare un esperimento usando l'API AutoML

I passaggi seguenti descrivono in genere come set un esperimento AutoML usando l'API:

  1. Creare un notebook e collegarlo a un cluster che esegue Databricks Runtime ML.

  2. Identifica quali table vuoi usare dall'origine dati esistente o carica un file di dati in DBFS e crea un table.

  3. Per avviare un'esecuzione di AutoML, usare la funzione automl.regress(), automl.classify()o automl.forecast() e passare il table, insieme a qualsiasi altro parametersdi addestramento. Per visualizzare tutte le funzioni e parameters, vedere riferimento dell'API Python di AutoML.

    Nota

    La automl.forecast() funzione è disponibile solo per la previsione nel calcolo classico.

    Ad esempio:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. All'avvio dell'esecuzione AutoML, nella console viene visualizzato un URL dell'esperimento MLflow. Usare questo URL per monitorare lo stato dell'esecuzione. Refresh l'esperimento MLflow per visualizzare le prove non appena vengono completate.

  5. Al termine dell'esecuzione di AutoML:

  • Usare i collegamenti nel riepilogo dell'output per passare all'esperimento MLflow o al notebook che ha generato i risultati migliori.
  • Usare il collegamento al notebook di esplorazione dei dati per ottenere informazioni dettagliate sui dati passati a AutoML. È anche possibile collegare questo notebook allo stesso cluster ed eseguirlo di nuovo per riprodurre i risultati o eseguire ulteriori analisi dei dati.
  • Usare l'oggetto di riepilogo restituito dalla chiamata AutoML per esplorare altri dettagli sulle versioni di valutazione o caricare un modello sottoposto a training da una determinata versione di prova. Altre informazioni sull'oggetto AutoMLSummary.
  • Clonare qualsiasi notebook generato dalle versioni di valutazione ed eseguirlo di nuovo collegandolo allo stesso cluster per riprodurre i risultati. È anche possibile apportare modifiche necessarie, eseguirle nuovamente per eseguire il training di modelli aggiuntivi e registrarle nello stesso esperimento.

Importare un notebook

Per importare un notebook salvato come artefatto MLflow, usare databricks.automl.import_notebook l’API Python. Per altre informazioni, consultare il notebook sull’importazione

Registrare e implementare un modello

È possibile registrare e distribuire un modello addestrato con AutoML esattamente come qualsiasi modello registrato nel registro dei modelli di MLflow; vedere Log, load e register MLflow models.

Nessun modulo rinominato pandas.core.indexes.numeric

Quando si gestisce un modello compilato usando AutoML con Model Serving, è possibile get l'errore: No module named pandas.core.indexes.numeric.

Ciò è dovuto a una versione incompatibile pandas tra AutoML e l'ambiente endpoint di gestione del modello. Per risolvere l'errore:

  1. Scaricare lo script add-pandas-dependency.py. Lo script modifica il requirements.txt e conda.yaml per il modello registrato in modo da includere l’appropriata pandasversione di dipendenza: pandas==1.5.3.
  2. Modificare lo script per includere il run_id dell'esecuzione di MLflow where è stato registrato il modello.
  3. Registrare nuovamente il modello nel Registro di sistema del modello MLflow.
  4. Provare a gestire la nuova versione del modello MLflow.

Esempio di notebook

Il seguente notebook illustra come eseguire la regressione con AutoML.

Notebook di esempio di regressione AutoML

Get portatile

Passaggi successivi

Informazioni di riferimento sulle API Python autoML.